BazEkon - The Main Library of the Cracow University of Economics

BazEkon home page

Main menu

Author
Gatnar Eugeniusz (Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach)
Title
Problem wymiaru przestrzeni cech w klasyfikacji
The Problem of Dimensionality in Classification
Source
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (11), 2004, nr 1022, s. 477-484, rys., tab., bibliogr. 10 poz.
Issue title
Klasyfikacja i analiza danych - teoria i zastosowania
Keyword
Dobór zmiennych, Klasyfikacja, Błąd klasyfikacji
Variables selection, Classification, Classification error
Note
summ.
Abstract
Prowadzone rozważania nad losowym doborem zmiennych do modeli dyskryminacyjnych pokazują wpływ liczby tych zmiennych (wymiaru przestrzeni zmiennych) na dokładność klasyfikacji modelu zagregowanego. Okazuje się, że po początkowym spadku wielkość tego błędu zaczyna rosnąć wraz ze wzrostem liczby zmiennych. Wpływ na to ma przede wszystkim obciążenie. W związku z tym i wprowadzenie do modelu większej liczby zmiennych powoduje zwiększenie błędu klasyfikacji. W takim przypadku zamiast losowego dobierania zmiennych do modelu warto wykorzystać metody agregacji, które znacznie redukują wielkość obciążenia, np. metodę boosting. (fragment tekstu)

Serious reduction of the classification error is possible by aggregation of multiple classification trees. An aggregation of models built on training samples with randomly chosen subsets of variables is considered. Unfortunately, adding new variables to the component models leads to increase of the classification error. Its growth is mostly determined by the bias of the model. (original abstract)
Accessibility
The Main Library of the Cracow University of Economics
The Library of Warsaw School of Economics
The Main Library of Poznań University of Economics and Business
Bibliography
Show
  1. Bellman R.E., Adaptive Control Processes, Princeton University Press, Princeton 1961.
  2. Blake C., Keogh E., Merz C.J., UCI Repository of Machine Learning Databases, Department of Information and Computer Science, University of California, Irvine 1998.
  3. Breiman L., Arcing Classifiers "Annals of Statistics" 1998, nr 26, s. 801-849.
  4. Breiman L., Bagging Predictors, "Machine Learning" 1996, nr 24, s. 123-140.
  5. Breiman L., Random Forests, "Machine Learning" 2001, nr 45, s. 5-32.
  6. Freund Y., Schapire R.E., A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting, "Journal of Computer and System Sciences" 1997, nr 55, s. 119-139.
  7. Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa 2001.
  8. Gatnar E., Agregacja modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu", nr 942, AE, Wrocław 2002, s. 217-226.
  9. Gatnar E., O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław 2003, s. 245-253.
  10. Но Т.K., The Random Subspace Method for Constructing Decision Forests, "IEEE Trans, on Pattem Analysis and Machine Learning" 1998, nr 20, s. 832-844.
Cited by
Show
ISSN
0324-8445
1505-9332
Language
pol
Share on Facebook Share on Twitter Share on Google+ Share on Pinterest Share on LinkedIn Wyślij znajomemu