BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Gatnar Eugeniusz (Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach)
Tytuł
Problem wymiaru przestrzeni cech w klasyfikacji
The Problem of Dimensionality in Classification
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (11), 2004, nr 1022, s. 477-484, rys., tab., bibliogr. 10 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Dobór zmiennych, Klasyfikacja, Błąd klasyfikacji
Variables selection, Classification, Classification error
Uwagi
summ.
Abstrakt
Prowadzone rozważania nad losowym doborem zmiennych do modeli dyskryminacyjnych pokazują wpływ liczby tych zmiennych (wymiaru przestrzeni zmiennych) na dokładność klasyfikacji modelu zagregowanego. Okazuje się, że po początkowym spadku wielkość tego błędu zaczyna rosnąć wraz ze wzrostem liczby zmiennych. Wpływ na to ma przede wszystkim obciążenie. W związku z tym i wprowadzenie do modelu większej liczby zmiennych powoduje zwiększenie błędu klasyfikacji. W takim przypadku zamiast losowego dobierania zmiennych do modelu warto wykorzystać metody agregacji, które znacznie redukują wielkość obciążenia, np. metodę boosting. (fragment tekstu)

Serious reduction of the classification error is possible by aggregation of multiple classification trees. An aggregation of models built on training samples with randomly chosen subsets of variables is considered. Unfortunately, adding new variables to the component models leads to increase of the classification error. Its growth is mostly determined by the bias of the model. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Bellman R.E., Adaptive Control Processes, Princeton University Press, Princeton 1961.
  2. Blake C., Keogh E., Merz C.J., UCI Repository of Machine Learning Databases, Department of Information and Computer Science, University of California, Irvine 1998.
  3. Breiman L., Arcing Classifiers "Annals of Statistics" 1998, nr 26, s. 801-849.
  4. Breiman L., Bagging Predictors, "Machine Learning" 1996, nr 24, s. 123-140.
  5. Breiman L., Random Forests, "Machine Learning" 2001, nr 45, s. 5-32.
  6. Freund Y., Schapire R.E., A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting, "Journal of Computer and System Sciences" 1997, nr 55, s. 119-139.
  7. Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa 2001.
  8. Gatnar E., Agregacja modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu", nr 942, AE, Wrocław 2002, s. 217-226.
  9. Gatnar E., O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław 2003, s. 245-253.
  10. Но Т.K., The Random Subspace Method for Constructing Decision Forests, "IEEE Trans, on Pattem Analysis and Machine Learning" 1998, nr 20, s. 832-844.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu