- Autor
- Gatnar Eugeniusz (Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach)
- Tytuł
- Problem wymiaru przestrzeni cech w klasyfikacji
The Problem of Dimensionality in Classification - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (11), 2004, nr 1022, s. 477-484, rys., tab., bibliogr. 10 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Dobór zmiennych, Klasyfikacja, Błąd klasyfikacji
Variables selection, Classification, Classification error - Uwagi
- summ.
- Abstrakt
- Prowadzone rozważania nad losowym doborem zmiennych do modeli dyskryminacyjnych pokazują wpływ liczby tych zmiennych (wymiaru przestrzeni zmiennych) na dokładność klasyfikacji modelu zagregowanego. Okazuje się, że po początkowym spadku wielkość tego błędu zaczyna rosnąć wraz ze wzrostem liczby zmiennych. Wpływ na to ma przede wszystkim obciążenie. W związku z tym i wprowadzenie do modelu większej liczby zmiennych powoduje zwiększenie błędu klasyfikacji. W takim przypadku zamiast losowego dobierania zmiennych do modelu warto wykorzystać metody agregacji, które znacznie redukują wielkość obciążenia, np. metodę boosting. (fragment tekstu)
Serious reduction of the classification error is possible by aggregation of multiple classification trees. An aggregation of models built on training samples with randomly chosen subsets of variables is considered. Unfortunately, adding new variables to the component models leads to increase of the classification error. Its growth is mostly determined by the bias of the model. (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Bellman R.E., Adaptive Control Processes, Princeton University Press, Princeton 1961.
- Blake C., Keogh E., Merz C.J., UCI Repository of Machine Learning Databases, Department of Information and Computer Science, University of California, Irvine 1998.
- Breiman L., Arcing Classifiers "Annals of Statistics" 1998, nr 26, s. 801-849.
- Breiman L., Bagging Predictors, "Machine Learning" 1996, nr 24, s. 123-140.
- Breiman L., Random Forests, "Machine Learning" 2001, nr 45, s. 5-32.
- Freund Y., Schapire R.E., A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting, "Journal of Computer and System Sciences" 1997, nr 55, s. 119-139.
- Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa 2001.
- Gatnar E., Agregacja modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu", nr 942, AE, Wrocław 2002, s. 217-226.
- Gatnar E., O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław 2003, s. 245-253.
- Но Т.K., The Random Subspace Method for Constructing Decision Forests, "IEEE Trans, on Pattem Analysis and Machine Learning" 1998, nr 20, s. 832-844.
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol