BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Dudek Andrzej (Akademia Ekonomiczna we Wrocławiu), Kurzydłowski Adam (Akademia Ekonomiczna we Wrocławiu)
Tytuł
Dobór zmiennych do zagregowanych modeli dyskryminacyjnych z wykorzystaniem algorytmów genetycznych
Selection of Variables into Aggregated Discriminant Models with Usage of Genetic Algorithms
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu, 2007, nr 1189, s. 147-155, rys., tab., bibliogr. 15 poz.
Tytuł własny numeru
Zastosowania metod ilościowych
Słowa kluczowe
Uczenie maszynowe, Drzewa klasyfikacyjne, Algorytmy genetyczne, Dobór zmiennych
Machine learning, Classification trees, Genetic algorithms, Variables selection
Uwagi
summ.
Abstrakt
W artykule zaproponowana zostanie odmiana metody CFSH (Correlation-based Feature Selection based on Hellwig Heuristic) wykorzystująca do znalezienia najlepszego podzbioru zmiennych w modelu składowych optymalizację z wykorzystaniem algorytmów genetycznych. Ponadto porównane zostaną błędy klasyfikacji metod CFS, CFSH i nowej metody na zbiorach danych pochodzących z repozytorium Uniwersytetu Kalifornijskiego w Irvine. (fragment tekstu)

In discriminant analysis studies models using single classification trees are often replaced by models aggregating partial models into one multiple model. Breiman [1996] showed that significant reduction of classification error can be achieved when independency of partial models is fulfilled. So key role in such approach plays appropriate selection of objects or variables of subsets of training set. Among methods of selection of objects into aggregated models the most often used are: boosting, bagging, adaptive bagging, arcing, windowing. Among methods of selection of variables into aggregated models Correlation-based Feature Selection (CFS) developed by Hall [2000] was most effective. Gatnar [2003] proposed Correlation-based Feature Selection based on Hellwig Heuristic (CFSH) method and empirically showed that CFSH gave smaller classification errors that CFS. In this paper some modification of CFSH is proposed and genetic algorithms are used to find best subsets of variables in partial models. Classification errors for CFFS, CFSH and modified method are compared on datasets from University of California Repository of Machine Learning. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Bibliografia
Pokaż
  1. Arabas J., Wykłady z algorytmów ewolucyjnych, WNT, Warszawa 2004.
  2. Breiman L., Bagging Predictors, "Machine Learning" 1996, 24, s. 123-140.
  3. Breiman L., Arcing Classifiers, "Annals of Statistics" 1998, 26, s. 801-849.
  4. Freund Y., Schapire R.E., A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting, "Journal of Computer and System Sciences" 1997, 55, s. 119-139.
  5. Gatnar E., Symboliczne metody klasyfikacji danych, PWN, Warszawa 1998.
  6. Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, Wydawnictwo Naukowe PWN, Warszawa 2001.
  7. Gatnar E., O pewnej metodzie redukcji błędu klasyfikacji, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 988, AE, Wrocław 2003, s. 245-253.
  8. Gatnar E., Dobór zmiennych do zagregowanych modeli dyskryminacyjnych, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1076, AE, Wrocław 2005, s. 79-85.
  9. Goldberg J., Algorytmy genetyczne i ich zastosowania, WNT, Warszawa 2003.
  10. Hall M., Correlation-based Feature Selection for Discrete and Numeric Machine Learning, [w:] Proceedings of the 17th International Conference on Machine Learning, Morgan Kaufmann, San Francisco 2000.
  11. Hall M., Smith L., Feature Selection for Machine Learning Comparing a Correlation-based Filter Approach to the Wrapper, http://home.eng.iastate.edu/~julied/classes/ee547/Handouts/Flairs.pdf, 2000.
  12. Hastie T., Tibshirani R., Friedman J., The Elements of Statistical Learning: Data Mining, Inference and Prediction, Sprmger-Verlag, New York, Berlin, Heidelberg 2001.
  13. Hellwig Z., O problemie optymalnego wyboru predykant. "Przegląd Statystyczny" 1969, 3-4.
  14. Theil H., Statistical Decomposition Analysis, North-Holland Publishing, Amsterdam 1972.
  15. Weiss S.M., Indurkhya N., Rule-based Machine Learning Methods for Functional Prediction, "Journal of Artificial Intelligence Research" 1995, no. 3, s. 383-403.
Cytowane przez
Pokaż
ISSN
0324-8445
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu