BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Dudek Andrzej (Akademia Ekonomiczna we Wrocławiu), Kurzydłowski Adam (Akademia Ekonomiczna we Wrocławiu)
Tytuł
Porównanie metod doboru zmiennych do zagregowanych modeli dyskryminacyjnych
The Comparison Selection Methods of Variables into Aggregated Discriminant Models
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 202-209, tab., bibliogr. 12 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Dobór zmiennych, Modele dyskryminacyjne
Variables selection, Discriminatory models
Uwagi
summ.
Abstrakt
W artykule przedstawione zostaną wyniki symulacji porównawczej metod doboru zmiennych do modeli składowych na podstawie repozytorium danych z Uniwersytetu Kalifornijskiego w Irvine, przy czym porównanie błędów klasyfikacji zostanie przeprowadzone dla różnych miar zależności zmiennych. W badaniu wykorzystano metody: correlation-based feature selection, correlation-based feature selection based on Hellwig heuristics oraz modyfikację metody CFSH wykorzystującą do optymalizacji algorytmy genetyczne. (fragment tekstu)

In discriminant analysis studies, models using single classification trees are often replaced by models aggregating partial models into one multiple model. Between selection methods of objects into aggregated models boosting, bagging, adaptive bagging, arcing, windowing are most commonly used. The most effective method of selection of variables into aggregated models is Correlation-based Feature Selection (CFS) developed by Hall. Gatnar proposed Correlation-based Feature Selection based on Hellwig Heuristic (CFSH) method and empirically showed that CFSH gives smaller classification errors that CFS. In this paper comparison between CFS, CFSH and modification of CFSH method based on optimization through genetic algorithms is presented. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Breiman L. (1996), Bagging Predictors, "Machine Learning" 24, s. 123-140.
  2. Breiman L. (2001), Random Forests,,Machine Learning" 45, s. 5-32.
  3. Dudek A., Kurzydłowski A. (2006), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych z wykorzystaniem algorytmów genetycznych, materiały z XXXII Konferencji Ekonometryków, Statystyków i Matematyków (w recenzji).
  4. Gatnar E. (2001), Nieparametryczna metoda dyskryminacji i regresji. Wydawnictwo Naukowe PWN, Warszawa.
  5. Gatnar E. (2003), O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław, s. 245-253.
  6. Gatnar E. (2005), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu" nr 1076, AE, Wrocław, s. 79-85.
  7. Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław.
  8. Goldberg J. (2003), Algorytmy genetyczne i ich zastosowania, WNT, Warszawa.
  9. Hall M. (2000), Correlation-based Feature Selection for Discrete and Numeric Machine Learning, [w:] Proceedings of the 17th International Conference on Machine Learning, Morgan Kaufmann, San Francisco.
  10. Hellwig Z. (1969), O problemie optymalnego wyboru predykant, "Przegląd Statystyczny" 3-4.
  11. Но Т.K. (1998), The Random Subspace Method for Constructing Decision Forests, "IEEE Transactions on Pattern Analysis and Machine Learning" 20, s. 832-844.
  12. Theil H. (1972), Statistical Decomposition Analysis, North-Holland Publishing, Amsterdam.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu