- Autor
- Lasek Mirosława (Uniwersytet Warszawski)
- Tytuł
- Problemy doboru zmiennych w zagadnieniach grupowania obiektów metoda FeatureSelector heurystycznego doboru cech
Feature Selection in Clustering - Application of the Feature Selector Heuristic Method - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 87-95, rys., bibliogr. 9 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Dobór zmiennych, Metody grupowania, Klasyfikacja obiektów
Variables selection, Grouping methods, Classification of objects - Uwagi
- summ.
- Abstrakt
- Celem artykułu jest przedstawienie podstawowych przyczyn, skłaniających nas do ograniczania liczby zmiennych w przypadku grupowania obiektów oraz zaproponowanie stosowania heurystycznej metody wyboru zmiennych spośród większego ich zbioru, dających jak najlepsze pogrupowanie obiektów. Twórcami metody, algorytmu komputerowego i programu realizującego metodę jest zespół pracowników firmy МIТ - Management Intelligenter Technologien GmbH z Aachen. W metodzie tej rozpoczyna się od niewielkiej liczby cech (np. dwóch lub nawet jednej), do których dokładane są cechy do momentu uzyskania takiej jakości grupowania, że dołożenie jakiejkolwiek nowej cechy z założonego zbioru nie daje poprawy tej jakości. W artykule zostanie przedstawiony algorytm metody, a także jej zalety i wady w porównaniu z innymi metodami doboru zmiennych w zagadnieniach grupowania obiektów. Rozważania będą zilustrowane przykładem doboru cech, które były stosowane na potrzeby tworzenia grup (skupień) przedsiębiorstw podobnych pod względem kondycji ekonomicznej. (fragment tekstu)
The aim of this paper is to discuss problems concerning feature selection for grouping objects and to propose heuristic method for determining such features which can discriminate objects as best as possible. In the proposed method we start with single feature to which next features are added until obtaining such good possibilities of clustering with assumed criteria of quality, so that no further improvement of quality of clustering is possible. In the paper, algorithm of the method has been described, the strengths and weaknesses of the algorithm are examined and discussed. The method is illustrated with an example of feature selection for clustering of industrial enterprises in order to analyse and compare their financial standing. (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, Wydawnictwo Naukowe PWN, Warszawa 2001.
- Kim Y.S., Street W.N., Menczer F., Feature Selection in Data Mining, [w:] Data Mining. Opportunities and Challenges, red. J. Wang, IRM Press - Idea Group Inc. 2003.
- Lasek M., Data Mining. Zastosowania w analizach i ocenach klientów bankowych, Oficyna Wydawnicza "Zarządzanie i finanse", Biblioteka Menedżera i Bankowca, Warszawa 2002.
- Lasek M., Nowak E., Pęczkowski M., Analiza atrakcyjności turystycznej powiatów województwa świętokrzyskiego za pomocą metody Promethee, "Turyzm" 2003, nr 13/1, (artykuł w dwóch wersjach językowych: polskiej i angielskiej).
- Metody analiz porównawczych kondycji ekonomicznej przedsiębiorstw, red. M. Lasek, Wyd. Nowy Dziennik, Warszawa 2002.
- Piramuthu S., Evaluating Feature Selection Methods for Learning in Data Mining Applications, European Journal of Operational Research, w druku.
- Rozmus D., Wójciak M., Wpływ metody doboru zmiennych na wyniki klasyfikacji sektora produkcyjnego, "Prace Naukowe AE we Wrocławiu", nr 942, AE, Wrocław 2002, s. 341-352.
- Strackeljan J., Behr D., Automatic Feature Selection, MIT - Management Intelligenter Technologien GmbH, Aachen 2002.
- Strackeljan J., Behr D., Dedro F., FeatureSelector: A Plug-In for Feature Selection with DataEngine, International Data Analysis Symposium, Aachen 2003.
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol