- Autor
- Migdał-Najman Kamila (Uniwersytet Gdański), Najman Krzysztof (Uniwersytet Gdański)
- Tytuł
- Analityczne metody ustalania liczby skupień
Analytical Procedures for Determining the Number of Clusters - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 265-273, rys., tab., bibliogr. 10 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Metody grupowania, Eksperyment badawczy
Grouping methods, Scientific experiment - Uwagi
- summ.
- Abstrakt
- W literaturze proponuje się kilkadziesiąt wskaźników jakości grupowani wskazujących w sposób ilościowy na optymalny podział obiektów z pewnego punk tu widzenia. W prezentowanym badaniu opisano dwa wskaźniki: indeks Dunna i indeks Davisa-Bouldina, możliwe do zastosowania przy grupowaniu obiektów zastosowaniem klasycznych metod typu k-średnich i FCM (ang. fuzzy c-means). Podsumowując przeprowadzone badanie, można stwierdzić, że indeks Davisa-Bouldina jest silnym narzędziem wspomagającym podejmowanie decyzji o liczbie grup, na którą należy pogrupować zbiór danych. Przy zastosowaniu właściwej metody pogrupowania obiektów wskazania uzyskane dzięki temu indeksowi są prawie zawsze prawidłowe. Indeks Dunna, ze względu na znaczną liczbę kombinacji odległości wewnętrznych i zewnętrznych między obiektami oraz ze względu na jego wrażliwość na dobór metod pomiaru tych odległości, musi być jeszcze szczegółowo przebadany. (fragment tekstu)
Several clustering techniques have been proposed for the analysis of data sets. Cluster validity indices represent useful tools to support such a task. They are particularly relevant in applications in which there is not a priori indication of the actual number of clusters. In this paper two validation indices were applied to fifteen data sets, using different intracluster and intercluster distances. The resultant optimal clusters have been found to be stable for the different validity indices used, viz. Davies-Bouldin Index and Dunn's Index. It was shown that these methods might support the prediction of the optimal cluster partitioning for those data sets but the determination of the optimal number of clusters is an open problem. (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Aldenderfer M.S., Blashfield R.K., Cluster Analysis, SAGE, 1996.
- Bolshakova N., Azuaje F., Cluster Validation Techniques for Genome Expression Data, "Signal Processing" 2003, 83, s. 827-828.
- Günter S., Bunke H., Validation Indices for Graph Clustering, "Pattem Recognition Letters" 2003, 24, s. 1109-1110.
- Mali K., Mitra S., Clustering and its Validation in a Symbolic Framework, "Pattern Recognition Letters" 2003, 24, s. 2371.
- Milligan G.W., Cooper M.C., An Examination of Procedures for Determining the Number of Clusters in Data Set, "Psychometrika" 1985, 50(2), s. 159-179.
- Najman K., Najman K., Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniejszych spółek na WGPW, "Zeszyty Naukowe AE we Wrocławiu", AE, Wrocław 2002a, s. 493-499.
- Najman K., Najman K., Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniej szych spółek na WGPW na bazie wskaźników analizy technicznej, [w:] Rynek kapitałowy - skuteczne inwestowanie, tom II, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego, Międzyzdroje 2002b, s. 403-417.
- Najman K., Najman K., Próba zastosowania sieci neuronowej typu SOM w badaniu przestrzennego zróżnicowania powiatów w Polsce, "Wiadomości Statystyczne" 2003, nr 4, s. 72-84.
- Sarle W.S., Cubic Clustering Criterion, "Technical Report" A-108, SAS Institute, Cary, N.C. 1983.
- Wolfe J.H., Pattern Clustering by Multivariate Mixture Analysis, "Multivariate Behavioral Research" 1970, 5, s. 329-350.
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol