BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Rozmus Dorota (The Karol Adamiecki University of Economics in Katowice, Poland)
Tytuł
Comparison of Stability of Algorithms in Classical and Ensemble Approach in Taxonomy
Porównanie stabilności algorytmów w podejściu klasycznym i zagregowanym w taksonomii
Źródło
Acta Universitatis Lodziensis. Folia Oeconomica, 2011, t. 255, s. 175-182, rys., bibliogr. 9 poz.
Tytuł własny numeru
Methodological Aspects of Multivariate Statistical Analysis : Statistical Models and Applications
Słowa kluczowe
Analiza skupień, Taksonomia, Algorytmy
Cluster analysis, Taxonomy, Algorithms
Uwagi
summ., streszcz.
Abstrakt
Podejście wielomodelowe dotychczas z dużym powodzeniem stosowane było w dyskryminacji w celu podniesienia dokładności klasyfikacji. W ostatnich latach analogiczne propozycje pojawiły się w taksonomii, aby zapewnić większą poprawność i stabilność wyników grupowania. Liczne badania wykazały, że agregacja różniących się między sobą wyników wielokrotnego grupowania, pozwala na poprawę dokładności klasyfikacji. Stabilność algorytmu taksonomicznego w odniesieniu do niewielkich zmian w zbiorze danych, czy też parametrów algorytmu jest pożądaną cechą algorytmu. Z drugiej jednak strony, podejście wielomodelowe czerpie korzyści ze zróżnicowanych klasyfikacji składowych, których połączenie przynosi bardziej dokładne i stabilne rozwiązanie niż pojedynczy algorytm. Głównym punktem zainteresowania tego badania była stabilność w podejściu zagregowanym w taksonomii. Przeprowadzone badania empiryczne pokazały, że podejście zagregowane daje bardziej stabilne rezultaty niż pojedyncze algorytmy taksonomiczne oraz, że często wyższa stabilność idzie w parze z wyższą dokładnością klasyfikacji w podejściu zagregowanym. (abstrakt oryginalny)

Ensemble approach has been successfully applied in the context of supervised learning to increase the accuracy and stability of classification. Recently, analogous techniques for cluster analysis have been suggested in order to increase classification accuracy, robustness and stability of the clustering solutions. Research has proved that, by combining a collection of different clusterings, an improved solution can be obtained. The stability of a clustering algorithm with respect to small perturbations of data (e.g., data subsampling or resampling, small variations in the feature values) or the parameters of the algorithm (e.g., random initialization) is a desirable quality of the algorithm. On the other hand, ensembles benefit from diverse clusterers (Fern. Brodley 2003, Green et al. 2004). Although built upon unstable components, the ensemble is expected to be more accurate and robust than the individual clustering method. Here, the stability of the ensemble is looked at. This paper carries out an experimental study to examine whether cluster ensembles give more stable results than single clustering methods. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Szkoły Głównej Handlowej w Warszawie
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Fern X. Z., Brodley C. E. (2003). Random Projection for High Dimensional Data Clustering: A Cluster Ensemble Approach. Proceedings of the 20th International Conference of Machine Learning, pages: 186-193.
  2. Fred A. (2002). Finding Consistent Clusters in Data Partitions, in Roli F., Kittler J., editors. Proceedings of the International Workshop on Multiple Classifier Systems, pages: 309-318.
  3. Fred A., Jain A. K. (2002). Data Clustering Using Evidence Accumulation. Proceedings of the 16th International Conference on Pattern Recognition, pages: 276-280.1CPR. Canada.
  4. Greene D., Tsymbal A., Bolshakova N. and Cunningham P. (2004). Ensemble Clustering in Medical Diagnostics. Technical Report TCD-C.S-2004-12. Trinity College, Dublin, Ireland.
  5. Hornik K. (2005), A CLUE for CLUster Ensembles, Journal of Statistical Software. 14:65-72
  6. Jain A., Murty M. N and Flynn P. (1999), Data Clustering: A Review. ACM Computing Surveys, 31 (3): 264-323.
  7. Kuncheva L., Vetrov D. (2006). Evaluation of Stability of k-Means Cluster Ensembles with
  8. Respect to Random Initialization. IEEE Transactions On Pattern Analysis And Machine Intelligence. Vol. 28. No. 11, pages: 1798-1808.
  9. Strehl A., Ghosh J. (2002). Cluster Ensembles - A Knowledge Reuse Framework for Combining Multiple Partitions. Journal of Machine Learning Research. 3: 583-618.
Cytowane przez
Pokaż
ISSN
0208-6018
Język
eng
URI / DOI
http://hdl.handle.net/11089/697
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu