BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Rozmus Dorota (The Karol Adamiecki University of Economics in Katowice, Poland)
Tytuł
Comparison of Stability of Classical Taxonomy Bagging Metod with Bagging Based on Co-Occurence Data
Porównanie stabilności klasycznej taksonomicznej metody bagging z metodą bagging opartą na macierzy współwystąpień
Źródło
Acta Universitatis Lodziensis. Folia Oeconomica, 2012, t. 269, s. 145-152, rys., bibliogr. 8 poz.
Tytuł własny numeru
Multivariate Statistical Analysis : Methodological Aspects and Applications
Słowa kluczowe
Metody taksonomiczne, Algorytmy, Analiza danych
Taxonomic methods, Algorithms, Data analysis
Uwagi
summ., streszcz.
Abstrakt
Podejście wielomodelowe dotychczas z dużym powodzeniem stosowane było w dyskryminacji w celu podniesienia dokładności klasyfikacji. Analogiczne propozycje pojawiły się także w taksonomii, aby zwiększyć poprawność i stabilność wyników grupowania. Stabilność algorytmu taksonomicznego w odniesieniu do niewielkich zmian w zbiorze danych (np. wybór podzbioru zmiennych), czy też parametrów algorytmu (np. losowa inicjalizacja algorytmu) jest pożądaną cechą algorytmu. Głównym punktem zainteresowania tego referatu jest stabilność w podejściu zagregowanym taksonomii. Zasadniczym celem jest przeprowadzenie badań empirycznych, które mają za zadanie porównać stabilność metody bagging stosowanej do klasycznego zbioru danych oraz do tzw. macierzy współwystąpień. (abstrakt oryginalny)

Ensemble approach has been successfully applied in the context of supervised learning to increase the accuracy and stability of classification. Recently, analogous techniques for cluster analysis have been suggested in order to increase classification accuracy, robustness and stability of the clustering solutions. Research has proved that, by combining a collection of different clusterings, an improved solution can be obtained. The stability of a clustering algorithm with respect to small perturbations of data (e.g., data subsampling or small variations in the feature values) or the parameters of the algorithm (e.g., random initialization) is a desirable quality of the algorithm. On the other hand, ensembles benefit from diverse clusterers. Although built upon unstable components, the ensemble is expected to be more accurate and robust than the individual clustering method. Here, we look at the stability of the ensemble methods based on bagging idea and co-occurrence matrix. This paper carries out an experimental study to compare stability of bagging method used to the classical data set with bagging based on co-occurrence matrix. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Szkoły Głównej Handlowej
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Fern X. Z., Brodley C. E. (2003), Random Projection for High Dimensional Data Clustering: A Cluster Ensemble Approach, Proceedings of the 20th International Conference of Machine Learning, pages: 186-193.
  2. Fred A. (2002), Finding Consistent Clusters in Data Partitions, in Roli F., Kittler J., editors, Proceedings of the International Workshop on Multiple Classifier Systems, pages: 309-318.
  3. Fred A., Jain A. K. (2002), Data Clustering Using Evidence Accumulation, Proceedings of the 16th International Conference on Pattern Recognition, pages: 276-280, ICPR Canada.
  4. Greene D., Tsymbal A., Bolshakova N. and Cunningham P. (2004), Ensemble Clustering in Medical Diagnostics, Technical Report TCD-CS-2004-12, Trinity College, Dublin, Ireland.
  5. Hornik K. (2006), A CLUE for CLUster Ensembles, Journal of Statistical Software, 14: 65-72.
  6. Kuncheva L. I., Hadjitodorov S. T., Todorova L. P. (2006), Experimental Comparison of Cluster Ensemble Methods, 19th International Conference on Information Fusion, pages: 1 - 7, Florence.
  7. Kuncheva L., Vetrov D. (2006), Evaluation of Stability of i-Means Cluster Ensembles with Respect to Random Initialization, IEEE Transactions On Pattern Analysis And Machine Intelligence, Vol. 28, No. 11, pages: 1798-1808.
  8. Strehl A., Ghosh J. (2002), Cluster Ensembles - A Knowledge Reuse Framework for Combining Multiple Partitions, Journal of Machine Learning Research, 3: 583-618.
Cytowane przez
Pokaż
ISSN
0208-6018
Język
eng
URI / DOI
http://hdl.handle.net/11089/1891
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu