BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Najman Krzysztof (Uniwersytet Gdański)
Tytuł
Metody ustalania liczby skupień w zbiorach danych binarnych
Determining the Number of Clusters in Binary Data Sets
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 321-329, rys., tab., bibliogr. 13 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Teoria zbiorów, Analiza skupień
Set theory, Cluster analysis
Uwagi
summ.
Abstrakt
Celami przedstawionych badań są prezentacja i krytyczna ocena wskaźników jakości grupowania (liczby skupień) obiektów opisanych cechami binarnymi. Ocena będzie oparta na analizie teoretycznych własności metod grupowania i opisanych wskaźników, a także na badaniach symulacyjnych. Ponieważ w szybkim tempie rośnie liczba badań, w których wymaga się grupowania danych binarnych, rozwój metod ich analizy i ustalenie liczby grup wydaje się zadaniem ważnym i aktualnym. (fragment tekstu)

In this paper the performance of fourteen indexes for determining the number of clusters in a binary data set is analyzed. To ensure that the right number of clusters is known, only artificial sets, designed to simulate data, are used. The resultant optimal clusters have been found to be stable for the different validity indices used, e.g.: Global Silhouette Index, Hubert-Lewin Index, Calinski-Harabasz Index, Ball-Hall Index, Hartigan Index and others. For the evaluation of the performance of the indexes, к-means and hierarchical algorithms are applied. The selection of the number of clusters based on the indexes values for the different number of clusters is done in an automatic way. It was shown that these indexes mightn't support the prediction of the optimal cluster partitioning for those binary data sets. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Ball G., Hall D.J. (1965), ISODATA, A Novel Method of Data Analysis and Pattern Classification, Stanford Research Institute, Menlo Park.
  2. Calinski R.B., Harabasz J. (1974), A Dendrite Method for Cluster Analysis, "Communications in Statistics" 3, s. 1-27.
  3. Davies D.L., Bouldin D.W. (1979), A Cluster Separation Measure, "IEEE Transactions on Pattern Analysis and Machine Intelligence" 1, s. 224-227.
  4. Dolnicar S., Leisch F., Weingessel A., Buchta C., Dimitradou E. (1998), A Comparison of Several Cluster Algorithms on Artificial Binary Data Scenarios from Tourism Marketing, Working Paper 7, SFB, Adaptive Information Systems and Modeling in Economics and Management Science.
  5. Edwards A.W.F., Cavalli-Sforza L. (1965), A Method for Clustering Analysis, "Biometrics" 21, s. 362-375.
  6. Friedman H.P., Rubin J. (1967), On Some Invariant Criteria for Grouping Data, "Journal of the American Statistical Association" 62, s. 1159-1178.
  7. Hartigan J.A. (1975), Clustering Algorithms, Wiley, New York.
  8. Hubert L.J., Levin J.R. (1976), A General Statistical Framework for Assessing Categorical Clustering in Free Recall, "Psychological Bulletin" 83, s. 1072-1080.
  9. Marriot F.H.C. (1971), Practical Problems in a Method of Cluster Analysis, "Biometrics" 27, s. 501-514.
  10. Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in a Data Set, "Psychometrika" vol. 50, nr 2, s. 159-179.
  11. Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, [w:] Klasyfikacja i analiza danych - teoria i zastosowania, "Prace Naukowe AE we Wrocławiu", Taksonomia 12, AE, Wrocław.
  12. Najman K., Najman K. (2006), Analityczne metody ustalania liczby skupień w rozmytych zbiorach danych, [w:] Klasyfikacja i analiza danych - teoria i zastosowania, "Prace Naukowe AE we Wrocławiu", Taksonomia 13, AE, Wrocław.
  13. Scott A.J., Symons M.J. (1971), Clustering Methods Based on Likelihood Ratio Criteria, "Biometrics" 27, 387-397.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu