BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Dudek Andrzej (Akademia Ekonomiczna we Wrocławiu)
Tytuł
Metoda taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych
Dendrite Clustering in Classification of Symbolic Objects
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 169-177, rys., tab., bibliogr. 16 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Klasyfikacja obiektów, Taksonomia wrocławska
Classification of objects, Wroclaw taxonomy
Uwagi
summ.
Abstrakt
Metoda taksonomii wrocławskiej, dobrze znana w wielowymiarowej analizie statystycznej, jest obecnie trochę zapomniana, ponieważ jest podobna do metody najbliższego sąsiada klasyfikacji hierarchicznej. Okazuje się jednak, iż metoda ta może zostać z powodzeniem zastosowana w odniesieniu do danych symbolicznych (dla tych danych ze względu na specyfikę miar odległości nie pojawia się problem tożsamości algorytmu z metodą najbliższego sąsiada). Artykuł przedstawia zastosowanie metody taksonomii wrocławskiej do klasyfikacji obiektów symbolicznych. W kolejnych częściach artykułu opisane są: pojęcie obiektu i zmiennej symbolicznej, miary podobieństwa obiektów symbolicznych, kroki metody taksonomii wrocławskiej, algorytmu klasyfikacji i mierniki jakości klasyfikacji dla danych symbolicznych, a także dwa eksperymenty pozwalające na ocenienie przydatności metody taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych. (fragment tekstu)

Dendrite clustering is used in multivariate statistical analysis for over fifty year. Despite it has been designed for "traditional" data, after minor modifications it can be adapted to symbolic data e.g. data representing: single quantitative values, categorical values, intervals, multi-valued variables, multi-valued variables with weights. In this paper usage of dendrite method for symbolic data is described, Nine clustering algorithms: Ward, single link, complete link, average link, Mcquitty, median and centroid hierarchical clustering methods, partitioning around medoids, dynamic clustering for symbolic objects are compared with dendrite method and situations where this method gives better results are pointed. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Baker F.B., Hubert L.J. (1975), Measuring the Power of Hierarchical Cluster Analysis, ,Journal of the American Statistical Association" vol. 70, nr 349, s. 31-38.
  2. Bock H.H., Diday E. (red.) (2000), Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Heidelberg-Springer-Verlag.
  3. Chavent M., De Carvalho F.A.T, Verde R., Lechevallier Y. (2003), Trois nouvelle methodes de classification automatique de donnees symboliques de type intervals, "Revue de Statistique Appliquee" LI 4, s. 5-29.
  4. de Carvalho F.A.T., Souza R. (1998), Statistical Proximity Functions of Boolean Symbolic Objects Based on Histograms, Advances in Data Science and Classification, Heidelberg-Springer-Verlag, 391-396.
  5. Diday E. (2002), An Introduction to Symbolic Data Analysis and the SODAS Software, J.S.D.A., International E-Journal.
  6. Dudek A. (2005), Internal Cluster Quality Indexes for Classification of Symbolic Data, "Prace Naukowe Uniwersytetu Łódzkiego", Folia Oeconomica (w druku).
  7. Florek K., Łukasiewicz J., Perkal J., Steinhaus H., Zubrzycki S. (1951), Taksonomia wrocławska, "Przegląd Antropologiczny" 17, s. 193-210.
  8. Gordon A.D. (1999), Classification, Chapman and Hall/CRC, London.
  9. Hardy A., Lallemand P. (2004), Clustering Symbolic Objects Described by Multi-Valued and Modal Variables, [w:] D. Banks i in. (red.), Classification, Clustering and Data Mining Applications, Springer, Berlin, s. 325-332.
  10. Hubert L.J. (1974), Approximate Evaluation Technique for the Single-Link and Complete-Link Hierarchical Clustering Procedures, "Journal of the American Statistical Association" vol. 69, nr 347, s. 698-704.
  11. Hubert L.J., Levine J.R. (1976), Evaluating Object Set Partitions: Free Sort Analysis and Some Generalizations, "Journal of Verbal Learning and Verbal Behaviour" vol. 15, s. 549-570.
  12. Ichino M., Yaguchi H. (1994), Generalized Minkowski Metrics for Mixed Feature-Type Data Analysis, IEEE Transactions on Systems, Man, and Cybernetics, vol. 24, nr 4, s. 698-707.
  13. Malerba D., Espozito F., Giovalle V., Tamma V. (2001), Comparing Dissimilarity Measures for Symbolic Data Analysis, materiały konferencyjne: 'New Techniques and Technologies for Statistcs' and 'Exchange of Technology and Know-How' (ETK-NTTS'01), s. 473-481.
  14. Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in a Data Set, "Psychometrika" nr 2, s. 159-179.
  15. Milligan G.W. (1996), Clustering Validation: Results and Implications for Applied Analyses, [w:] P. Arabie, L.J. Hubert, G. de Soete (red.), Clustering and Classification, World Scientific, Singapore, s. 341-375.
  16. Verde R., Lechevalier Y., Chavent M. (2003), Symbolic Clustering Interpretation and Visualization, "The Electronic Journal of Symbolic Data Analysis" vol. 1, nr 1.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu