BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Dudek Andrzej (Akademia Ekonomiczna we Wrocławiu)
Tytuł
Metody klasyfikacji dla danych symbolicznych - symulacja porównawcza
Classification Methods for Symbolic Data - Comparative Simulation
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Ekonometria (18), 2007, nr 1151, s. 19-26, tab., bibliogr. 20 poz.
Tytuł własny numeru
Zastosowania metod ilościowych
Słowa kluczowe
Metody klasyfikacyjne, Klasyfikacja, Analiza porównawcza
Classification methods, Classification, Comparative analysis
Uwagi
summ.
Abstrakt
Jednym z najważniejszych zagadnień w procedurze klasyfikacyjnej jest wybór metody klasyfikacji. O ile zagadnienie to dla danych w postaci macierzy liczbowej jest dość dobrze opisane w literaturze, o tyle w wypadku danych symbolicznych brak jest jeszcze publikacji je poruszających. W artykule podjęta została próba porównania najważniejszych metod klasyfikacyjnych używanych dla danych symbolicznych. Przedstawiono typowe etapy procedury klasyfikacyjnej, opisano pojęcia obiektu i zmiennej symbolicznej, scharakteryzowano miary odległości dla nich używanych, przedstawiono najważniejsze metody klasyfikacji używane dla danych symbolicznych, poruszono zagadnienie ustalenia liczby klas w procedurze klasyfikacyjnej oraz zaprezentowano wyniki symulacji porównawczej dla metod klasyfikacji dla danych symbolicznych. (fragment tekstu)

The article presents typical cluster analysis study for symbolic data, main dissimilarity measures for symbolic data, selection of clustering methods for symbolic data and determination of the number of classes described. Nine clustering methods: Ward, single link, complete link, average, Mcquitty, median, centroid, partitioning around medoids and dynamic clustering for symbolic objects (SCLUST) are compared on 105 sets of symbolic data and some recommendations regarding cluster analysis of symbolic data are proposed. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, red. H.H. Bock, E. Diday, Heidelberg-Springer-Verlag, 2000.
  2. Baker F.B., Hubert L.J.. Measuring the Power of Hierarchical Cluster Analysis, "Journal of the American Statistical Association" 1975, vol. 70, nr 349, 31-38.
  3. Calinski R.B., Harabasz J., A Dendrite Method for Cluster Analysis, "Communications in Statistics" 1974, vol. 3, 1-27.
  4. Chavent M., De Carvalho F.A.T., Verde R., Lechevallier Y., Trois nouvelle methodes de classification automatique de donnees symboliques de type intervalle, "Revue de Statistique Appliquée", LI 4, 5-29.
  5. De Carvalho F.A.T., Souza R., Statistical Proximity Functions of Boolean Symbolic Objects Based on Histograms, Advances in Data Science and Classification, Heidelberg-Springer-Verlag 1998,391-396.
  6. Diday E., An Introduction to Symbolic Data Analysis and the SODAS Software, J.S.D.A., International E-Journal 2002.
  7. Dudek A., Miary podobieństwa obiektów symbolicznych, Odległość Ichino-Yaguchiego, Ekonometria 14, "Prace Naukowe AE we Wrocławiu" nr 1021, 2004, 100-106.
  8. Dudek A., Internal Cluster Quality Indexes for Clustering of Symbolic Data, Acta Universitatis Lodziensis, Folia Oeconomica (złożone do druku).
  9. Gordon A.D., Classification, Chapman and Hall/CRC, London 1999.
  10. Hardy A., Lallemand P., Clustering Symbolic Objects Described by Multi-Valued and Modal Variables, [w:] Classification, Clustering and Data Mining Applications, red. D. Banks i in., Springer. Berlin 2004, s. 325-332.
  11. Hubert L.J., Approximate Evaluation Technique for the Single-Link and Complete-Link Hierarchical Clustering Procedures, "Journal of the American Statistical Association" 1974, vol. 69, nr 347, 698-704.
  12. Hubert L.J., Levine J.R., Evaluating Object Set Partitions: Free Sort Analysis and Some Generalizations, "Journal of Verbal Learning and Verbal Behaviour" 1976, vol. 15, 549-570.
  13. Ichino M., Yaguchi H., Generalized Minkowski Metrics for Mixed Feature-Type Data Analysis, "IEEE Transactions on Systems, Man, and Cybernetics" 1994, vol. 24, nr 4, 698-707.
  14. Kaufman L., Rousseeuw P.J., Finding Groups in Data: An Introduction to Cluster Analysis, Wiley, New York 1990.
  15. Krzanowski W.J., Lai Y.T., (), A Criterion for Determining the Number of Groups in a Data Set Using Sum of Squares Clustering, "Biometrics" 1985, 44, 23-34.
  16. Malerba D., Espozito F., Giovalle V., Tamma V., Comparing Dissimilarity Measures for Symbolic Data Analysis, materiały konferencyjne, "New Techniques and Technologies for Statistcs" i "Exchange of Technology and Know-how" (ETK-NTTS'01), 2001, 473-481.
  17. Milligan G.W., Clustering Validation: Results and Implications for Applied Analyses, [w:] Clustering and Classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore, 1996, 341-375.
  18. Milligan G.W., Cooper M.C., An Examination of Procedures for Determining the Number of Clusters in a Data Set, "Biometrics" 1985, 159-179.
  19. Verde R., Lechevalier Y., Chavent M., Symbolic Clustering Interpretation and Visualization, "The Electronic Journal of Symbolic Data Analysis" 2003, vol. 1, nr 1.
  20. Walesiak M., Dudek A., Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - oprogramowanie komputerowe i wyniki badań, [w:] Klasyfikacja i analiza danych - teoria i zastosowania, red. K. Jajuga, M. Walesiak, "Prace Naukowe AE we Wrocławiu" (złożone do druku).
Cytowane przez
Pokaż
ISSN
0324-8445
1507-3866
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu