BazEkon - The Main Library of the Cracow University of Economics

BazEkon home page

Main menu

Author
Osińska Monika (Uniwersytet Ekonomiczny w Poznaniu)
Title
Mierniki oceny jakości podziału w analizie skupień - porównanie ich efektywności
The Cluster Validity Indices - Comparison of their Efficiency
Source
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia (18), 2011, nr 176, s. 612-620, bibliogr. 10 poz.
Research of Wrocław University of Economics
Issue title
Klasyfikacja i analiza danych - teoria i zastosowania
Keyword
Analiza skupień, Klasyfikacja danych
Cluster analysis, Data classifications
Note
streszcz., sum.
Abstract
Ocena jakości podziału jest jednym z czterech zasadniczych etapów analizy skupień, istotnie wpływającym na interpretację uzyskanych wyników. W literaturze przedmiotu istnieje duża liczba wskaźników wspomagających proces wyboru podziału optymalnego, jednak spora ich część przejawia pewne własności, które w dużej mierze mogą ograniczać obszary ich zastosowań. Głównym celem referatu jest zaproponowanie nowego wskaźnika oceny jakości grupowania - wskaźnika CNI oraz porównanie jego użyteczności z siedmioma najbardziej znanymi w literaturze wskaźnikami. Obiekty poddane analizie opisane zostały przy użyciu zmiennych dwuwymiarowych, natomiast kolejne podziały uzyskano w wyniku zaimplementowania metody k-średnich. Wszystkie obliczenia wykonano w programie R.(abstrakt oryginalny)

Validation is one of four basic stages of cluster analysis which significantly affects the interpretation of the results. There are many validity indices in the specialist literature, but a lot of them have some properties which can strongly limit possible applications. The main goal of this paper is to propose a new validity index called CNI index and to compare it with the most popular indices. The data used in our analysis are described by 2-dimensional variables, while other divisions are achieved as a result of k-means algorithm implementation. All of the calculations were realized on the R programme.(original abstract)
Accessibility
The Main Library of the Cracow University of Economics
The Library of Warsaw School of Economics
The Library of University of Economics in Katowice
The Main Library of Poznań University of Economics and Business
The Main Library of the Wroclaw University of Economics
Bibliography
Show
  1. Bezdek J.C., Havens T.C., Keller J.M., Popescu M., Dunn's Cluster Validity Index as a Constrast of VAT Images, 19th International Conference on Pattern Recognition (ICPR),2008 December 8-11, Tampa, Florida, USA, IEEE.
  2. Bezdek J.C., Pal N.R., Some new indexes of cluster validity, Transactions on Systems, Man, and Cybernetics, Part B", IEEE, 1998, vol. 28, no. 3, s. 301-315.
  3. Gatnar E., Walesiak M., Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wyd. Akademii Ekonomicznej, Wrocław 2004.
  4. Gusarova L., Yatskiv I., The methods of cluster analysis results validation, Proceedings of International Conference RelStat '04, "Transport and Telecommunication" 2005, vol. 6, no. 1
  5. Halkidi M., Batistakis Y., Vazirgiannis M., On cluster validation techniques, "Journal of Intelligent Information Systems" 2001, vol. 17, no. 2/3, s. 107-145.
  6. Halkidi M., Batistakis Y., Vazirgiannis M., Clustering validity checking methods: Part II, "ACM SIGMOD Records" 2002, vol. 31, no. 3, s. 19-27.
  7. Migdał-Najman K., Najman K., Analityczne metody ustalania liczby skupień. Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 12, Akademia Ekonomiczna we Wrocławiu, Wrocław 2005, s. 265-273.
  8. Migdał-Najman K., Najman K., Analityczne metody ustalania liczby skupień w rozmytych zbiorach danych. Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 13, Akademia Ekonomiczna we Wrocławiu, Wrocław 2006, s. 159-167.
  9. Najman K., Metody ustalania liczby skupień w zbiorach danych binarnych. Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 14, Akademia Ekonomiczna we Wrocławiu, Wrocław 2007, s. 321-329.
  10. Najman K., Symulacyjna analiza wpływu wyboru kryterium optymalności podziału obiektów na jakość uzyskanej klasyfikacji w algorytmach k-średnich. Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 15, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław 2008, s. 295-304.
Cited by
Show
ISSN
1899-3192
1505-9332
Language
pol
Share on Facebook Share on Twitter Share on Google+ Share on Pinterest Share on LinkedIn Wyślij znajomemu