BazEkon - The Main Library of the Cracow University of Economics

BazEkon home page

Main menu

Author
Korzeniewski Jerzy (Uniwersytet Łódzki)
Title
Propozycja modyfikacji dowolnego indeksu wyznaczającego liczbę skupień w zbiorze danych
A Proposal of Modification of Arbitrary Data Set Cluster Number Index
Source
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 314-320, rys., tab., bibliogr. 3 poz.
Issue title
Klasyfikacja i analiza danych - teoria i zastosowania
Keyword
Analiza skupień
Cluster analysis
Note
summ.
Abstract
Artykuł zawiera propozycję metody wyznaczenia minimalnej liczby skupień w zbiorze danych. Kiedy znamy taką liczbę, możemy zmodyfikować dowolny indeks, uznając za właściwą liczbę skupień tę, którą wskazuje indeks pod warunkiem, że jest ona nie mniejsza od znalezionej minimalnej liczby skupień. Jeśli jest mniejsza, to za właściwą liczbę skupień uznajemy znalezioną minimalna liczbę skupień. Metoda oparta jest na analizie rozkładu odległości pomiędzy dwoma elementami zbioru danych i wymaga tylko znajomości wszystkich par odległości w danym zbiorze, czyli macierzy odległości. W tekście przedstawiono sformułowanie metody oraz jej ocenę za pomocą eksperymentu, w którym badany jest odsetek poprawionych wskazań dla zbiorów z przestrzeni euklidesowych wygenerowanych z zastosowaniem programu CLUSTGEN. (fragment tekstu)

In the paper a proposal of the modification of an arbitrary data set cluster number index is given. The idea of the modification is to obtain a lower bound of the number of clusters in a data set through analysing the distribution of pairwise distances. The modification was tested on 216 data sets from Euclidean spaces with the grouping done by the k-means method. The indices modified were the Rousseeuw silhouette index, the Krzanowski-Lai index, the Caliński-Harabasz index and the Hartigan index. (original abstract)
Accessibility
The Main Library of the Cracow University of Economics
The Main Library of Poznań University of Economics and Business
Bibliography
Show
  1. Gordon A.D. (1999), Classification, Chapman & Hall, London.
  2. Milligan G.W. (1985), An Algorithm for Generating Artificial Test Clusters, "Psychometrika" vol. 50, nr 1, s. 123-127.
  3. Sugar C.A., James G.M. (2003), Finding the Number of Clusters in a Dataset: An Information-Theoretic Approach, "JASA" vol. 98.
Cited by
Show
ISSN
0324-8445
1505-9332
Language
pol
Share on Facebook Share on Twitter Share on Google+ Share on Pinterest Share on LinkedIn Wyślij znajomemu