- Autor
- Korzeniewski Jerzy (Uniwersytet Łódzki)
- Tytuł
- Propozycja modyfikacji dowolnego indeksu wyznaczającego liczbę skupień w zbiorze danych
A Proposal of Modification of Arbitrary Data Set Cluster Number Index - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 314-320, rys., tab., bibliogr. 3 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Analiza skupień
Cluster analysis - Uwagi
- summ.
- Abstrakt
- Artykuł zawiera propozycję metody wyznaczenia minimalnej liczby skupień w zbiorze danych. Kiedy znamy taką liczbę, możemy zmodyfikować dowolny indeks, uznając za właściwą liczbę skupień tę, którą wskazuje indeks pod warunkiem, że jest ona nie mniejsza od znalezionej minimalnej liczby skupień. Jeśli jest mniejsza, to za właściwą liczbę skupień uznajemy znalezioną minimalna liczbę skupień. Metoda oparta jest na analizie rozkładu odległości pomiędzy dwoma elementami zbioru danych i wymaga tylko znajomości wszystkich par odległości w danym zbiorze, czyli macierzy odległości. W tekście przedstawiono sformułowanie metody oraz jej ocenę za pomocą eksperymentu, w którym badany jest odsetek poprawionych wskazań dla zbiorów z przestrzeni euklidesowych wygenerowanych z zastosowaniem programu CLUSTGEN. (fragment tekstu)
In the paper a proposal of the modification of an arbitrary data set cluster number index is given. The idea of the modification is to obtain a lower bound of the number of clusters in a data set through analysing the distribution of pairwise distances. The modification was tested on 216 data sets from Euclidean spaces with the grouping done by the k-means method. The indices modified were the Rousseeuw silhouette index, the Krzanowski-Lai index, the Caliński-Harabasz index and the Hartigan index. (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Gordon A.D. (1999), Classification, Chapman & Hall, London.
- Milligan G.W. (1985), An Algorithm for Generating Artificial Test Clusters, "Psychometrika" vol. 50, nr 1, s. 123-127.
- Sugar C.A., James G.M. (2003), Finding the Number of Clusters in a Dataset: An Information-Theoretic Approach, "JASA" vol. 98.
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol