BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Walesiak Marek (Uniwersytet Ekonomiczny we Wrocławiu), Dudek Andrzej (Uniwersytet Ekonomiczny we Wrocławiu)
Tytuł
Ocena wybranych procedur analizy skupień dla danych porządkowych
Finding Groups in Ordinal Data - an Examination of Some Clustering Procedures
Źródło
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia (16), 2009, nr 47, s. 41-49, rys., tab., bibliogr. 17 poz.
Research of Wrocław University of Economics
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Analiza skupień, Teoria pomiaru
Cluster analysis, Theory of measurement
Uwagi
summ.
Abstrakt
Celem artykułu jest przeprowadzenie oceny przydatności wybranych procedur analizy skupień dla danych porządkowych. Testowanie przydatności wybranych procedur przeprowadzone zostanie na podstawie porządkowych danych symulacyjnych o znanej strukturze klas obiektów wygenerowanych z wykorzystaniem z funkcji cluster.Gen pakietu clusterSim. (fragment tekstu)

The major steps in a cluster analysis procedure for ordinal data contain: selection of objects and variables, selection of a distance measure, selection of clustering method, determining the number of clusters, cluster validation, describing and profiling clusters. In the article, based on data simulated with cluster.Gen function of clusterSim package working in R environment, some cluster analysis procedures containing GDM distance for ordinal data, nine clustering methods and eight internal cluster quality indices are evaluated. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Bibliografia
Pokaż
  1. Anderberg M.R. (1973), Cluster analysis for applications, Academic Press, New York, San Francisco, London.
  2. Carmone F.J., Kara A., Maxwell S. (1999), HINoV: a new method to improve market segment definition by identifying noisy variables, "Journal of Marketing Research", November, vol. 36, s. 501-509.
  3. Dudoit S., Fridlyand J. (2002), A prediction-based resampling method for estimating the number of clusters in a dataset, "Genome Biology", 3(7).
  4. Hubert L.J., Arabie P. (1985), Comparing partitions, "Journal of Classification" no 1, s. 193-218.
  5. Macnaughton-Smith P., Williams W.T., Dale M.B., Mockett L.G. (1964), Dissimilarity analysis: a new technique of hierarchical sub-division, "Nature", 202, s. 1034-1035.
  6. Milligan G.W. (1996), Clustering validation: results and implications for applied analyses, [w:] Clustering and classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore, s. 341-375.
  7. R Development Core Team (2008), R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, URL http://www.R-project.org.
  8. Soffritti G. (2003), Identifying multiple cluster structures in a data matrix, "Communications in Statistics. Simulation and Computation", vol. 32, no 4, s. 1151-1177.
  9. Tibshirani R., Walther G., Hastie T. (2001), Estimating the number of clusters in a data set via the gap statistic, "Journal of the Royal Statistical Society", ser. B, vol. 63, part 2, s. 411-423.
  10. Tibshirani R., Walther G. (2005), Cluster validation by predicting strength, "Journal of Computational and Graphical Statistics", vol. 14, no 3.
  11. Walesiak M. (1993), Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 654, Seria: Monografie i Opracowania nr 101, AE, Wrocław.
  12. Walesiak M. (1996), Metody analizy danych marketingowych, PWN, Warszawa.
  13. Walesiak M. (2005), Rekomendacje w zakresie strategii postępowania w procesie klasyfikacji zbioru obiektów, [w:] Przestrzenno-czasowe modelowanie i prognozowanie zjawisk gospodarczych, red. A. Zeliaś, AE, Kraków, s. 185-203.
  14. Walesiak M. (2006), Uogólniona miara odległości w statystycznej analizie wielowymiarowej, Wydanie drugie rozszerzone, AE, Wrocław.
  15. Walesiak M. (2008a), Analiza skupień, [w:] Statystyczna analiza danych z wykorzystaniem programu R, red. M. Walesiak, E. Gatnar, Wydawnictwo Naukowe PWN, Warszawa (w druku).
  16. Walesiak M. (2008b), Losowe generowanie danych o znanej strukturze klas w pakiecie cluster-Sim, [w:] Przestrzenno-czasowe modelowanie i prognozowanie zjawisk społeczno-ekonomicznych, red. J. Pociecha Wydawnictwo UE, Kraków (w redakcji).
  17. Walesiak M., Dudek A. (2008), clusterSim package, URL http://www.R-project.org.
Cytowane przez
Pokaż
ISSN
1899-3192
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu