- Autor
- Walesiak Marek (Akademia Ekonomiczna we Wrocławiu)
- Tytuł
- Wybrane zagadnienia klasyfikacji obiektów z wykorzystaniem programu komputerowego clusterSim dla środowiska R
The Selected Problems in Cluster Analysis with Application of Clustersim Computer Program and R Environment - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (14), 2007, nr 1169, s. 46-56, rys., tab., bibliogr. 12 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Klasyfikacja obiektów, Programy komputerowe
Classification of objects, Computer programs - Uwagi
- summ.
- Abstrakt
- W artykule zaprezentowana zostanie szczegółowa charakterystyka wybranych funkcji pomocniczych pakietu clusterSim. Funkcjonujące na rynku pakiety statystyczne (np. SPSS, Statistica, S-Plus, SAS) nie udostępniają takich możliwości, jakie niesie z sobą pakiet clusterSim oraz środowisko programistyczne R. W pakiecie clusterSim dostępnych jest m.in. jedenaście formuł normalizacyjnych, cztery miary odległości oraz siedem indeksów jakości klasyfikacji. Inne miary odległości oraz metody klasyfikacji (m.in. hierarchiczne metody aglomeracyjne, metoda k-średnich i metoda k-medoids) dostępne są w pakietach stats i cluster. W zasadniczej części artykułu zaproponowane zostaną przykładowe składnie poleceń (procedury) z wykorzystaniem wybranych funkcji z pakietu clusterSim, w tym w szczególności dist.GDM. Procedury te, mające zastosowanie nie tylko w odniesieniu do miary GDM, ułatwią potencjalnemu użytkownikowi realizację wielu zagadnień klasyfikacyjnych niedostępnych w podstawowych pakietach statystycznych. (fragment tekstu)
Package clusterSim has been written in R language. It contains one main function cluster. Sim and sixteen auxiliary functions. The article presents selected auxiliary functions of clusterSim program and examples of the syntax (procedures) for solving different clustering problems using among others clusterSim package including especially dist.GDM function. These procedures help to resolve a broad range of classification problems that are not available in statistical packages (e.g. SPSS, Statistica, S-Plus, SAS). (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Caliński R.B., Harabasz J. (1974), A Dendrite Method for Cluster Analysis, "Communications in Statistics" vol. 3, s. 1-27.
- Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław.
- Hartigan J. (1975), Clustering Algorithms, Wiley, New York.
- Hubert L. (1974), Approximate Evaluation Technique for the Single-Link and Complete-Link Hierarchical Clustering Procedures, "Journal of the American Statistical Association" vol. 69, no. 347, s. 698-704.
- Kaufman L., Rousseeuw P.J. (1990), Finding Groups in Data: an Introduction to Cluster Analysis, Wiley, New York.
- Milligan G.W., Cooper M.C. (1985), An Examination of Procedures of Determining the Number of Cluster in a Data Set, "Psychometrika" vol. 50, no. 2, s. 159-179.
- R Development Core Team (2006), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, URL http://www.R-project.org.
- Tibshirani R., Walther G., Hastie T. (2001), Estimating the Number of Clusters in a Data Set via the Gap Statistic, "Journal of the Royal Statistical Society" ser. B, vol. 63, part 2, s. 411 -423.
- Walesiak M. (2006), Uogólniona miara odległości w statystycznej analizie wielowymiarowej, wydanie drugie rozszerzone, AE, Wrocław.
- Walesiak M., Dudek A. (2006a), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - oprogramowanie komputerowe i wyniki badań, [w:] K. Jajuga, M. Walesiak (red.), Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 13, "Prace Naukowe AE we Wrocławiu", nr 1126, AE, Wrocław, s. 120-129.
- Walesiak M., Dudek A. (2006b), Determination of Optimal Clustering Procedure for a Data Set, 30th Annual Conference of the German Classification Society (GfKl) "Advances in Data Analysis", Berlin, March 8-10.
- Walesiak M., Dudek A. (2007), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - charakterystyka problemu, "Zeszyty Naukowe Uniwersytetu Szczecińskiego" (w druku).
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol