BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Walesiak Marek (Akademia Ekonomiczna we Wrocławiu)
Tytuł
Problemy selekcji i ważenia zmiennych w zagadnieniu klasyfikacji
Variable Selection and Weighting Problems in Cluster Analysis
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 106-118, rys., tab., bibliogr. 19 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Klasyfikacja, Dobór zmiennych
Classification, Variables selection
Uwagi
summ.
Abstrakt
W artykule, głównie na przykładzie wygenerowanych danych w dwuwymiarowej przestrzeni zmiennych, wskazano ograniczenia, które należy wziąć pod uwagę przy selekcji zmiennych w zagadnieniu klasyfikacji. W niektórych sytuacjach jest możliwe uogólnienie na większą liczbę wymiarów. W przeprowadzonych eksperymentach wykorzystano procedurę NtRandLMultiNorm z programu NtRand 2.01, generującą liczby losowe odpowiednie do zadanych wektorów średnich i macierzy kowariancji. W artykule zakładać będziemy, że zmienne opisujące obiekty badania są mierzone na skali przedziałowej lub ilorazowej. (fragment tekstu)

Choice of variables is the one of the most important steps in a cluster analysis. Variables used in applied clustering should be selected and weighted carefully. In cluster analysis we should include only those variables that are believed to help discriminate the data.
In article:
- main aspects of selection and weighting of variables to cluster were characterised,
- point at limitations of variable selection for cluster analysis based on data generated from normal distribution,
- main approaches to variable selection and weighting for cluster analysis were discussed. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Carmone F.J., Kara A., Maxwell S., HINoV: a New Method to Improve Market Segment Definition by Identifying Noisy Variables, "Journal of Marketing Research" 1999, listopad, vol. 36, s. 501-509.
  2. Desarbo W.S., Carroll J.D., Clark L.A., Green P.E., Synthesized Clustering: a Method for Amalgamating Clustering Bases with Differential Weighting of Variables "Psychometrika" 1984, vol. 49, nr 1, s. 57-78.
  3. De Soete G., Optimal Variable Weighting for Ultrametric and Additive Tree Clustering, "Quality & Quantity" 1986,20, s. 169-180.
  4. De Soete G., OVWTRE: a Program for Optimal Variable Weighting for Ultrametric and Additive Tree Fitting, "Journal of Classification" 1988, vol. 5, s. 101-104.
  5. Fowlkes E.B., Gnanadesikan R., Kettenring J.R., Variable Selection in Clustering and other Contexts, [w:] Design, Data, and Analysis, red. C.L. Mallows, Wiley, New York, Toronto 1987.
  6. Fowlkes E.B., Gnanadesikan R., Kettenring J.R., Variable Selection in Clustering, "Journal of Classification" 1988, vol. 5, s. 205-228.
  7. Friedman J.H., Meulman J.J., Clustering Objects on Subsets Attributes, http://www-stat.stanford.edu/~jhf/ftp/cosa.pdf, 2004.
  8. Gnanadesikan R., Kettenring J.R., Tsao S.L., Weighting and Selection of Variables for Cluster Analysis, "Journal of Classification" 1995, vol. 12, s. 113-136.
  9. Gordon A.D., Classification, Chapman and Hall/CRC, London 1999.
  10. Grabiński T., Metody taksonometrii, AE, Kraków 1992.
  11. Guyon I., Elisseeff A., An Introduction to Variable and Feature Selection, "Journal of Machine Learning Research" 2003,3, s. 1157-1182.
  12. Hubert L.J., Arabie P., Comparing Partitions, "Journal of Classification" 1985, nr 1, s. 193-218.
  13. Krieger A.M., Green P.E., A Generalized Rand-Index Method for Consensus Clustering of Separate Partitions of the Same Data Base, "Journal of Classification" 1999, nr 1, s. 63-89.
  14. Makarenkov V., Legendre P., Optimal Variable Weighting for Ultrametric and Additive Trees and K-Means Partitioning Methods and Software, "Journal of Classification" 2001, vol. 18, s. 245-271.
  15. Milligan G.W., A Validation Study of a Variable Weighting Algorithm for Cluster Analysis, "Journal of Classification" 1989, vol. 6, s. 53-71.
  16. Milligan G.W., Issues in Applied Classification: Selection of Variables to Cluster, Classification Society of North America Newsletter, listopad, Issue 37, 1994.
  17. Milligan G.W., Clustering Validation: Results and Implications for Applied Analyses, [w:] Clustering and Classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore 1996, s. 341-375.
  18. Rand W.M., Objective Criteria for the Evaluation of Clustering Methods, "Journal of the American Statistical Association" 1971, nr 336, s. 846-850.
  19. Sokołowski A., Empiryczne testy istotności w taksonomii, "Zeszyty Naukowe AE w Krakowie", seria specjalna: Monografie nr 108, AE, Kraków 1992.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu