Walesiak Marek (Akademia Ekonomiczna we Wrocławiu)
Problemy selekcji i ważenia zmiennych w zagadnieniu klasyfikacji
Variable Selection and Weighting Problems in Cluster Analysis
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 106-118, rys., tab., bibliogr. 19 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Klasyfikacja, Dobór zmiennych
Classification, Variables selection
W artykule, głównie na przykładzie wygenerowanych danych w dwuwymiarowej przestrzeni zmiennych, wskazano ograniczenia, które należy wziąć pod uwagę przy selekcji zmiennych w zagadnieniu klasyfikacji. W niektórych sytuacjach jest możliwe uogólnienie na większą liczbę wymiarów. W przeprowadzonych eksperymentach wykorzystano procedurę NtRandLMultiNorm z programu NtRand 2.01, generującą liczby losowe odpowiednie do zadanych wektorów średnich i macierzy kowariancji. W artykule zakładać będziemy, że zmienne opisujące obiekty badania są mierzone na skali przedziałowej lub ilorazowej. (fragment tekstu)

Choice of variables is the one of the most important steps in a cluster analysis. Variables used in applied clustering should be selected and weighted carefully. In cluster analysis we should include only those variables that are believed to help discriminate the data.
In article:
- main aspects of selection and weighting of variables to cluster were characterised,
- point at limitations of variable selection for cluster analysis based on data generated from normal distribution,
- main approaches to variable selection and weighting for cluster analysis were discussed. (original abstract)
