- Autor
- Gliwa Małgorzata (Uniwersytet Ekonomiczny w Katowicach)
- Tytuł
- Wpływ metody dyskretyzacji na jakość klasyfikacji
The Influence Of Discretization Metod On Classification Quality - Źródło
- Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia (18), 2011, nr 176, s. 348-357, bibliogr. 12 poz.
Research of Wrocław University of Economics - Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Jakość, Klasyfikacja
Quality, Classification - Uwagi
- streszcz., sum.
- Abstrakt
- Główny cel artykułu to porównanie wielkości błędów klasyfikacji modeli dyskryminacyjnych zbudowanych dla zbiorów danych przed dyskretyzacją i po dyskretyzacji. Jako metodę dyskryminacji zastosowano naiwny klasyfikator bayesowski. Modele budowano dla zbiorów danych zarówno przed dyskretyzacją, jak i po dyskretyzacji. Dyskretyzacji dokonano z wykorzystaniem metod bezkontekstowych (dyskretyzacja na równe przedziały i przedziały o równych liczebnościach) i kontekstowych (metoda ChiMerge i minimalizacji entropii). Obliczenia wykonano na podstawie autorskich procedur i funkcji zawartych w pakietach dprep, e1071, grDevices, infotheo oraz car programu R.(abstrakt oryginalny)
The aim of this article is to compare classification errors of classification models for data sets before and after discretization. The naive-Bayes classifiers as a supervised classification method was used. It was trained on a data before discretization and on a data preprocessed by discretization methods. The unsupervised (discretization using intervals of equal width, discretization using intervals of equal frequencies) and supervised (discretization using the Chi-Merge method, discretization using the minimum entropy criterion) discretization methods are used. In the empirical part, procedures from dprep, e1071, grDevices, infotheo and car packages for R software are used.(original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu - Pełny tekst
- Pokaż
- Bibliografia
- Bock H.H., Diday E. (red.), Analysis of Symbolic Data. Exploratory Methods for Extracting Statistical Information from Complex Data, Springer, Berlin 2000.
- Catlett J., On Changing Continuous Attributes into Ordered Discrete Attributes, [w:] Y. Kodratoff (red.), Proceedings of the European Working Session on Learning, Springer, Berlin 1991, s. 164-178.
- Dougherty J., Kohavi R., Sahami M., Supervised and Unsupervised Discretization of Continuous Features, Proceedings of the 12th International Conference on Machine Learning, Morgan Kaufmann, San Francisco 1995, s. 194-202.
- Fayyad U.M., Irani K.B., Multi-interval Discretization of Continuous - Valued Attributes for Classifiaction Learning, Proceedings of the 13th International Joint Conference on Artificial Intelligence, Morgan Kaufmann, San Francisco 1993, s. 1022-1027.
- Freedman D., Diaconis P., On histogram as a density estimator: L2 theory, "Probability Theory and Related Fields" 1981, vol. 57, no. 4, s. 453-476.
- Gatnar E., Problemy dyskretyzacji zmiennych, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 874, Wrocław 2000, s.190-198.
- Hsu Ch.-N., Huang H.-J.,Wong T.-T., Why Discretization Works for Naive Bayesian Classifiers, Proceedings of the 17th International Conference on Machine Learning, Stanford 2000, s. 399-406.
- Kerber R., ChiMerge: Discretization of Numerical Attributes, Proceedings of the 10th National Conference on Artificial Intelligence, MIT Press, San Jose 1992, s. 123-128.
- Scott D. W., On optimal and data-based histograms, "Biometrika" 1979, vol. 66, no. 3, s. 605-610.
- Sturges H., The choice of a class-interval, "Journal of the American Statistical Association" 1926, vol. 21, no. 153, s. 65-66.
- Walesiak M., Gatnar E. (red.), Statystyczna analiza danych z wykorzystaniem programu R, Wyd. Naukowe PWN, Warszawa 2009, s. 193-194.
- Yang Y., Webb G.I., Proportional k-interval Discretization for Naive-Bayes Classifiers, Proceedings of the 12th European Conference on Machine Learning, Springer, Berlin 2001, s. 564-575.
- Cytowane przez
- ISSN
- 1899-3192
1505-9332 - Język
- pol