BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Łapczyński Mariusz (Krakowska Szkoła Wyższa im. Andrzeja Frycza Modrzewskiego w Krakowie)
Tytuł
Entropijne sposoby podziału drzew klasyfikacyjnych
Źródło
Zeszyty Naukowe / Krakowska Szkoła Wyższa im. Andrzeja Frycza Modrzewskiego. Marketing, 2006, s. 209-226, rys., tab., bibliogr. 16 poz.
Słowa kluczowe
Wykrywanie oszustw, Entropia, Drzewa klasyfikacyjne, Klasyfikacja
Fraud detection, Entropy, Classification trees, Classification
Uwagi
streszcz., summ.
Abstrakt
Niewielka popularność drzew klasyfikacyjnych opartych na mierze entropii nie oznacza wcale, że narzędzie to jest nieskuteczne. Istnieje wiele obszarów związanych z zarządzaniem i marketingiem, w których z sukcesem można wykorzystać ten sposób analizowania danych. Są to głównie aplikacje dotyczące analitycznego CRM oraz analizy danych ze źródeł wtórnych. Do bardzo ważnych obszarów można zaliczyć: efektywniejsze pozyskiwanie klientów (customer acquisition), określenie ich rentowności (customers' profitablity) oraz wsparcie w zakresie sprzedaży krzyżowej i uzupełniającej (cross-selling i up-selling). Kolejne obszary badawcze to chociażby segmentacja klientów, analiza migracji klientów (churn analysis) czy szeroko rozumiany web mining (profilowanie internautów i analiza kolejności odwiedzanych stron - tzw. click stream). Warto również nadmienić, że część analiz wykorzystywana jest przez specjalistów z innych dziedzin. Dotyczy to analizy zdolności kredytowej oraz wykrywania nadużyć (fraud detection). Algorytm C4.5 zaimplementowano m.in. w programie See5 oraz SPSS Clementine. (fragment tekstu)

The small number of entropy-based classification trees does not mean that as a tool they are inefficient. There are plenty of areas related to management and marketing, where this type of data analysis can be applied successfully. These are mostly applications related to the analytical CRM and analysis of secondary source data. The number of crucial areas includes more efficient customer acquisition, definition of customer profitability, and support for cross-selling and up-sell- ing. The research areas where success has been achieved include customer segmentation, churn analysis, and broadly understood web mining (visitor profiling and click stream analysis). Worth mentioning is the fact that some analyses are used by specialists in other fields. This pertains especially to creditworthiness and fraud detection. The C4.5 algorithm was implemented, among others, in the See5 and SPSS Clementine applications. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Abramson N., Teoria informacji i kodowania, przeł. J. Nowakowski, W. Sobczak, PWN, Warszawa 1969.
  2. Cestnik B., Kononenko I., Bratko I., ASSISTATNT 86: A Knowledge-Elicitation Tool for Sophisticated Users, [w:] Progress in Machine Learning, (red.) I. Bratko, N. Navrac, Sigma Press, Wimslow 1987.
  3. Cronan T.P., Glorfeld L.W., Perry L.G., Production System Development for Expert Systems Using a Recursive Partitioning Induction Approach: An Application to Mortgage, Commercial, and Consumer Lending, "Decision Sciences" 1991, Vol. 2, Sep.-Oct.
  4. Foster D.P., Stine R.A., Variable Selection in Data Mining: Building a Predictive Model for Bankruptcy, "Journal of the American Statistical Association" 2004, June, Vol. 99.
  5. Fu Z. i in., A Genetic Algorithm^Based Approach for Building Accurate Decision Trees, "INFORMS Journal on Computing" 2003, Vol. 15, No. 1, Winter.
  6. Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa 2001.
  7. Gatnar E., Symboliczne metody klasyfikacji danych, PWN, Warszawa 1998.
  8. Gestwicki P., ID3: History, Implementation, and Applications, October 1997, s. 9 (plik pobrano ze strony citeseer.nj.nec.com latem 2004).
  9. Hunt E.B., Martin J., Stone P.J., Experiment in Induction, Academic Press, New York 1966.
  10. Liang T.P.,Chandler J.S., I Han I.,Roan J., An empirical investigation of some data effects on the classification accuracy of probit, ID3, and neural networks, "Contemporary Accounting Research" 1992, Vol. 9, No. 1, Fall.
  11. Mynarski S., Elementy teorii systemów i cybernetyki, PWN, Warszawa 1979.
  12. Quinlan J.R., C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, California 1993.
  13. Tam K.Y., Kiang M.Y., Managerial Applications of Neural Networks: The Case of Bank Failure Predictions, "Management Sciences" 1992, Vol. 38, No. 7, July.
  14. Turney P.D., Cost-Sensitive Classification: Empirical Evaluation of a Hybrid Genetic Decision Tree Induction Algorithm, "Journal of Artificial Intelligence Research" 1995, nr 2.
  15. Utgoff P.E., Incremental Induction of Decision Trees, "Machine Learning" 1989, nr 4.
  16. Viaene S., Derrig R.A., Baesens B., Dedene G., A Comparison of State- oj-the-Art Classification Techniques for Expert Automobile Insurance Claim Fraud Detection, "The Journal of Risk and Insurance" 2002, Vol. 69, No. 3.
Cytowane przez
Pokaż
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu