- Author
- Lula Paweł (Akademia Ekonomiczna w Krakowie)
- Title
- Klasyfikacja dokumentów tekstowych sporządzonych w języku polskim
The Cluster Analysis of Polish Text Documents - Source
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 302-310, rys., tab., bibliogr. 3 poz.
- Issue title
- Klasyfikacja i analiza danych - teoria i zastosowania
- Keyword
- Analiza tekstu, Klasyfikacja
Text analysis, Classification - Note
- summ.
- Abstract
- Tematyka artykułu jest związana z zagadnieniami taksonomicznej klasyfikacji bez- wzorcowej dokumentów tekstowych. Zasadniczym celem pracy jest prezentacja wyników badań wybranych aspektów klasyfikacji dokumentów sporządzonych w języku polskim. Artykuł ma następującą strukturę: omówienie procesu klasyfikacji bezwzorcowej tekstów wraz z przykładem zaprezentowano w punkcie drugim, charakterystyka przeprowadzonego eksperymentu badawczego i uzyskane wyniki stanowią istotę punktu trzeciego, pracę kończy podsumowanie wniosków wynikających z badań. (fragment tekstu)
The main purpose of the paper is to study the process of cluster analysis of Polish text documents. We consider the influence of different factors (choice of methods of text representation, utilization of stop-list and stemming, conducting Latent Semantic Analysis and choice of clustering methods) on results of clustering procedure. At the final part of the paper on the basis of experiment results we formulate some recommendations for carrying out clustering analysis of Polish texts. (original abstract) - Accessibility
- The Main Library of the Cracow University of Economics
The Library of Warsaw School of Economics
The Main Library of Poznań University of Economics and Business - Full text
- Show
- Bibliography
-
- Deerwester S., Dumais S.T., Fumas G.W., Landauer T.K., Harshman R., Indexing by Latent Semantic Analysis, "Journal of the American Society for Information Science" 1990,41 (6), s. 391407.
- Lovins J.B., Development of a Stemming Algorithm, "Mechanical Translation and Computational Linguistics" 1968,11.
- Manning C., Schütze H., Foundations of Statistical Natural Language Processing, MIT Press, Cambridge 1999.
- Cited by
- ISSN
- 0324-8445
1505-9332 - Language
- pol






