- Autor
- Lula Paweł (Akademia Ekonomiczna w Krakowie)
- Tytuł
- Klasyfikacja dokumentów tekstowych sporządzonych w języku polskim
The Cluster Analysis of Polish Text Documents - Źródło
- Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 302-310, rys., tab., bibliogr. 3 poz.
- Tytuł własny numeru
- Klasyfikacja i analiza danych - teoria i zastosowania
- Słowa kluczowe
- Analiza tekstu, Klasyfikacja
Text analysis, Classification - Uwagi
- summ.
- Abstrakt
- Tematyka artykułu jest związana z zagadnieniami taksonomicznej klasyfikacji bez- wzorcowej dokumentów tekstowych. Zasadniczym celem pracy jest prezentacja wyników badań wybranych aspektów klasyfikacji dokumentów sporządzonych w języku polskim. Artykuł ma następującą strukturę: omówienie procesu klasyfikacji bezwzorcowej tekstów wraz z przykładem zaprezentowano w punkcie drugim, charakterystyka przeprowadzonego eksperymentu badawczego i uzyskane wyniki stanowią istotę punktu trzeciego, pracę kończy podsumowanie wniosków wynikających z badań. (fragment tekstu)
The main purpose of the paper is to study the process of cluster analysis of Polish text documents. We consider the influence of different factors (choice of methods of text representation, utilization of stop-list and stemming, conducting Latent Semantic Analysis and choice of clustering methods) on results of clustering procedure. At the final part of the paper on the basis of experiment results we formulate some recommendations for carrying out clustering analysis of Polish texts. (original abstract) - Dostępne w
- Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu - Bibliografia
- Deerwester S., Dumais S.T., Fumas G.W., Landauer T.K., Harshman R., Indexing by Latent Semantic Analysis, "Journal of the American Society for Information Science" 1990,41 (6), s. 391407.
- Lovins J.B., Development of a Stemming Algorithm, "Mechanical Translation and Computational Linguistics" 1968,11.
- Manning C., Schütze H., Foundations of Statistical Natural Language Processing, MIT Press, Cambridge 1999.
- Cytowane przez
- ISSN
- 0324-8445
1505-9332 - Język
- pol