BazEkon - The Main Library of the Cracow University of Economics

BazEkon home page

Main menu

Author
Lula Paweł (Akademia Ekonomiczna w Krakowie)
Title
Klasyfikacja dokumentów tekstowych sporządzonych w języku polskim
The Cluster Analysis of Polish Text Documents
Source
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 302-310, rys., tab., bibliogr. 3 poz.
Issue title
Klasyfikacja i analiza danych - teoria i zastosowania
Keyword
Analiza tekstu, Klasyfikacja
Text analysis, Classification
Note
summ.
Abstract
Tematyka artykułu jest związana z zagadnieniami taksonomicznej klasyfikacji bez- wzorcowej dokumentów tekstowych. Zasadniczym celem pracy jest prezentacja wyników badań wybranych aspektów klasyfikacji dokumentów sporządzonych w języku polskim. Artykuł ma następującą strukturę: omówienie procesu klasyfikacji bezwzorcowej tekstów wraz z przykładem zaprezentowano w punkcie drugim, charakterystyka przeprowadzonego eksperymentu badawczego i uzyskane wyniki stanowią istotę punktu trzeciego, pracę kończy podsumowanie wniosków wynikających z badań. (fragment tekstu)

The main purpose of the paper is to study the process of cluster analysis of Polish text documents. We consider the influence of different factors (choice of methods of text representation, utilization of stop-list and stemming, conducting Latent Semantic Analysis and choice of clustering methods) on results of clustering procedure. At the final part of the paper on the basis of experiment results we formulate some recommendations for carrying out clustering analysis of Polish texts. (original abstract)
Accessibility
The Main Library of the Cracow University of Economics
The Library of Warsaw School of Economics
The Main Library of Poznań University of Economics and Business
Full text
Show
Bibliography
Show
  1. Deerwester S., Dumais S.T., Fumas G.W., Landauer T.K., Harshman R., Indexing by Latent Semantic Analysis, "Journal of the American Society for Information Science" 1990,41 (6), s. 391407.
  2. Lovins J.B., Development of a Stemming Algorithm, "Mechanical Translation and Computational Linguistics" 1968,11.
  3. Manning C., Schütze H., Foundations of Statistical Natural Language Processing, MIT Press, Cambridge 1999.
Cited by
Show
ISSN
0324-8445
1505-9332
Language
pol
Share on Facebook Share on Twitter Share on Google+ Share on Pinterest Share on LinkedIn Wyślij znajomemu