BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Lula Paweł (Akademia Ekonomiczna w Krakowie)
Tytuł
Klasyfikacja dokumentów tekstowych sporządzonych w języku polskim
The Cluster Analysis of Polish Text Documents
Źródło
Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia (12), 2005, nr 1076, s. 302-310, rys., tab., bibliogr. 3 poz.
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Analiza tekstu, Klasyfikacja
Text analysis, Classification
Uwagi
summ.
Abstrakt
Tematyka artykułu jest związana z zagadnieniami taksonomicznej klasyfikacji bez- wzorcowej dokumentów tekstowych. Zasadniczym celem pracy jest prezentacja wyników badań wybranych aspektów klasyfikacji dokumentów sporządzonych w języku polskim. Artykuł ma następującą strukturę: omówienie procesu klasyfikacji bezwzorcowej tekstów wraz z przykładem zaprezentowano w punkcie drugim, charakterystyka przeprowadzonego eksperymentu badawczego i uzyskane wyniki stanowią istotę punktu trzeciego, pracę kończy podsumowanie wniosków wynikających z badań. (fragment tekstu)

The main purpose of the paper is to study the process of cluster analysis of Polish text documents. We consider the influence of different factors (choice of methods of text representation, utilization of stop-list and stemming, conducting Latent Semantic Analysis and choice of clustering methods) on results of clustering procedure. At the final part of the paper on the basis of experiment results we formulate some recommendations for carrying out clustering analysis of Polish texts. (original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Bibliografia
Pokaż
  1. Deerwester S., Dumais S.T., Fumas G.W., Landauer T.K., Harshman R., Indexing by Latent Semantic Analysis, "Journal of the American Society for Information Science" 1990,41 (6), s. 391407.
  2. Lovins J.B., Development of a Stemming Algorithm, "Mechanical Translation and Computational Linguistics" 1968,11.
  3. Manning C., Schütze H., Foundations of Statistical Natural Language Processing, MIT Press, Cambridge 1999.
Cytowane przez
Pokaż
ISSN
0324-8445
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu