BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Lula Paweł (Uniwersytet Ekonomiczny w Krakowie)
Tytuł
Identyfikacja słów i fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE
Automatic Identification of Keywords and Keyphrases in Documents Written in Polish
Źródło
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia (22), 2014, nr 327, s. 69-76, bibliogr. 6 poz.
Research Papers of Wrocław University of Economics
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Taksonomia, Algorytmy, System automatycznej identyfikacji
Taxonomy, Algorithms, Automatic identification systems (AIS)
Uwagi
streszcz., summ.
Abstrakt
Tematyka artykułu związana jest z zagadnieniem automatycznej identyfikacji słów oraz fraz kluczowych w dokumentach tekstowych. Po przedstawieniu podstawowych informacji dotyczących stosowanych metod zaprezentowano algorytm RAKE (Rapid Auto-matic Keyword Extraction), a następnie zaproponowano sposób jego modyfikacji, mający na celu jego lepsze przystosowanie do specyfiki języka polskiego. Przedstawiono również przykładowe zastosowanie algorytmu.(abstrakt oryginalny)

In the paper the problem of automatic identification of keywords and keyphrases in text documents written in Polish is presented. First, the classification of different ap-proaches to the problem of keywords extraction is discussed. Next the RAKE algorithm is shown. The proposition of some modification of the original version of the RAKE method is the main purpose of the article. These changes should improve the quality of results ob-tained for text documents prepared in Polish. Also the exemplary application of the modified version of the algorithm is presented.(original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Gładysz A. (2013), Badanie skuteczności metod identyfikacji słów kluczowych w polskojęzycznych tekstach, rozprawa doktorska, Uniwersytet Ekonomiczny w Krakowie, Kraków.
  2. Konferencja (2013), XXII Konferencja Naukowa Sekcji Klasyfikacji i Analizy Danych PTS oraz XXVII Konferencja Taksonomiczna nt. "Klasyfikacja i analiza danych - teoria i zastosowania", Program i streszczenia, red. M. Walesiak, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław.
  3. Perkins J. (2010), Python Text Processing with NLTK 2.0 Cookbook, Packt Publishing.
  4. Rose S., Engel D., Cramer N., Cowley W. (2010), Automatic Keyword Extraction from Individual Documents, [w:] M.W. Berry, J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, s. 3-19.
  5. https://github.com/aneesha/RAKE.
  6. http://sujitpal.blogspot.com/2013/03/implementing-rake-algorithm-with-nltk.html.
Cytowane przez
Pokaż
ISSN
1899-3192
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu