BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Wójcik Katarzyna (Uniwersytet Ekonomiczny w Krakowie)
Tytuł
Analiza porównawcza miar podobieństwa tekstów
Comparative Analysis Of Text Documents Similarity Measures
Źródło
Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia (18), 2011, nr 176, s. 340-348, bibliogr. 4 poz.
Research of Wrocław University of Economics
Tytuł własny numeru
Klasyfikacja i analiza danych - teoria i zastosowania
Słowa kluczowe
Analiza porównawcza, Analiza tekstu, Miara podobieństwa
Comparative analysis, Text analysis, Similarity measure
Abstrakt
Zasadniczym celem niniejszej pracy jest próba oceny przydatności znanych z literatury miar podobieństwa tekstów. W kolejnych punktach artykułu przedstawiono najpierw wybrane miary podobieństwa, oparte ma macierzy częstości, wykorzystane do porównania dokumentów, a następnie dokumenty tekstowe, które były porównywane w badaniu. W dalszej części zaprezentowano wyniki przeprowadzonej analizy symulacyjnej opisanych wcześniej miar. Na tej podstawie sformułowano wnioski dotyczące zbieżności między analizowanymi miarami a rzeczywistym podobieństwem pomiędzy dokumentami.(abstrakt oryginalny)

The main objective of this paper is an attempt to evaluate the usefulness of known from literature similarity measures of text documents. In the subsequent parts of the paper there are chosen first measures based on frequency matrix which were used for the comparison of documents and next the text documents that were compared in the research. The next part of article is devoted to the results of previously presented methods' simulation analysis. On this basis the attempt to evaluate the usefulness of similarity measures of texts was made.(original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Deza M.M., Deza E., Encyclopedia of Distances, Springer, Berlin - Heidelberg 2009.
  2. Feinerer I., Introduction to the tm Package. Text Mining in R, http://cran.r-project.org/web/packages/ tm/vignettes/tm.pdf (10.12.2010).
  3. Feinerer I., Hornik K., Meyer D., Text mining infrastructure in R, "Journal of Statistical Software", March 2008, vol. 25, issue 5.
  4. Lula P., Text mining jako narzędzie pozyskiwania informacji z dokumentów tekstowych, http://www. statsoft.pl/czytelnia/8_2007/Lula05.pdf (10.12.2010).
Cytowane przez
Pokaż
ISSN
1899-3192
1505-9332
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu