BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Brzezińska Justyna (University of Economics in Katowice, Poland)
Tytuł
Visualization of Categorical Data Using Extracat Package in R
Wizualizacja danych jakościowych z wykorzystaniem pakietu extracat programu R
Źródło
Econometrics. Advances in Applied Data Analysis, 2018, vol. 22, nr 2, s. 9-19, rys., tab., bibliogr. 10 poz.
Ekonometria
Słowa kluczowe
Wizualizacja danych, Ekonometria, Oprogramowanie, Analiza statystyczna
Data visualisation, Econometrics, Software, Statistical analysis
Uwagi
Klasyfikacja JEL: C30, C31, C4
streszcz., summ.
Abstrakt
W procesie decyzyjnym oraz analizie danych kluczową rolę odgrywa wizualizacja wyników. Istnieje wiele zaawansowanych wykresów przeznaczonych dla danych o charakterze nominalnym. Najbardziej znanymi w tym obszarze są: wykres mozaikowy, wykres asocjacji, wykres dwuwarstwowy, wykres sitkowy, wykres czteropolowy. Wykresy te oparte są na graficznej analizie odchyleń liczebności empirycznych od teoretycznych w badanej tablicy kontyngencji. W niniejszej pracy przedstawione zostaną nowoczesne metody wizualizacji danych niemetrycznych za pomocą wykresu częstości względnych (relative multiple bar) (funkcja rmb), wykresu opartego na koncepcji osi równoległych (categorical paralel coordinates plot) (funkcja cpcp) oraz wykresu fluktuacji (fluctuation plot) (funkcja fluctile) dostępnych w pakiecie extracat programu R [Pilhöfer, Unwin 2013]. Wszystkie obliczenia prezentowane w niniejszym artykule wykonano w programie R.(abstrakt oryginalny)

Visualization in research process plays a crucial role. There are several advanced plots for visualizing categorical data, such as mosaic, association, double-decker, sieve or fourfold plot that are based on the graphical presentation of residuals in a contingency table. In this paper we present new methods for visualizing categorical data such as rmb, fluctile and scpcp plot available in extracat package in R. This package provides a well-structured representation of categorical data and allows for a detailed presentation of the relationship between categories in terms of proportions. We describe rmb, fluctile and cpcp. Those plots are based on the concept of multiple bar charts, a fluctuation diagram from a multidimensional table and parallel coordinates respectively. Such plots are mostly used for a visualization of a contingency table or a data frame; they can also be used for exploratory analysis and allows for a graphical presentation even for a high number of variables [Pilhöfer, Unwin 2013]. All the calculations and plots are obtained using R software.(original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. d'Ocagne M., 1885, Coordonnées Parallèeles et Axiales: Méthode de Transformation Géométrique et Procédé Nouveau de Calcul Graphique déduits de la Considération des Coordonnées Parallèlles, Gauthier-Villars, Paris.
  2. Friendly M., 1994, Mosaic display for multi-way contingency tables, Journal of the American Statistical Association, 89, pp. 190-200.
  3. Friendly M., 2000, Visualizing Categorical Data, SAS Institute, Cary NC.
  4. Hartigan J.A., Kleiner B., 1981, Mosaics for Contingency Tables, [in:] W.F. Eddy (ed.), Computer Science and Statistics, Proceedings of the 13th Symposium on the Interface, 268-273, Springer-Verlag, New York.
  5. Inselberg A. 2009, Parallel Coordinates, Springer-Verlag, New York.
  6. Kosara R., Bendix F., Hauser H., 2005, Parallel sets: Interactive exploration and visual analysis of categorical data, Visualization and Computer Graphics, IEEE Transactions, 12 (4), pp. 558-568.
  7. Meyer D., Zeileis A., Hornik K., 2006, The strucplot framework: visualizing multi-way contingency tables with vcd, Journal of Statistical Software, 17(3), pp. 1-48.
  8. Pilhöefer A., Unwin A., 2013, New Approaches in Visualization of Categorical Data: R Package extracat, Journal of Statistical Software, 53(7), pp. 1-25.
  9. Unwin A., Volinsky C., Winkler S., 2003, Parallel coordinates for exploratory modelling analysis, Computational Statistics & Data Analysis, 43(4), pp. 553-564.
  10. Urbanek S., Theus M., 2003, iPlots - High Interaction Graphics for R, [in:] K. Hornik, F. Leisch, A. Zeileis (eds.), Proceedings of the 3rd International Workshop on Distributed Statistical Computing 2003, Technische Universität Wien, Vienna, Austria.
Cytowane przez
Pokaż
ISSN
1507-3866
Język
eng
URI / DOI
http://dx.doi.org/10.15611/eada.2018.2.01
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu