BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Brzezińska Justyna (University of Economics in Katowice, Poland)
Tytuł
Visual Techniques for Categorical Data in R
Metody wizualizacji danych w programie R
Źródło
Ekonometria / Uniwersytet Ekonomiczny we Wrocławiu, 2017, nr 3 (57), s. 26-36, rys., tab., bibliogr. 14 poz.
Econometrics / Uniwersytet Ekonomiczny we Wrocławiu
Słowa kluczowe
Wizualizacja danych, Analiza wielowymiarowa, Analiza statystyczna
Data visualisation, Multi-dimensional analysis, Statistical analysis
Uwagi
Klasyfikacja JEL: C35, C 40, C88.
streszcz., summ.
Abstrakt
Wizualizacja danych jest jedną z ważniejszych części statystycznej analizy. W niniejszym artykule zaprezentowane zostaną nowoczesne metody wizualizacji z uwzględnieniem wykresów słupkowych w celu prezentacji liczebności, podzielonych na częstości warunkowe pozostałych zmiennych objaśniających. Zaprezentowany zostanie pakiet extracat programu R pozwalający na zastosowanie nowoczesnych metod graficznych: wykresu rmp oraz cpcp. Pierwszy z nich należy do grupy wielowymiarowych wykresów mozaikowych. Drugi natomiast oparty jest na równoległych osiach. Zastosowanie tych wykresów w badaniach pozwala na zwiększenie możliwości interpretacyjnych, a także na przedstawienie struktury analizowanych danych.(abstrakt oryginalny)

Visualization is one of the most important parts of statistical analysis. In this paper we present a new method of multiple bar charts to display the frequencies of data tables split up into conditional relative frequencies of one target variable and the absolute frequencies of the corresponding combinations of the remaining explanatory variables. In this paper we present the R package extracat allowing for new graphical tools: rmp and cpcp plot [Pilhoefer, Unwin 2013]. The first plot uses the a crossover of mosaicplots and multiple barcharts to display the frequencies of a contingency table split up into conditional relative frequencies of one target variable and the absolute frequencies of the corresponding combination of the remaining explanatory variables. It provides a well-structured representation of the data with the possibility of easy interpretation. Another plot presented in the paper is the cpcp plot using parallel coordinates. Sequences of points are used to represent each of the variable categories, while ordering algorithms are applied to represent a hierarchical structure in the dataset.(original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Bendix F., Kosara R., Hauser H., 2005, Parallel Sets: Visual Analysis of Categorical Data, Proceedings of the 2005 IEEE Symposium on Information Visualization (InfoVis), pp. 133-140.
  2. d'Ocagne M., 1885, Coordonnées Parallèles et Axiales: Méethode de Transformation Géométrique et Procédé Nouveau de Calcul Graphique déduits de la Considération des Coordonnées Parallèlles. Gauthier-Villars, Paris.
  3. Fienberg S.E., 1975, Perspective Canada as a social report, Social Indicators Research, 2, pp. 153-174.
  4. Fisher R.A., 1925, Statistical Methods for Research workers, Originally published in Edinburgh by Oliver and Boyd.
  5. Friendly M., 1994, Mosaic display for multi-way contingency tables, Journal of the American Statistical Association, 89, pp. 190-200.
  6. Friendly M., 2000, Visualizing Categorical Data, SAS Institute.
  7. Gu Z., Gu L., Eils R., 2014, Matthias Schlesner, Benedikt Brors, Circlize Implements and enhances circular visualization in R, Bioinformatics, Oxford, England.
  8. Hartigan J.A., Kleiner B., 1984, A mosaic of television ratings, The American Statistician, 38, pp. 32-35.
  9. Meyer D., Zeileis A., Hornik K., 2006, The strucplot framework: Visualizing multi-way contingency tables with vcd, Journal of Statistical Software, 17(3), pp. 1-48.
  10. Pilhöfer A., Unwin A., 2013, New approaches in visualization of categorical data: R package extracat, Journal of Statistical Software, 53(7), pp. 1-25. Hartigan J.A., Kleiner B., 1981, Mosaics for contingency tables, [in:] W.F. Eddy (ed.), Computer Science and Statistics: Proceedings of the 13th Symposium on the Interface, Springer-Verlag, New York, pp. 268-273.
  11. Riedwyl H., Schüpbach M., 1983, Siebdiagramme: Graphische darstellung von kontingenztafeln, Technical Report 12, Institute for Mathematical Statistics, University of Bern, Bern, Switzerland.
  12. Riedwyl H., Schüpbach M., 1994, Parquet diagram to plot contingency tables, [in:] Faulbaum F. (ed.), Softstat `93: Advanced In Statistical Software, Gustav Fischer, New York, pp. 293-299.
  13. Theus M., 1997, Visualization of categorical data, Advanced in Statistical Software, Lucius & Lucius, 6, pp. 47-55.
  14. Unwin A., Volinsky C., Winkler S., 2003, Parallel Coordinates for Exploratory Modelling Analysis, Computational Statistics & Data Analysis, 43(4), pp. 553-564.
Cytowane przez
Pokaż
ISSN
1507-3866
Język
eng
URI / DOI
http://dx.doi.org/10.15611/ekt.2017.3.02
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu