BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Pełka Marcin (Wrocław University of Economics, Poland), Dudek Andrzej (Wrocław University of Economics, Poland)
Tytuł
Regression Analysis for Interval-Valued Symbolic Data Versus Noisy Variables and Outliers
Regresja liniowa danych symbolicznych a zmienne zakłócające i obserwacje odstające
Źródło
Ekonometria / Uniwersytet Ekonomiczny we Wrocławiu, 2016, nr 2 (52), s. 35-42, rys., tab., bibliogr. 13 poz.
Econometrics / Uniwersytet Ekonomiczny we Wrocławiu
Słowa kluczowe
Analiza regresji, Ekonometria
Regression analysis, Econometrics
Uwagi
streszcz., summ.
Abstrakt
Analiza regresji jest z pewnością jedną z powszechniej stosowanych technik w analize zależności zmiennych. Pozwala ona na zbadanie zależności pomiędzy zbiorem zmiennych objaśniających a zmienną niezależną. Ogólnie w modelu regresji ujęta jest liniowa zależność między zmiennymi zależnymi. Celem artykułu jest zaprezentowanie odpowiednich metod analizy regresji dla zmiennych symbolicznych interwałowych oraz ich porównanie w sytuacji, gdy mamy do czynienia ze zmiennymi zakłócającymi lub obserwacjami odstającymi. W części empirycznej przedstawiono wyniki badań symulacyjnych z zastosowaniem danych rzeczywistych oraz sztucznych ze zmiennymi zakłócającymi lub obserwacjami odstajacymi. Wyniki porównano, wykorzystując współczynnik R2.(abstrakt oryginalny)

Regression analysis is perhaps the best known and most widely used method used for the analysis of dependence; that is, for examining the relationship between a set of independent variables (X's) and a single dependent variable (Y). In general regression, the model is a linear combination of independent variables that corresponds as closely as possible to the dependent variable [Lattin, Carroll, Green 2003, p. 38]. The aim of the article is to present two suitable adaptations for a regression analysis of symbolic interval-valued data (centre method and centre and range method) and to compare their usefulness when dealing with noisy variables and/or outliers. The empirical part of the paper presents the results of simulation studies based on artificial and real data, without noisy variables and/or outliers and with noisy variable and outliers. The results are compared according to the values of two coefficients of determination 2 RL and 2 . RU The results show that usually the centre and range method obtains better results even when the data set contains noisy variables and outliers, but in some cases the centre method obtains better results than the centre and range method.(original abstract)
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka SGH im. Profesora Andrzeja Grodka
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Pełny tekst
Pokaż
Bibliografia
Pokaż
  1. Billard L., Diday E., 2006, Symbolic Data Analysis. Conceptual Statistics and Data Mining, John Wiley & Sons, Chichester.
  2. Bock H.-H., Diday E. (eds.), 2000, Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Springer Verlag, Berlin-Heidelberg.
  3. Diday E., Noirhomme-Fraiture M., 2008, Symbolic Data Analysis. Conceptual Statistics and Data Mining, Wiley&Sons, Chichester.
  4. Dudek A., 2013, Metody analizy danych symbolicznych w badaniach ekonomicznych, Wyd. UE we Wrocławiu, Wrocław.
  5. Hair J.F., Black W.C., Babim B.J., Anderson R.E., Tatham R.L., 2006, Multivariate Data Analysis, Prentice Hall, New Jersey.
  6. Lattin J., Carroll J.D., Green P.E., 2003, Analyzing Multivariate Data, Thomson Learning, Toronto.
  7. Lima-Neto E.A., de Carvalho F.A.T., 2008, Centre and range method to fitting a linear regression model on symbolic interval data, Computational Statistics and Data Analysis, vol. 52, pp. 1500-1515.
  8. Lima-Neto E.A., de Carvalho F.A.T., 2010, Constrained linear regression models for symbolic interval-valued variables, Computational Statistics and Data Analysis, vol. 54, pp. 333-347.
  9. Milligan G.W., Cooper M.C., An examination of procedures for determining the number of clusters in a data set, Psychometrika, vol. 50, no. 2, pp. 159-179.
  10. Qiu W., Joe H., 2006, Generation of Random Clusters with Specified Degree of Separation. Journal of Classification, vol. 23, pp. 315-334.
  11. Walesiak M., Dudek A., 2014, The clusterSim package [URL:] www.r-project.org.
  12. Walesiak M., Gatnar E. (eds.), 2004, Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wyd. Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław.
  13. Welfe A., 2013, Ekonometria, PWN, Warszawa.
Cytowane przez
Pokaż
ISSN
1507-3866
Język
eng
URI / DOI
http://dx.doi.org/10.15611/ekt.2016.2.03
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu