BazEkon - Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

BazEkon home page

Meny główne

Autor
Dudek Hanna
Tytuł
Zależności między liczbą warunkową a współczynnikami zmienności
The Relationships Between a Condition Number and Coefficients of Variation
Źródło
Przegląd Statystyczny, 2005, vol. 52, z. 1, s. 75-85, bibliogr. 12 poz.
Statistical Review
Słowa kluczowe
Ekonometria, Modele ekonometryczne
Econometrics, Econometric models
Uwagi
summ.
Abstrakt
W pracy rozważono liniowy model ze stałą. W modelu tym poddano analizie przybliżone liniowe zależności między kolumną 1 (odpowiadającą stałej) a pozostałymi kolumnami macierzy obserwacji X. Problem ten jest szczególnym przypadkiem współliniowości. Do pomiaru współliniowości wykorzystano liczbę warunkową macierzy XTX (uprzednio dzieląc każdy z wektorów kolumnowych przez jego długość). Liczba warunkowa jest pierwiastkiem z ilorazu największej do najmniejszej wartości własnej tej macierzy. Wartości większe od 20 wskazują na wystąpienie współliniowości. W modelu liniowym z jedną zmienną objaśniającą współliniowość może być spowodowana jedynie przybliżoną zależnością liniową między wektorem 1 (odpowiadającym stałej) a wektorem wartości tej zmiennej. To oznacza, że wartości zmiennej objaśniającej cechują się niewielką zmiennością. W celu określenia poziomu zróżnicowania wartości zmiennej objaśniającej wykluczającej współliniowość w pracy podano zależność między współczynnikiem zmienności a liczbą warunkową. Między innymi określono, że wartość bezwzględna współczynnika zmienności mniejsza od 0,1 odpowiada liczbie warunkowej większej od 20. W pracy stwierdzono, że w przypadku uwzględnienia większej liczby zmiennych, możliwa jest współliniowość mimo niewielkich zależności między wektorami wartości zmiennych objaśniających oraz wartości bezwzględnych wszystkich współczynników zmienności przekraczających wartości progowe zalecane w literaturze ekonometrycznej. Dlatego też sądzi się, że w celu uniknięcia współliniowości, badania zależności między kolumnami macierzy X nie powinno ograniczać się do wyznaczenia współczynników zmienności oraz określenia relacji między scentrowanymi wektorami wartości zmiennych objaśniających. Zastosowanie dwuetapowej procedury doboru zmiennych objaśniających do modelu liniowego polegającej na eliminacji zmiennych quasi-stałych (nawet przy wartości progowej V* = 0,20), a następnie użycie metod wykorzystujących scentrowane

A linear model with constant term is considered in this paper. The problem of near linear dependencies between column 1 (referring to constant term) and remaining columns of X is analyzed. It is a special case of multicollinearity. For measuring multicollinearity a condition number of XTX (after scaling each column so that it has unit length) is applied. It is the square root ratio of the largest eigenvalue of this matrix to the smallest. Values in excess of 20 are suggested by some of researches as indicative of the multicollinearity. In a model with one regressor collineariry may be caused only by near linear dependence between the column 1 and the column of values of explanatory variable. It means that values of the explanatory variable have small variation. For measuring variability of values of this variable coefficient of variation is applied. In this paper a formula defining the relationship between the condition number and the coefficient of variation is derived. Values of a condition number greater then 20 correspond with the coefficient of variation less then 0,1. In multiple regression model relationships between columns of X matrix are more complex. It is demonstrated by using examples, that even in the cases, when all coefficients of variation exceed 0,20 and dependencies between columns of values of explanatory variables are weak, there is a possibility of multicollinearity. It is therefore claimed that, in order to avoid this problem, one should not only examine separately dependencies between column 1 and each column of X. The analysis of whole X matrix is required. The application of the two-staged procedure of the selection of the explanatory variables, which first eliminates quasi-constant variables and then uses centered correlation coefficients does not exclude multicollinearity.
Dostępne w
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Biblioteka Szkoły Głównej Handlowej
Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach
Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu
Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu
Bibliografia
Pokaż
  1. Belsley D.A., Conditioning Diagnostics, Collinearity and Weak Data in Regression, John Wiley&Sons, New York, 1991.
  2. Belsley D.A., Demeaning Conditioning Through Centering, The American Statistician, Vol. 38, No. 2,1984.
  3. Draper N. R., Smith H., Applied Regresion Analysis, John Wiley&Sons, New York, 1998.
  4. Dudek H., Wpływ wspólliniowości na wartości współczynników korelacji pomiędzy parami zmiennych objaśniających, Przegląd Statystyczny, tom 50, z. 2, 2003, s. 41-51.
  5. Dudek H., Zmienne .prawie stałe" w liniowych modelach ekonometrycznych, Metody ilościowe w badaniach ekonomicznych V, Wydawnictwo SGGW, złożone do druku, 2005.
  6. Dziechciarz J. (red.), Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002.
  7. Green W.H., Econometric Analysis, Prentice Hall Inc., Upper Saddle River, New Jersey, 2000.
  8. Nowak E., Zarys metod ekonometrii. Zbiór zadań, Wydawnictwo Naukowe PWN, Warszawa 2002.
  9. Osiewalski J., Centered and noncentered variance inflation factors for the OLS estimator of a linear function and for the OLS prediction error, Acta Universitatis Lodziensis, Folia Oeconomica, No. 123, Łódź 1992, s. 97-108.
  10. Strahl D. (red.). Modelowanie ekonometryczne z Excelem, Wydawnictwo AE we Wrocławiu, Wroclaw 2002.
  11. Welfe A., Ekonometria, PWE, Warszawa, 2003.
  12. Zeliaś A., Teoria prognozy, PWE,Warszawa 1997.
Cytowane przez
Pokaż
ISSN
0033-2372
Język
pol
Udostępnij na Facebooku Udostępnij na Twitterze Udostępnij na Google+ Udostępnij na Pinterest Udostępnij na LinkedIn Wyślij znajomemu