http://www.kzpr.com.pl/index.php?option=com_content&task=view&id=60&Itemid=51
Dane, którymi zamierzam się zająć dotyczą produkcji rzepaku w Polsce w latach od 1989 do 2006r. Zbiory to zmienna zależna, którą opisują plony i powierzchnia.
Zmienna objaśniana
Zbiory- zbiory rzepaku w latach 1989-2006 w tysiącach ton
Zmienne objaśniające:
Pow- powierzchnia w tysiącach ha
Plony- plony rzepaku w dt/ha
Model 1: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)
Zmienna zależna: Zbiory
współczynnik błąd standardowy t-Studenta wartość p
---------------------------------------------------------------
const -979,966 48,8568 -20,06 3,03e-012 ***
Pow 2,10153 0,119443 17,59 2,00e-011 ***
Plony 47,7064 3,20402 14,89 2,15e-010 ***
Średn.aryt.zm.zależnej 1016,988
Odch.stand.zm.zależnej 358,1364
Suma kwadratów reszt 16576,20
Błąd standardowy reszt 33,24274
Wsp. determ. R-kwadrat 0,992398
Skorygowany R-kwadrat 0,991384
F(2, 15) 979,0570
Wartość p dla testu F 1,28e-16 = =0,000000000000000128
Logarytm wiarygodności -86,96905
Kryt. inform. Akaike'a 179,9381
Kryt. bayes. Schwarza 182,6092
Kryt. Hannana-Quinna 180,3064
Autokorel.reszt - rho1 0,378906
Stat. Durbina-Watsona 1,152382
Zbiory=-979,966+2,10153Pow+47,7064Plony
Statystyka F(2, 15) =979,0570 dla p<1,28e-16 = 0,000000000000000128
Stąd wynika, że ŁĄCZNIE zmienne objaśniające są statycznie istotne.
Przy przyjętym poziomie istotności na poziomie a=0,05 zarówno zmienna Pow jest statystycznie istotna, gdyż p dla ich statystyki wynosi odpowiednio 2,00e-0,11<0,05 i dla zmiennej
Plony 2,15e-0,10<0,05
Test Reset- prawidłowa postać funkcyjna
Pomocnicze równanie regresji dla testu specyfikacji RESET
Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)
-----------------------------------------------------------------
const -190,351 139,258 -1,367 0,1948
Pow 1,00557 0,238341 4,219 0,0010 ***
Plony 19,6776 5,18230 3,797 0,0022 ***
yhat^2 0,000303382 0,000118272 2,565 0,0235 **
yhat^3 -2,05122e-08 3,93052e-08 -0,5219 0,6105
Statystyka testu: F = 177,318941,
z wartością p = P(F(2,13) > 177,319) = 3,68e-010=0,000000000368
177,319>0,05
Hipoteza zerowa mówi o liniowości modelu F=177,319>0,05 zatem nie mamy podstaw do odrzucenia hipotezy zerowej na rzecz alternatywnej mówiącej o nieprawidłowej postaci funkcyjnej modelu.
Test RESET na specyfikację -
Hipoteza zerowa: specyfikacja poprawna
Statystyka testu: F(2, 13) = 177,319
z wartością p = P(F(2, 13) > 177,319) = 3,67621e-010
Test RESET na specyfikację (tylko kwadrat zmiennej) -
Statystyka testu: F(1, 14) = 373,793
z wartością p = P(F(1, 14) > 373,793) = 1,70135e-011
Ocena współliniowości
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
Pow 2,143
Plony 2,143
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Własności macierzy X'X:
1-norm = 4013375,6
Wyznacznik = 3,2158409e+008
Wskażnik uwarunkowania macierzy CN = 1,1070598e-007
Wartości czynników inflacji wariancji wynoszą dla Pow-2,143 a dla Plony-2,143 i są mniejsze od 10, nie ma więc podstaw do stwierdzenia, że między zmiennymi objaśniającymi w modelu istnieje korelacja.
Test rozkładu reszt
liczba przedziałów = 7, średnia = 3,15797e-014, odch.std. = 33,2427
Przedziały średnia liczba częstość skumlowana
< -23,745 -32,786 7 38,89% 38,89% *************
-23,745 - -5,6640 -14,705 4 22,22% 61,11% *******
-5,6640 - 12,417 3,3766 2 11,11% 72,22% ***
12,417 - 30,498 21,458 2 11,11% 83,33% ***
30,498 - 48,579 39,539 1 5,56% 88,89% *
48,579 - 66,661 57,620 1 5,56% 94,44% *
>= 66,661 75,701 1 5,56% 100,00% *
Hipoteza zerowa: dystrybuanta empiryczna posiada rozkład normalny. Test Doornika-Hansena (1994)- transformowana skośność i kurtoza:
Chi-kwadrat(2) = 6,128 z wartością p 0,04669
Test pominiętych zmiennych
Model 3: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)
const -938,722 219,793 -4,271 0,0006 ***
Plony 88,8734 9,85846 9,015 1,14e-07 ***
Średn.aryt.zm.zależnej 1016,988 Odch.stand.zm.zależnej 358,1364
Suma kwadratów reszt 358666,5 Błąd standardowy reszt 149,7219
Wsp. determ. R-kwadrat 0,835508 Skorygowany R-kwadrat 0,825227
F(1, 16) 81,26912 Wartość p dla testu F 1,14e-07
Logarytm wiarygodności -114,6389 Kryt. inform. Akaike'a 233,2778
Kryt. bayes. Schwarza 235,0585 Kryt. Hannana-Quinna 233,5233
Autokorel.reszt - rho1 -0,167889 Stat. Durbina-Watsona 1,904125
Porównanie Modelu 1 z Modelem 3:
Hipoteza zerowa: parametr regresji jest równy zero dla Pow
Statystyka testu: F(1, 15) = 309,562, z wartością p = 2,00291e-011<0,05
Odrzucamy więc hipotezę zerową na rzecz alternatywnej mówiącej, że parametry zmiennej Pow są różne od zera
Dla 3 kryteriów informacyjnych (AIC, BIC, HQC), 0 kryteria są lepsze.
Model 4: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)
const -515,497 144,626 -3,564 0,0026 ***
Pow 3,40027 0,313852 10,83 8,91e-09 ***
Suma kwadratów reszt 261570,4 Błąd standardowy reszt 127,8599
Wsp. determ. R-kwadrat 0,880038 Skorygowany R-kwadrat 0,872541
F(1, 16) 117,3759 Wartość p dla testu F 8,91e-09
Logarytm wiarygodności -111,7977 Kryt. inform. Akaike'a 227,5954
Kryt. bayes. Schwarza 229,3761 Kryt. Hannana-Quinna 227,8409
Autokorel.reszt - rho1 0,057290 Stat. Durbina-Watsona 1,840102
Porównanie Modelu 1 z Modelem 4:
Hipoteza zerowa: parametr regresji jest równy zero dla Plony
Statystyka testu: F(1, 15) = 221,698, z wartością p = 2,1547e-010<0,05
Odrzucamy hipotezę zerową na rzecz alternatywnej mówiącej, że parametry zmiennej Plony są różne od zera
TEST na autokorelację składnika losowego
Test Breuscha-Godfreya na autokorelację rzędu pierwszego
Zmienna zależna: uhat
const 0,749583 47,0959 0,01592 0,9875
Pow 0,0517016 0,120423 0,4293 0,6742
Plony -1,03787 3,16864 -0,3275 0,7481
uhat_1 0,419113 0,286194 1,464 0,1652
Wsp. determ. R-kwadrat = 0,132835
Statystyka testu: LMF = 2,144567,
z wartością p = P(F(1,14) > 2,14457) = 0,165
Statystyka testu: TR^2 = 2,391034,
z wartością p = P(Chi-kwadrat(1) > 2,39103) = 0,122
Ljung-Box Q' = 2,12725,
z wartością p = P(Chi-kwadrat(1) > 2,12725) = 0,145
Hipoteza zerowa mówi o braku autokorelacji składnika losowego. Wartość statystyki F(1,14) dla p=0,05 wynosi 4,60011>2,14457 więc brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji składnika losowego.
Test na heteroskedastyczność składnika losowego
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) (tylko kwadrat zmiennej)
Zmienna zależna: uhat^2
----------------------------------------------------------------
const 28503,9 8771,36 3,250 0,0063 ***
Pow -63,8400 27,3546 -2,334 0,0363 **
Plony -1203,54 841,948 -1,429 0,1765
sq_Pow 0,0678234 0,0287444 2,360 0,0346 **
sq_Plony 26,7007 17,6867 1,510 0,1550
Wsp. determ. R-kwadrat = 0,500367
Statystyka testu: TR^2 = 9,006602,
z wartością p = P(Chi-kwadrat(4) > 9,006602) = 0,060935
Hipoteza zerowa- brak heteroskedastyczności.
Chi-kwadrat(4)
prawostronne prawdopodobieństwo = 0,05
prawdopodobieństwo dopełnienia = 0,95
Krytyczna wart. = 9,48773>9,006602 brak podstaw do odrzucenia hipotezy o braku heteroskedastyczności.
Jak widać z powyższego wykresu, zbiory niewiele odbiegały od ich prognoz.
chomikSGHowy