Model_ekonometryczny AGATA.docx

(20 KB) Pobierz

http://www.kzpr.com.pl/index.php?option=com_content&task=view&id=60&Itemid=51

Dane, którymi zamierzam się zająć dotyczą produkcji rzepaku w Polsce w latach od 1989 do 2006r. Zbiory to zmienna zależna, którą opisują plony i powierzchnia.

Zmienna objaśniana

Zbiory- zbiory rzepaku w latach 1989-2006 w tysiącach ton

Zmienne objaśniające:

Pow- powierzchnia w tysiącach ha

Plony- plony rzepaku w dt/ha

 

Model 1: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: Zbiory

 

            współczynnik  błąd standardowy  t-Studenta  wartość p

  ---------------------------------------------------------------

  const      -979,966        48,8568          -20,06    3,03e-012 ***

  Pow           2,10153       0,119443         17,59    2,00e-011 ***

  Plony        47,7064        3,20402          14,89    2,15e-010 ***

Średn.aryt.zm.zależnej  1016,988 

Odch.stand.zm.zależnej  358,1364

Suma kwadratów reszt    16576,20  

Błąd standardowy reszt  33,24274

Wsp. determ. R-kwadrat  0,992398 

Skorygowany R-kwadrat   0,991384

F(2, 15)                979,0570  

Wartość p dla testu F   1,28e-16 = =0,000000000000000128

Logarytm wiarygodności -86,96905  

Kryt. inform. Akaike'a  179,9381

Kryt. bayes. Schwarza   182,6092  

Kryt. Hannana-Quinna    180,3064

Autokorel.reszt - rho1  0,378906 

Stat. Durbina-Watsona   1,152382

Zbiory=-979,966+2,10153Pow+47,7064Plony

Statystyka F(2, 15) =979,0570   dla p<1,28e-16 = 0,000000000000000128

Stąd wynika, że ŁĄCZNIE zmienne objaśniające są statycznie istotne.

Przy przyjętym poziomie istotności na poziomie a=0,05 zarówno zmienna Pow jest statystycznie istotna, gdyż p dla ich statystyki wynosi odpowiednio 2,00e-0,11<0,05 i dla zmiennej

Plony 2,15e-0,10<0,05

 

Test Reset- prawidłowa postać funkcyjna

Pomocnicze równanie regresji dla testu specyfikacji RESET

Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: Zbiory

 

             współczynnik   błąd standardowy  t-Studenta  wartość p

  -----------------------------------------------------------------

  const     -190,351         139,258           -1,367      0,1948 

  Pow          1,00557         0,238341         4,219      0,0010   ***

  Plony       19,6776          5,18230          3,797      0,0022   ***

  yhat^2       0,000303382     0,000118272      2,565      0,0235   **

  yhat^3      -2,05122e-08     3,93052e-08     -0,5219     0,6105 

 

Statystyka testu: F = 177,318941,

z wartością p = P(F(2,13) > 177,319) = 3,68e-010=0,000000000368

177,319>0,05

Hipoteza zerowa mówi o liniowości modelu F=177,319>0,05 zatem nie mamy podstaw do odrzucenia hipotezy zerowej na rzecz alternatywnej mówiącej o nieprawidłowej postaci funkcyjnej modelu.

 

            Test RESET na specyfikację -

  Hipoteza zerowa: specyfikacja poprawna

  Statystyka testu: F(2, 13) = 177,319

  z wartością p = P(F(2, 13) > 177,319) = 3,67621e-010

Test RESET na specyfikację (tylko kwadrat zmiennej) -

  Hipoteza zerowa: specyfikacja poprawna

  Statystyka testu: F(1, 14) = 373,793

  z wartością p = P(F(1, 14) > 373,793) = 1,70135e-011

Ocena współliniowości

Ocena współliniowości VIF - czynnika powiększania wariancji

 

Minimalna możliwa wartość = 1.0

Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji

 

            Pow    2,143

          Plony    2,143

 

VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej

pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.

 

Własności macierzy X'X:

 

1-norm = 4013375,6

Wyznacznik = 3,2158409e+008

Wskażnik uwarunkowania macierzy CN = 1,1070598e-007

Wartości czynników inflacji wariancji wynoszą dla Pow-2,143 a dla Plony-2,143 i są mniejsze od 10, nie ma więc podstaw do stwierdzenia,  że między zmiennymi objaśniającymi w modelu istnieje korelacja.

 

Test rozkładu reszt

 

liczba przedziałów = 7, średnia = 3,15797e-014, odch.std. = 33,2427

 

      Przedziały       średnia   liczba   częstość  skumlowana

 

           < -23,745   -32,786        7     38,89%   38,89% *************

   -23,745 - -5,6640   -14,705        4     22,22%   61,11% *******

   -5,6640 -  12,417    3,3766        2     11,11%   72,22% ***

    12,417 -  30,498    21,458        2     11,11%   83,33% ***

    30,498 -  48,579    39,539        1      5,56%   88,89% *

    48,579 -  66,661    57,620        1      5,56%   94,44% *

          >=  66,661    75,701        1      5,56%  100,00% *

 

Hipoteza zerowa: dystrybuanta empiryczna posiada rozkład normalny. Test Doornika-Hansena (1994)- transformowana skośność i kurtoza:

Chi-kwadrat(2) = 6,128 z wartością p 0,04669

 

Test pominiętych zmiennych

Model 3: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: Zbiory

 

            współczynnik  błąd standardowy  t-Studenta  wartość p

  ---------------------------------------------------------------

  const      -938,722        219,793          -4,271    0,0006    ***

  Plony        88,8734         9,85846         9,015    1,14e-07  ***

 

Średn.aryt.zm.zależnej  1016,988   Odch.stand.zm.zależnej  358,1364

Suma kwadratów reszt    358666,5   Błąd standardowy reszt  149,7219

Wsp. determ. R-kwadrat  0,835508   Skorygowany R-kwadrat   0,825227

F(1, 16)                81,26912   Wartość p dla testu F   1,14e-07

Logarytm wiarygodności -114,6389   Kryt. inform. Akaike'a  233,2778

Kryt. bayes. Schwarza   235,0585   Kryt. Hannana-Quinna    233,5233

Autokorel.reszt - rho1 -0,167889   Stat. Durbina-Watsona   1,904125

 

Porównanie Modelu 1 z Modelem 3:

 

  Hipoteza zerowa: parametr regresji jest równy zero dla Pow

  Statystyka testu: F(1, 15) = 309,562, z wartością p = 2,00291e-011<0,05

Odrzucamy więc hipotezę zerową na rzecz alternatywnej mówiącej, że parametry zmiennej Pow są różne od zera

  Dla 3 kryteriów informacyjnych (AIC, BIC, HQC), 0 kryteria są lepsze.

 

Model 4: Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: Zbiory

 

            współczynnik  błąd standardowy  t-Studenta  wartość p

  ---------------------------------------------------------------

  const      -515,497        144,626          -3,564    0,0026    ***

  Pow           3,40027        0,313852       10,83     8,91e-09  ***

 

Średn.aryt.zm.zależnej  1016,988   Odch.stand.zm.zależnej  358,1364

Suma kwadratów reszt    261570,4   Błąd standardowy reszt  127,8599

Wsp. determ. R-kwadrat  0,880038   Skorygowany R-kwadrat   0,872541

F(1, 16)                117,3759   Wartość p dla testu F   8,91e-09

Logarytm wiarygodności -111,7977   Kryt. inform. Akaike'a  227,5954

Kryt. bayes. Schwarza   229,3761   Kryt. Hannana-Quinna    227,8409

Autokorel.reszt - rho1  0,057290   Stat. Durbina-Watsona   1,840102

 

Porównanie Modelu 1 z Modelem 4:

 

  Hipoteza zerowa: parametr regresji jest równy zero dla Plony

  Statystyka testu: F(1, 15) = 221,698, z wartością p = 2,1547e-010<0,05

Odrzucamy hipotezę zerową na rzecz alternatywnej mówiącej, że parametry zmiennej Plony są różne od zera

  Dla 3 kryteriów informacyjnych (AIC, BIC, HQC), 0 kryteria są lepsze.

 

TEST na autokorelację składnika losowego

 

Test Breuscha-Godfreya na autokorelację rzędu pierwszego

Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: uhat

 

            współczynnik  błąd standardowy  t-Studenta  wartość p

  ---------------------------------------------------------------

  const       0,749583       47,0959          0,01592    0,9875 

  Pow         0,0517016       0,120423        0,4293     0,6742 

  Plony      -1,03787         3,16864        -0,3275     0,7481 

  uhat_1      0,419113        0,286194        1,464      0,1652 

 

  Wsp. determ. R-kwadrat = 0,132835

 

Statystyka testu: LMF = 2,144567,

z wartością p = P(F(1,14) > 2,14457) = 0,165

 

Statystyka testu: TR^2 = 2,391034,

z wartością p = P(Chi-kwadrat(1) > 2,39103) = 0,122

 

Ljung-Box Q' = 2,12725,

z wartością p = P(Chi-kwadrat(1) > 2,12725) = 0,145

 

Hipoteza zerowa mówi o braku autokorelacji składnika losowego. Wartość statystyki F(1,14) dla p=0,05 wynosi 4,60011>2,14457 więc brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji składnika losowego.

 

Test na heteroskedastyczność składnika losowego

 

Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej) (tylko kwadrat zmiennej)

Estymacja KMNK, wykorzystane obserwacje 1989-2006 (N = 18)

Zmienna zależna: uhat^2

 

            współczynnik   błąd standardowy  t-Studenta  wartość p

  ----------------------------------------------------------------

  const     28503,9          8771,36            3,250     0,0063   ***

  Pow         -63,8400         27,3546         -2,334     0,0363   **

  Plony     -1203,54          841,948          -1,429     0,1765 

  sq_Pow        0,0678234       0,0287444       2,360     0,0346   **

  sq_Plony     26,7007         17,6867          1,510     0,1550 

 

  Wsp. determ. R-kwadrat = 0,500367

 

Statystyka testu: TR^2 = 9,006602,

z wartością p = P(Chi-kwadrat(4) > 9,006602) = 0,060935

 

Hipoteza zerowa- brak heteroskedastyczności.

Chi-kwadrat(4)

prawostronne prawdopodobieństwo = 0,05

prawdopodobieństwo dopełnienia = 0,95

 

Krytyczna wart. = 9,48773>9,006602 brak podstaw do odrzucenia hipotezy o braku heteroskedastyczności.

 

 

Jak widać z powyższego wykresu, zbiory niewiele odbiegały od ich prognoz.

Zgłoś jeśli naruszono regulamin