UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA PROFESIONAL DE ECONOMÍA APUNTES DE CLASE CAPÍTULO 8: ANÁLISIS DE REGRESIÓN MÚL
Views 100 Downloads 2 File size 931KB
UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA PROFESIONAL DE ECONOMÍA
APUNTES DE CLASE CAPÍTULO 8: ANÁLISIS DE REGRESIÓN MÚLTIPLE: EL PROBLEMA DE LA INFERENCIA ECONOMETRÍA 2
WILHEM ROOSVELT GUARDIA VÁSQUEZ
Econometría.weebly.com Wilhem.weebly.com
EJERCICIO APLICATIVO La siguiente tabla ofrece datos sobre la mortalidad infantil (MI), la tasa de analfabetismo femenina (TANF), el PBI percápita (PBIPC) y la tasa de la población con acceso sostenible a mejores fuentes de abastecimiento de agua potable y saneamiento para 32 países de América Latina y el Caribe.
Mortalidad infantil, tasa de analfabetismo y datos relacionados de 32 países Obs Países MI TANF PBIPC PAS 1 Antillas Neerlandesas 89 15.0 3.0 11964.5 2 Argentina 15.0 2.7 5497.9 91 3 Bahamas 15.3 3.3 18974.4 100 4 Barbados 12.3 0.2 11096.7 100 5 Belice 18.5 5.2 4268.9 47 6 Bolivia 55.6 17.0 1159.5 46 7 Brasil 27.3 11.0 5616.2 75 8 8.0 3.6 8873.3 91 Chile 9 Colombia 20.5 6.9 3219.7 86 10 Costa Rica 10.5 3.7 5053.2 92 11 Cuba 6.1 2.8 2884.7 98 12 Ecuador 24.9 8.3 3088.8 89 13 El Salvador 26.4 21.2 2668.2 62 14 Granada 4 37.7 5315.9 96 15 Guatemala 38.6 35.4 2353.4 86 16 Guyana 49.4 1.3 1218.5 70 17 Haití 56.1 46.8 525.2 30 18 Honduras 31.2 21.7 1542.9 69 19 Jamaica 14.6 7.7 3796.1 80 20 México 20.5 9.1 7975.7 79 21 Nicaragua 26.4 31.6 958.6 47 22 Panamá 20.6 7.6 5218.9 73 23 Paraguay 35.5 6.4 1500.9 80 24 30.3 12.3 3351.5 63 Perú 25 Puerto Rico 20741 8.1 5.1 94 26 República Dominicana 34.9 14.4 3711.5 78 27 San Vicente y las Granadinas 7.5 26.7 4186.2 78 28 Santa Lucía 12.3 4624 14.6 89 29 Suriname 15.9 31.8 3812.5 94 30 Trinidad y Tabago 15.1 1.7 13660.8 100 31 Uruguay 14.4 1.6 5808.6 100 32 Venezuela 18.9 6.2 6733.9 68 Fuente: CEPAL MI: Tasa de mortalidad infantil por quinquenios 2000-2005; número de defunciones de niños menores de 1 año de edad por cada mil nacidos vivos TANF: Tasa de analfabetismo femenino de 15 y más años de edad, 2005 PBIPC: PBI percápita en millones de dólares a 2006 PAS: Población con acceso sostenible a mejores fuentes de abastecimiento de agua potable y a mejores servicios de saneamiento, en % a 2006.
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
PREGUNTAS a)
A priori, ¿Cuál es la relación esperada entre la mortalidad infantil y cada una de las demás
variables? Sustente su respuesta utilizando la matriz de correlación. 4
b)
Haga la regresión de la mortalidad infantil sobre la tasa de analfabetismo femenina y el PBI
percápita 𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 y obtenga los resultados habituales de una regresión. Interprete los resultados. 6
c)
Del apartado b) analice si los coeficientes parciales son estadísticamente significativos,
individualmente, al 1%, 5% y 10% de significancia. Calcule el intervalo de confianza para los mismos al 99 % de confianza. 7
d)
Del apartado b) establezca un intervalo de confianza para 𝜎𝑢2 al 99 por ciento de confianza.
Contraste 𝐻0 : 𝜎𝑢2 = 100 frente a 𝐻𝑎 : 𝜎𝑢2 < 100 al 5 por ciento significancia. 8 e)
Del apartado b) calcule la matriz de varianzas-covarianzas de los estimadores. Interprete los
resultados. 9
f)
Interprete el coeficiente de determinación ajustado. Construya la tabla ANOVA y a partir de ésta
contrastar la significatividad conjunta del modelo 𝐻0 : 𝑅2 = 0 frente a
𝐻𝑎 : 𝑅2 > 0 al 1%, 5% y
10 % de significancia. Interprete los resultados. 9
g)
Realizar los siguientes contrastes de hipótesis: 𝐻0 : 𝛽2 = 1; 𝐻0 : 𝛽3 = −0.005
𝐻0 : 𝛽2 + 𝛽3 =
0.60 al 1% de significancia (análisis: dos colas). Para cada caso muestre el F estadístico con su respectiva probabilidad. Pista: Utilice el contraste de Wald. 11
h)
Haga la regresión de la mortalidad infantil sobre la tasa de analfabetización femenina, el PBI
percápita y población con acceso sostenible a mejores fuentes de abastecimiento de agua, es decir, 𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑏4 𝑃𝐴𝑆 + 𝑒 y obtenga los resultados habituales. Construya la tabla ANOVA incremental y a partir de ésta decidir si merece la pena añadir la variable PAS al 1%, 5% y 10% de significancia. ¿Cuáles son las consecuencias de añadir la variable PAS?. 23
Página | 3
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
RESPUESTAS a) A priori, ¿Cuál es la relación esperada entre la mortalidad infantil y cada una de las demás variables? Sustente su respuesta utilizando la matriz de correlación. La relación entre la Mortalidad Infantil y la tasa de analfabetismo es positiva. Ceteris Paribus, si la tasa de analfabetismo (TANF) se reduce, la mortalidad infantil (MI) también se reduce. El coeficiente de correlación entre MI y TANF es 0.597910. Matriz de correlación entre la variable endógena (MI) y las variables exógenas MI TANF PBIPC PAS MI 1.000000 0.597910 -0.571548 -0.615720 TANF 0.597910 1.000000 -0.469010 -0.643984 PBIPC -0.571548 -0.469010 1.000000 0.537318 PAS -0.615720 -0.643984 0.537318 1.000000 Fuente: elaboración propia en base a los datos de la CEPAL
Mortalidad Infantil (defunciones de niños menores de 1 año por cada mil nacidos)
MortaIidad Infantil vs. Tasa de analfabetismo femenino en América Latina y el Caribe. 60 Haití Bolivia
50
Guyana
40 Perú
30
20
10 Chile Coeficiente de correlación = 0.5979
0 0
10
20
30
40
50
Tasa de analfabetismo femenino de 15 y más años de edad Elaboración propia Fuente: CEPAL
Página | 4
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
La relación entre la MI y el PBI percápita es negativa. Ceteris Paribus, si el ingreso por habitante aumenta, la mortalidad infantil se reduce. El coeficiente de correlación de entre MI y PBIPC es -0.571548.
Mortalidad Infantil vs PBI percápita en América Latina y el Caribe 2005-2006 MI (defunciones de niños menores de 1 añopor cada mil nacidos vivos)
60
Coeficiente de correlación = -0.5715
Haití Bolivia
50
40
30
Perú
20
10
Puerto Rico
Chile
0 0
5000 Elaboración propia Fuente: CEPAL
10000
15000
20000
25000
PBI percápita (millones de US$)
La relación entre la Mortalidad Infantil y la población con acceso sostenible a mejores fuentes de abastecimiento de agua potable (PAS) es negativa. Ceteris Paribus, si la población tiene mejor acceso a los servicios básicos como el agua dentro de la vivienda, tenderá a contraer menos enfermedades y por ende la mortalidad infantil se reducirá. El coeficiente de correlación entre MI y PAS en -0.615720.
Página | 5
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Mortalidad infantil (defunciones de niños menores de 1 año por cada 1000 nacidos vivos)
Mortalidad Infantil ve rs us población con m e jore s fue nte s de abas te cim ie nto de agua e n Am é rica Latina y e l Caribe 2005-2006 60 Haití Bolivia
50
40
30
Perú
20
10 Chile Cuba
0
Coef iciente de correlación=-0.6157 20
30
40
50
60
70
80
90
100
% de Población con acceso a mejores fuentes de abastecimiento de agua Elaboración propia Fuente: CEPAL
b) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetismo femenina y el PBI percápita 𝑴𝑰 = 𝒃𝟏 + 𝒃𝟐 𝑻𝑨𝑵𝑭 + 𝒃𝟑 𝑷𝑩𝑰𝑷𝑪 + 𝒆 y obtenga los resultados habituales de una regresión. Interprete los resultados.
Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC
24.62648 0.517040 -0.001002
4.098870 0.187835 0.000412
6.008114 2.752625 -2.429457
0.0000 0.0101 0.0215
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.466149 0.429331 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.513158 7.650571 12.66113 0.000112
Página | 6
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
MI = 24.62647915 + 0.5170397354*TANF - 0.001001908156*PBIPC+RESID Interpretación Si la tasa de analfabetismo femenino de 15 y más años de edad se incrementa en 1 por ciento (Ceteris paribus), la tasa de mortalidad infantil aumenta en 0.52 por ciento. Si el PBI percápita aumenta en 1 dólar (ceteris paribus), la tasa de mortalidad infantil disminuye en 0.001 por ciento.
c) Del apartado b) analice si los coeficientes parciales son estadísticamente significativos, individualmente, al 1%, 5% y 10% de significancia. Calcule el intervalo de confianza para los mismos al 99 % de confianza. El punto de corte es significativo al 1%, 5% y 10% de significancia. La pendiente de la tasa de analfabetismo es significativo al 5% y 10% pero no al 1% de significancia. La pendiente del PBI percápita es significativo al 5% y 10% pero no al 1% de significancia. 1
Intervalo de confianza (𝛼 = 1%)
99% Región de no rechazo
t 29
RA
RA 0.005 -2.76
0.005 2.76
Como el valor de la t student 𝑡0.005 para n-k=32-3=29 grados de libertad, tenemos que los intervalos de confianza al 99% para los parámetros estimados serán:
1
Análisis de dos colas. Scalar z1=@qtdist(0.995,29)=2.75638590367. Scalar z2=@qtdist(0.005,29)=-2.75638590367
Página | 7
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ 24.62648
2.76(4.098870)
0.517040
2.76(0.187835)
-0.001002
2.76(0.000412)
d) Del apartado b) establezca un intervalo de confianza para 𝝈𝟐𝒖 al 99 por ciento de confianza. Contraste 𝑯𝟎 : 𝝈𝟐𝒖 = 𝟏𝟎𝟎
frente a 𝑯𝒂 : 𝝈𝟐𝒖 < 100 al 5 por ciento
significancia. 𝜎𝑢2 =
𝑆𝑅𝐶 2845.566 = = 98.12296552 𝑛−𝑘 32 − 3
2 2 u u Pr ob (n k ) u2 (n k ) b a
1
El valor de a y b lo obtendremos de la tabla estadística Se sabe que2
Pr ob(a n2k b) 1 2 Pr ob(13.121148888 29 52.3356177859) 99%
Por lo tanto
98.1229 98.1229 Pr ob (32 3) u2 (32 3) 99% 52.3356 13.1211 𝑃𝑟𝑜𝑏 54.3714992 ≤ 𝜎𝑢2 ≤ 216.8686619 = 99% Es decir, en aplicaciones prácticas, 95 de cada 100 intervalos incluirán el auténtico 𝜎𝑢2 .
2
Análisis de dos colas. Scalar z3=@qchisq(0.995,29)=52.3356177859. Scalar z4=@qchisq(0.005,29)=13.121148888
Página | 8
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
e) Del apartado b) calcule la matriz de varianzas-covarianzas de los estimadores. Interprete los resultados. 𝑏1
𝑏2
𝑏3
𝑏1
16.80074
-0.578069
-0.001347
𝑏2
-0.578069
0.035282
3.63E-05
𝑏3
-0.001347
3.63E-05
1.70E-07
La diagonal principal del Var-cov(𝛽𝑗 ) es la varianza de los estimadores. Por ejemplo Var(b1)=16.80074, var(b2) 0.035285, var(b3)=0.000000170. Por encima o por debajo de la diagonal
principal
son
las
covarianzas
de
los
estimadores.
Por
ejemplo
Cov(b1,b2)=-0.578069.
f)
Interprete el coeficiente de determinación ajustado. Construya la tabla ANOVA y a partir de ésta contrastar la significatividad conjunta del modelo 𝑯𝟎 : 𝑹𝟐 = 𝟎 frente a
𝑯𝒂 : 𝑹𝟐 > 0 al 1%, 5% y 10 % de significancia. Interprete los resultados.
El valor de 𝑅 2 ajustado es 0.429361, es decir, el42.94% de la variación de la mortalidad infantil está explicada por las variables independientes (Tasa de analfabetismo femenina, PBI percápita). TABLA ANOVA
Análisis de la varianza para contrastar la significatividad del conjunto de regresores del modelo (Excluido el término independiente)
Fuente de variación
Suma al cuadrado
Grados de libertad
Explicado por la regresión, TANF, PBIPC
0.466149
2
0.533851
29
1
31
No explicada por la regresión Total
Suma de cuadrados medios
0.466149 𝑄1 = 2 = 0.2330745 0.533851 𝑄2 = = 0.01841 29
F* 𝑄1 𝑄2 = 12.66 𝐹 ∗=
-
Página | 9
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
𝐻0 : 𝑅2 = 0 𝐻𝑎 : 𝑅2 > 0
F(2,29)
10% 5% 1% 2.50
3.33
5.43
Dado que 𝐹 ∗ es mayor que los puntos críticos para cada nivel de significancia, se rechaza la hipótesis nula.
TABLA ANOVA EN EVIEWS
Página | 10
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ Wald Test: Equation: EQ01 Test Statistic
Value
F-statistic Chi-square
12.66113 25.32225
df
Probability
(2, 29) 2
0.0001 0.0000
Value
Std. Err.
Null Hypothesis Summary: Normalized Restriction (= 0) C(2) C(3)
0.517040 -0.001002
0.187835 0.000412
Restrictions are linear in coefficients.
g) Realizar los siguientes contrastes de hipótesis: 𝑯𝟎 : 𝜷𝟐 = 𝟏; 𝑯𝟎 : 𝜷𝟑 = −𝟎. 𝟎𝟎𝟓 𝑯𝟎 : 𝜷𝟐 + 𝜷𝟑 = 𝟎. 𝟔𝟎 al 1% de significancia (análisis: dos colas). Para cada caso muestre el F estadístico con su respectiva probabilidad. Pista: Utilice el contraste de Wald. ********************************************************************** Método de la prueba “t”3 𝑡=
𝑏2 − 𝛽2 0.517040 − 1 = = −2.571192802 𝑠𝑒(𝑏2 ) 0.187835
99% Región de no rechazo
t 29
RA
RA 0.005 -2.76
0.005 2.76
El valor del estadístico t pertenece a la región de no rechazo. Por lo tanto, no se debe rechazar la hipótesis nula al 1% de significancia.
3
Para una descripción más detallada de esta prueba véase Damodar Gujarati. Econometría. Cuarta Edición. Págs. 255-257.
Página | 11
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Observe: 2 𝑡29 = 𝐹 1,29 = (−2.571192802)2 = 6.611032426
Método de la prueba “F”: Mínimos cuadrados restringidos
4
Mínimos cuadrados sin restringir
𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC
24.62648 0.517040 -0.001002
4.098870 0.187835 0.000412
6.008114 2.752625 -2.429457
0.0000 0.0101 0.0215
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.466149 0.429331 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.513158 7.650571 12.66113 0.000112
Mínimos cuadrados restringidos
𝐻0 : 𝛽2 = 1 𝐻𝑎 : 𝛽2 ≠ 1 𝑀𝐼 = 𝑏1 + 1𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 𝑀𝐼 − 𝑇𝐴𝑁𝐹 = 𝑏1 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒
4
Véase Damodar Gujarati. Econometría. Cuarta Edición. Págs. 258-261.
Página | 12
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Dependent Variable: MI-TANF Method: Least Squares Date: 09/12/08 Time: 17:40 Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PBIPC
16.71355 -0.000505
2.949642 0.000397
5.666297 -1.271545
0.0000 0.2133
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.051138 0.019509 10.79237 3494.259 -120.4963 2.499406
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
13.85313 10.89922 7.656018 7.747626 1.616827 0.213305
Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, 𝑆𝑅𝐶𝑟 − 𝑆𝑅𝐶 𝑐 𝐹 = = 𝐹 𝑐, 𝑛 − 𝑘 𝑆𝑅𝐶 𝑛−𝑘 ∗
Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: 𝑆𝑅𝐶𝑟 : Suma de residuos al cuadrado restringido 𝑆𝑅𝐶: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo,
3494.259 − 2845.566 1 𝐹 = = 6.611021147 ≈ 𝐹 1,29 2845.566 32 − 3 ∗
En Eviews elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(2)=1. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los Página | 13
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
cálculos anteriores. La hipótesis nula no se debe rechazar al 1% de significancia5 aunque sí al 5% y 10% de significancia.
Wald Test: Equation: EQ01 Test Statistic F-statistic Chi-square
Value 6.611028 6.611028
df
Probability
(1, 29) 1
0.0155 0.0101
Value
Std. Err.
Null Hypothesis Summary: Normalized Restriction (= 0) -1 + C(2)
-0.482960
0.187835
Restrictions are linear in coefficients.
6
Método estadístico del Multiplicador de Lagrange (LM) para q restricciones de exclusión. PASOS
1. Haga la regresión de Y sobre el conjunto restringido de variables independientes y conserve los residuos. 2. Haga la regresión de Residuos sobre todas las variables independientes y obtenga la R cuadrada (𝑅𝑢2 ).
5
Obsérvese el p-value es apenas 1.55%. Dado que este último es menor que 5% y 10% de significancia se debe rechazar la hipótesis nula. 6 Para una descripción más detallada de esta prueba véase Jeffrey M. Wooldridge. Introducción a la Econometría. Págs. 171-172. 255-258.
Página | 14
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
3. Calcule el ML=n𝑅𝑢2 (el tamaño de la muestra multiplicado por la R cuadrada obtenida en el paso 2. 4. Compare el ML con el valor crítico apropiado, c , de una distribución 𝜒𝑞2 . Si ML>c, se rechaza la hipótesis nula. Mejor aun obtenga el valor p como probabilidad de que una variable aleatoria 𝜒𝑞2 exceda el valor estadístico de la prueba. Si el valor p (p-value) es menor que el nivel de significancia deseado, entonces se rechaza la hipótesis nula. En caso contrario no rechazamos la hipótesis nula. La regla de rechazo es esencialmente la misma que la de la prueba F.
En nuestro ejemplo, el modelo original está dada por:
𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒
(Sin restringir)
Bajo la hipótesis nula y alternativa
𝐻0 : 𝛽2 = 1
𝐻𝑎 : 𝛽2 ≠ 1
El modelo restringido estará dada por
𝑀𝐼 = 𝑏1 + 1𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 Ordenando:
𝑀𝐼 − 𝑇𝐴𝑁𝐹 = 𝑏1 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒
(Modelo restringido7)
Y corriendo el modelo, obtenemos:
MI-TANF = 16.714 - 0.000505*PBIPC
7
El número de restricciones es q=1.
Página | 15
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Haciendo la regresión de los residuos sobre todas las variables independientes, obtenemos el R cuadrado que se presenta en la siguiente tabla.
Dependent Variable: RESID RESTRINGO Method: Least Squares Date: 09/19/08 Time: 12:48 Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
PBIPC TANF C
-0.000497 -0.482960 7.912933
0.000412 0.187835 4.098870
-1.205915 -2.571192 1.930516
0.2376 0.0155 0.0634
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.185646 0.129483 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
5.07E-16 10.61688 7.513158 7.650571 3.305514 0.050909
A continuación calculamos el estadístico LM
ML=n𝑅𝑢2 ML=32(0.185646)=5.940672 ~ 𝜒12 𝑃𝑟𝑜𝑏 𝜒12 ≥ 5.940672 = 0.0295907530358
8
(NOTA )
Dado que el p-value es menor que 5% y 10% de significancia, se rechaza la hipótesis nula. No obstante no se debe rechazar al 1% de significancia.
8
Para calcular la probabilidad, en la zona de comandos, escribir scalar z1=2*@chisq(5.940672,1)
Página | 16
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
************************************************************************** Método de la prueba “t” 𝐻0 : 𝛽3 = −0.005 𝐻𝑎 : 𝛽3 ≠ −0.005
𝑡=
𝑏3 − 𝛽3 −0.001002 − (−0.005) = = 9.703883495 𝑠𝑒(𝑏3 ) 0.000412
𝛼 = 2 ∗ 𝑝𝑟𝑜𝑏 𝑡29 ≥ 9.703883495
= 0000000000129
99% Región de no rechazo
t 29
RA
RA 0.005
0.005
-2.76
2.76
El valor del estadístico t pertenece a la región de rechazo. Por lo tanto, se debe rechazar la hipótesis nula al 1% de significancia. El p-value es casi cero, por lo tanto se rechaza la hipótesis nula al 1%, 5% y 10% de significancia.
Método de la prueba “F”: Mínimos cuadrados restringidos
𝐻0 : 𝛽3 = −0.005 𝐻𝑎 : 𝛽3 ≠ −0.005 Mínimos cuadrados sin restringir
𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒
Página | 17
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC
24.62648 0.517040 -0.001002
4.098870 0.187835 0.000412
6.008114 2.752625 -2.429457
0.0000 0.0101 0.0215
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.466149 0.429331 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.513158 7.650571 12.66113 0.000112
Mínimos cuadrados restringidos
𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 − 0.005𝑃𝐵𝐼𝑃𝐶 + 𝑒 𝑀𝐼 + 0.005𝑃𝐵𝐼𝑃𝐶 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑒
Dependent Variable: MI+0.005*PBIPC Method: Least Squares Date: 09/12/08 Time: 18:13 Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF
56.29869 -0.337030
5.012074 0.335893
11.23261 -1.003383
0.0000 0.3237
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.032470 0.000219 20.05647 12067.86 -140.3271 1.876953
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
52.74408 20.05866 8.895442 8.987050 1.006777 0.323701
Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, 𝑆𝑅𝐶𝑟 − 𝑆𝑅𝐶 𝑐 𝐹 = = 𝐹 𝑐, 𝑛 − 𝑘 𝑆𝑅𝐶 𝑛−𝑘 ∗
Página | 18
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: 𝑆𝑅𝐶𝑟 : Suma de residuos al cuadrado restringido 𝑆𝑅𝐶: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo,
12067.86 − 2845.566 1 𝐹 = = 93.98711047 ≈ 𝐹 1,29 2845.566 32 − 3 ∗
En Eviews, elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(3)=-0.005. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los cálculos anteriores. La hipótesis nula se debe rechazar al 1%, 5% y 10% de significancia Wald Test: Equation: EQ01 Test Statistic F-statistic Chi-square
Value 93.98708 93.98708
df
Probability
(1, 29) 1
0.0000 0.0000
Value
Std. Err.
0.003998
0.000412
Null Hypothesis Summary: Normalized Restriction (= 0) 0.005 + C(3) Restrictions are linear in coefficients.
************************************************************************ Método de la prueba “t” 𝐻0 : 𝛽2 + 𝛽3 = 0.60 𝐻𝑎 : 𝛽2 + 𝛽3 ≠ 0.60 Página | 19
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
𝑡=
𝑏2 + 𝑏3 − 𝛽2 + 𝛽3 𝑠𝑒 𝑏2 + 𝑏3 𝑏2 + 𝑏3 − 0.60
𝑡=
𝑣𝑎𝑟(𝑏2 ) + 𝑣𝑎𝑟(𝑏3 ) + 2𝑐𝑜𝑣(𝑏2 𝑏3 ) Matriz de varianzas-covarianzas
𝑡=
𝑏1
𝑏2
𝑏3
𝑏1
16.80074
-0.578069
-0.001347
𝑏2
-0.578069
0.035282
3.63E-05
𝑏3
-0.001347
3.63E-05
1.70E-07
0.517040 − 0.001002 − 0.60 0.035282 + 0.00000017 + 2 ∗ 0.0000363
= −0.4465383537~𝑡29
2 Obsérvese 𝑡29 = (−0.4465383537)2 = 0.1993965013~𝐹(1,29)
99% Región de no rechazo
t 29
RA
RA 0.005
0.005
-2.76
2.76
Dado que el estadístico t pertenece a la región de no rechazo, se “acepta” la hipótesis nula.
Método de la prueba “F”: Mínimos cuadrados restringidos
𝐻0 : 𝛽2 + 𝛽3 = 0.60 𝛽2 = 0.60 − 𝛽3 𝑀𝐼 = 𝛽1 + 𝛽2 𝑇𝐴𝑁𝐹 + 𝛽3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 𝑀𝐼 = 𝛽1 + (0.60 − 𝛽3) 𝑇𝐴𝑁𝐹 + 𝛽3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 𝑀𝐼 = 𝛽1 + 0.60 ∗ 𝑇𝐴𝑁𝐹 − 𝛽3 ∗ 𝑇𝐴𝑁𝐹 + 𝛽3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 𝑀𝐼 = 𝛽1 + 0.60 ∗ 𝑇𝐴𝑁𝐹 + 𝛽3 (𝑃𝐵𝐼𝑃𝐶 − 𝑇𝐴𝑁𝐹) + 𝑒 Página | 20
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ 𝑀𝐼 − 0.60𝑇𝐴𝑁𝐹 = 𝛽1 + 𝛽3 (𝑃𝐵𝐼𝑃𝐶 − 𝑇𝐴𝑁𝐹) + 𝑒
Mínimos cuadrados restringidos Dependent Variable: MI-0.60*TANF Method: Least Squares Date: 09/12/08 Time: 19:14 Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C PBIPC-TANF
23.25046 -0.000915
2.666453 0.000359
8.719619 -2.549615
0.0000 0.0161
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.178094 0.150697 9.772634 2865.131 -117.3202 1.960459
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
18.07187 10.60426 7.457511 7.549119 6.500537 0.016134
Mínimos cuadrados sin restringir
𝑀𝐼 = 𝑏1 + 𝑏2 𝑇𝐴𝑁𝐹 + 𝑏3 𝑃𝐵𝐼𝑃𝐶 + 𝑒 Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC
24.62648 0.517040 -0.001002
4.098870 0.187835 0.000412
6.008114 2.752625 -2.429457
0.0000 0.0101 0.0215
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.466149 0.429331 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.513158 7.650571 12.66113 0.000112
Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, 𝑆𝑅𝐶𝑟 − 𝑆𝑅𝐶 𝑐 𝐹 = = 𝐹 𝑐, 𝑛 − 𝑘 𝑆𝑅𝐶 𝑛−𝑘 ∗
Página | 21
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: 𝑆𝑅𝐶𝑟 : Suma de residuos al cuadrado restringido 𝑆𝑅𝐶: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo,
2865.131 − 2845.566 1 𝐹 = = 0.1993926692 ≈ 𝐹 1,29 2845.566 32 − 3 ∗
En Eviews elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(2)+c(3)=0.60. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los cálculos anteriores. La hipótesis nula no se debe rechazar dado que el p-value es mayor que el 1% de significancia.
Página | 22
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ Wald Test: Equation: EQ01 Test Statistic
Value
F-statistic Chi-square
df
0.199397 0.199397
Probability
(1, 29) 1
0.6585 0.6552
Value
Std. Err.
Null Hypothesis Summary: Normalized Restriction (= 0) -0.6 + C(2) + C(3)
-0.083962
0.188029
Restrictions are linear in coefficients.
h) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetización femenina, el PBI percápita y población con acceso sostenible a mejores fuentes de abastecimiento de agua, es decir, 𝑴𝑰 = 𝒃𝟏 + 𝒃𝟐 𝑻𝑨𝑵𝑭 + 𝒃𝟑 𝑷𝑩𝑰𝑷𝑪 + 𝒃𝟒 𝑷𝑨𝑺 + 𝒆 y obtenga los resultados habituales. Construya la tabla ANOVA incremental y a partir de ésta decidir si merece la pena añadir la variable PAS al 1%, 5% y 10% de significancia. ¿Cuáles son las consecuencias de añadir la variable PAS?. MODELO SIN LA VARIABLE PAS Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC
24.62648 0.517040 -0.001002
4.098870 0.187835 0.000412
6.008114 2.752625 -2.429457
0.0000 0.0101 0.0215
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.466149 0.429331 9.905703 2845.566 -117.2105 1.840228
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.513158 7.650571 12.66113 0.000112
MI = 24.62647915 + 0.5170397354*TANF - 0.001001908156*PBIPC+RESID
Página | 23
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
MODELO CON LA VARIABLE PAS Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC PAS
41.12488 0.346369 -0.000777 -0.201240
11.71173 0.216288 0.000431 0.134204
3.511427 1.601423 -1.803759 -1.499500
0.0015 0.1205 0.0820 0.1449
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.505832 0.452886 9.699121 2634.043 -115.9747 1.883524
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.498416 7.681633 9.553640 0.000165
MI = 41.12487696 + 0.346368544*TANF - 0.0007769858234*PBIPC - 0.2012396009*PAS
ANÁLISIS MARGINAL DE UNA VARIABLES: PAS 𝐻0 : 𝛽4 = 0 𝐻𝑎 : 𝛽4 ≠ 0 TABLA ANOVA INCREMENTAL Fuente de variación
Suma al cuadrado
Grados de libertad
SCM
Explicada por la regresión TANF & PBIPC Explicada por la regresión TANF & PBIPC & PAS
2 𝑅𝑚 −1 = 0.466149
2
-
2 𝑅𝑘−1 = 0.505832
3
-
Incremento debido a PAS
2 2 𝑅𝑘−1 − 𝑅𝑚−1 = 0.039683
1
𝑄3 = 𝑄4 =
No explicada por la regresión
2 1 − 𝑅𝑘−1 = 0.494168
28
TOTAL
1
31
0.039683 = 0.039683 1
0.494168 = 0.01764885714 28
F*
0.039683 0.01764885714 = 2.248474203 𝐹∗ =
Prob(F*)=0.144936
-
Dado que el p-value es mayor que 𝛼 = 1%, 5%𝑦10%, no se rechaza la Hipótesis nula. Por lo tanto la variable PAS es irrelevante en el modelo. Obsérvese además 2 𝑡25 = (−1.499500)2 = 2.24850025 = 𝐹(1,28)
Es decir, se demuestra estadísticamente que el cuadrado del valor crítico de una distribución t-Student con n-k grados de libertad equivale al valor crítico de una Página | 24
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
distribución F-Snedecor con 1 y n-k grados de libertad, en el numerador y denominador, respectivamente. Ojo, n es el número de observaciones y k el número de variables explicativas incluyendo el punto de corte.
Para realizar el análisis incremental en Eviews seleccionar la opción View/Coefficient Tests/Omitted Variables-Likelihood Ratio y escribir PAS.
Omitted Variables: PAS F-statistic Log likelihood ratio
2.248499 2.471746
Probability Probability
0.144936 0.115909
Test Equation: Dependent Variable: MI Method: Least Squares Date: 09/12/08 Time: 19:43 Sample: 1 32 Included observations: 32 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C TANF PBIPC PAS
41.12488 0.346369 -0.000777 -0.201240
11.71173 0.216288 0.000431 0.134204
3.511427 1.601423 -1.803759 -1.499500
0.0015 0.1205 0.0820 0.1449
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.505832 0.452886 9.699121 2634.043 -115.9747 1.883524
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
24.40000 13.11274 7.498416 7.681633 9.553640 0.000165
Página | 25
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ
Alternativamente, podemos utilizar el contraste de Wald eligiendo la opción View/Coefficient Tests/Wald-Coefficient Restrictions… y escribir la hipótesis nula c(4)=0.
Wald Test: Equation: EQ05 Test Statistic F-statistic Chi-square
Value 2.248499 2.248499
df
Probability
(1, 28) 1
0.1449 0.1337
Value
Std. Err.
Null Hypothesis Summary: Normalized Restriction (= 0) C(4)
-0.201240
0.134204
Restrictions are linear in coefficients.
Las dos tablas anteriores nos muestran el mismo resultado calculado en la tabla Anova incremental.
Página | 26
ECONOMETRÍA 2
WILHEM GUARDIA VÁSQUEZ REFERENCIAS BIBLIOGRÁFICAS
-
Gujarati Damodar. Econometría. Cuarta Edición. Capítulo 8. Págs. 239-284.
-
Jeffrey M. Wooldrige. Introducción a la Econometría. Capítulo 5. Págs. 171-173. Capítulo 8. Págs. 255-258.
Página | 27