FACULTAD DE INGENIERÍAS PROGRAMAS DE INGENIERÍA FINANCIERA E INDUSTRIAL CLASE DE ECONOMETRIA 18 DE MARZO DE 2020 CONTRAS
Views 299 Downloads 3 File size 131KB
FACULTAD DE INGENIERÍAS PROGRAMAS DE INGENIERÍA FINANCIERA E INDUSTRIAL CLASE DE ECONOMETRIA 18 DE MARZO DE 2020 CONTRASTE DE UN SUBCONJUNTO DE LOS PARAMETROS DE REGRESIÓN Profesor: Horacio Fernández C. Es frecuente en la construcción de modelos econométricos, evaluar la contribución marginal de determinado subconjunto de variables regresoras en relación con el comportamiento de la variable dependiente. Suponga que se realiza una regresión de una variable dependiente con respecto a K variables independientes utilizando un conjunto de n observaciones muéstrales, dado por:
Y 0 1 X1 2 X 2 h X h h1 X h1 k X k e El cual llamaremos Modelo Completo o de igual manera Modelo no restringido Supongamos además que para este modelo se tiene la suma de los cuadrados de los errores determinación
SSEc
y el coeficiente de
Rc2 .
Si se desea contrastar la hipótesis nula de que k h de estas variables independientes consideradas en conjunto, no afectan linealmente a la variable dependiente, dado que las demás h variables también se utilizan, se plantea el siguiente contraste de hipótesis:
H 0 : h1 h 2 k H a : j 0 para algun j
0 h 1, h 2, , k
Suponga ahora que se vuelve a estimar la regresión excluyendo estas k h variables, es decir se obtiene un nuevo modelo al cual llamaremos Modelo Reducido o de igual manera Modelo Restringido.
Y 0* 1* X1 2* X 2 h* X h e* Nota: Coloco los asteriscos, en este modelo, simplemente para mostrar que los parámetros y el error, en este nuevo modelo, no son los mismos que los del modelo completo Suponga ahora que la suma de los cuadrados de los errores es
SSER y que el coeficiente de determinación múltiple es
RR2 . La regla de decisión es rechazar la hipótesis nula H 0 si como
F
SSER SSEc k h SSEc n k 1
F f ( , k h, nk 1)
siendo F el estadístico de prueba definido
n k 1 SSER SSEc k h SSEc
Donde
SSEc : Suma de los cuadrados de los errores del modelo completo
SSER
: Suma de los cuadrados de los errores del modelo reducido
h : Número de variables del modelo reducido
Rechazar la hipótesis nula indica que al menos una de las k h variables regresoras es estadísticamente significativa, si no se rechaza la hipótesis nula, significa que las k h variables regresoras pueden excluirse del modelo porque no suministran ninguna información relevante para explicar la variable dependiente más que la que suministran las h variables regresoras.
EJEMPLOS 1. Muestre que el estadístico de prueba F definido como
F
n k 1 SSER SSEc k h SSEc se puede expresar como
F
n k 1 Rc2 RR2 k h 1 Rc2
Solución:
F n k 1 SSER SSEc k h
Recordar que
R2
SSEc
SSR SST SSE SSE SSE 1 R2 1 SST SST SST de manera que SST y por lo tanto
SSE SST (1 R 2 ) Se tiene entonces para el modelo completo que
SSEc SST (1 Rc2 ) y para el modelo reducido
SSER SST (1 RR2 ) Puesto que SST es la misma para ambos modelos pues la variable dependiente no se varia, entonces
SSER SSEc SST (1 RR2 1 Rc2 ) SST ( Rc2 RR2 )
F Reemplazando queda
n k 1 SST ( Rc2 RR2 ) k h SST (1 Rc2 ) luego
F
2 n k 1 Rc2 RR k h 1 Rc2
2. Se ajustó el siguiente modelo a una muestra de 30 familias para explicar el consumo de leche por familias
Yi 0 1 X1i 2 X 2i ei
Yi : Consumo de leche en litros por semana X 1 : Renta semanal en cientos de dólares por familia X 2 : Tamaño de la familia Se encontró que SSR 182.4 y que SSE 98.7 . Se añadió al modelo de regresión la tercera variable independiente: número de niños en edad preescolar que había en el hogar. Cuando se estimó el nuevo modelo se encontró que la suma de los cuadrados de los errores era 89.6. Contraste la hipótesis nula, de que manteniéndose todo lo demás constante, el número de niños que hay en el hogar en edad preescolar, no afecta linealmente el consumo de leche. Tome un nivel de significancia del 5% Solución:
El nuevo modelo es entonces Yi 0 1 X 1i 2 X 2i 3 X 3i
ei
y se plantea el contraste de hipótesis
H 0 : 3 0 H a : 3 0
El estadístico de prueba es entonces
F
30 3 1 98.7 89.6 2, 641 f 4, 23 3 2 89.6 , además (0.05, 1,26)
Como 2,641 < 4,23, no se rechaza la hipótesis nula a un nivel de significancia del 5%, esto indica que el número de niños en edad preescolar que hay en el hogar, no aporta información importante al modelo, y por lo tanto se puede eliminar del modelo.
2. Para los datos X Y
-2 0
-1 0
0 1
1 1
2 3
Yi 0 1 X 1i 2 X 22i ei
Se ajustó la parábola y se encontró que SSE 0,464 , ¿los datos proporcionan suficiente evidencia para afirmar que el modelo aporta información para la predicción de Y?, es decir pruebe la hipótesis
H 0 : 1 2 0
contra la alternativa H a : al menos uno de los parámetros es diferente de cero. Use un nivel de significancia del 5% Solución: El modelo reducido apropiado es
Yi 0 ei para el cual
Y
0 0 1 1 3
X
1 1 1 1 1
1
-1
T ˆ X T X ˆT X TY SSE Y Y R Se deben calcular y
X X T
Se obtiene, a partir de los datos, que X X 5 , T
X TY 1 T 5 , X Y 5 y Y T Y 11
1 5 2 1 6 0, 463 F 11,959 ˆ 5 1 f 19 20 0, 463 5 Luego y SSER 11 1 5 6 , y (0.05, 2, 2) Ahora, como 11,959 < 19, entonces no se rechaza la hipótesis nula, y se concluye entonces que no hay suficiente evidencia, a un nivel de significancia del 5%, para apoyar la afirmación de que al menos uno de los parámetros es diferente de cero. Ejercicios: 1. Un agente de bolsa está interesado en saber qué factores pueden influir en las tasas de retorno de las acciones de los bancos. Se estimó el siguiente modelo de regresión a partir de una muestra de 30 bancos
Yˆ 2.37 0.84 X 1 0.15 X 2 0.13 X 3 1.67 X 4 Y Tasa de retorno de las acciones
X 3 Préstamos concedidos
Realice el contraste concluir ?
X 1 Tasa de crecimiento de las ganancias de los
X 2 Tasa de crecimiento del
bancos
activo
1, si la central del Banco está en Bogotá X4 0, en otro caso
SST 3,881, SSR 3, 549
H 0 : 2 4 0 , donde el estimador de la varianza del modelo reducido es 0.01341. ¿ Qué puedes
2. Para los datos X Y
-3 3
-2 2
3 6
4 10
2 4
Y X X2 e
0 1 2 Se ajustó la parábola y se encontró que SSE = 0.358, ¿los datos proporcionan suficiente evidencia para afirmar que el modelo aporta información para la predicción de Y? Es decir pruebe la hipótesis
H 0 : 1 2 0
frente a la alternativa Ha: al menos uno de los parámetros es diferente de cero. Use un nivel de significancia del 3%.