Y X X X X X e: h h h h k k

FACULTAD DE INGENIERÍAS PROGRAMAS DE INGENIERÍA FINANCIERA E INDUSTRIAL CLASE DE ECONOMETRIA 18 DE MARZO DE 2020 CONTRAS

Views 299 Downloads 3 File size 131KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

FACULTAD DE INGENIERÍAS PROGRAMAS DE INGENIERÍA FINANCIERA E INDUSTRIAL CLASE DE ECONOMETRIA 18 DE MARZO DE 2020 CONTRASTE DE UN SUBCONJUNTO DE LOS PARAMETROS DE REGRESIÓN Profesor: Horacio Fernández C. Es frecuente en la construcción de modelos econométricos, evaluar la contribución marginal de determinado subconjunto de variables regresoras en relación con el comportamiento de la variable dependiente. Suponga que se realiza una regresión de una variable dependiente con respecto a K variables independientes utilizando un conjunto de n observaciones muéstrales, dado por:

Y  0  1 X1   2 X 2    h X h   h1 X h1    k X k  e El cual llamaremos Modelo Completo o de igual manera Modelo no restringido Supongamos además que para este modelo se tiene la suma de los cuadrados de los errores determinación

SSEc

y el coeficiente de

Rc2 .

Si se desea contrastar la hipótesis nula de que k  h de estas variables independientes consideradas en conjunto, no afectan linealmente a la variable dependiente, dado que las demás h variables también se utilizan, se plantea el siguiente contraste de hipótesis:

H 0 : h1  h 2    k H a :  j  0 para algun j

0  h  1, h  2, , k

Suponga ahora que se vuelve a estimar la regresión excluyendo estas k  h variables, es decir se obtiene un nuevo modelo al cual llamaremos Modelo Reducido o de igual manera Modelo Restringido.

Y  0*  1* X1   2* X 2    h* X h  e* Nota: Coloco los asteriscos, en este modelo, simplemente para mostrar que los parámetros y el error, en este nuevo modelo, no son los mismos que los del modelo completo Suponga ahora que la suma de los cuadrados de los errores es

SSER y que el coeficiente de determinación múltiple es

RR2 . La regla de decisión es rechazar la hipótesis nula H 0 si como

F

SSER  SSEc k h SSEc n  k 1

F  f ( , k h, nk 1)



siendo F el estadístico de prueba definido

n  k  1 SSER  SSEc k h SSEc

Donde

SSEc : Suma de los cuadrados de los errores del modelo completo

SSER

: Suma de los cuadrados de los errores del modelo reducido

h : Número de variables del modelo reducido

Rechazar la hipótesis nula indica que al menos una de las k  h variables regresoras es estadísticamente significativa, si no se rechaza la hipótesis nula, significa que las k  h variables regresoras pueden excluirse del modelo porque no suministran ninguna información relevante para explicar la variable dependiente más que la que suministran las h variables regresoras.

EJEMPLOS 1. Muestre que el estadístico de prueba F definido como

F

n  k  1 SSER  SSEc  k h SSEc se puede expresar como

F

n  k  1 Rc2  RR2  k  h 1  Rc2

Solución:

F  n  k  1 SSER  SSEc k h

Recordar que

R2 

SSEc

SSR SST  SSE SSE SSE  1 R2  1  SST SST SST de manera que SST y por lo tanto

SSE  SST (1  R 2 ) Se tiene entonces para el modelo completo que

SSEc  SST (1  Rc2 ) y para el modelo reducido

SSER  SST (1  RR2 ) Puesto que SST es la misma para ambos modelos pues la variable dependiente no se varia, entonces

SSER  SSEc  SST (1  RR2  1  Rc2 )  SST ( Rc2  RR2 )

F Reemplazando queda

n  k  1 SST ( Rc2  RR2 )  k h SST (1  Rc2 ) luego

F



2 n  k  1 Rc2  RR k h 1  Rc2

2. Se ajustó el siguiente modelo a una muestra de 30 familias para explicar el consumo de leche por familias

Yi  0  1 X1i   2 X 2i  ei

Yi : Consumo de leche en litros por semana X 1 : Renta semanal en cientos de dólares por familia X 2 : Tamaño de la familia Se encontró que SSR  182.4 y que SSE  98.7 . Se añadió al modelo de regresión la tercera variable independiente: número de niños en edad preescolar que había en el hogar. Cuando se estimó el nuevo modelo se encontró que la suma de los cuadrados de los errores era 89.6. Contraste la hipótesis nula, de que manteniéndose todo lo demás constante, el número de niños que hay en el hogar en edad preescolar, no afecta linealmente el consumo de leche. Tome un nivel de significancia del 5% Solución:

El nuevo modelo es entonces Yi  0  1 X 1i   2 X 2i  3 X 3i

 ei

y se plantea el contraste de hipótesis

H 0 : 3  0 H a : 3  0

El estadístico de prueba es entonces

F

30  3  1 98.7  89.6   2, 641 f  4, 23 3 2 89.6 , además (0.05, 1,26)

Como 2,641 < 4,23, no se rechaza la hipótesis nula a un nivel de significancia del 5%, esto indica que el número de niños en edad preescolar que hay en el hogar, no aporta información importante al modelo, y por lo tanto se puede eliminar del modelo.

2. Para los datos X Y

-2 0

-1 0

0 1

1 1

2 3

Yi   0  1 X 1i   2 X 22i  ei

Se ajustó la parábola y se encontró que SSE  0,464 , ¿los datos proporcionan suficiente evidencia para afirmar que el modelo aporta información para la predicción de Y?, es decir pruebe la hipótesis

H 0 : 1  2  0

contra la alternativa H a : al menos uno de los parámetros es diferente de cero. Use un nivel de significancia del 5% Solución: El modelo reducido apropiado es

Yi   0  ei para el cual

Y

0 0    1    1   3

X

1 1   1  1 1





1

-1



T ˆ  X T X ˆT X TY SSE  Y Y   R Se deben calcular y

 X X T

Se obtiene, a partir de los datos, que X X  5 , T

X TY 1 T 5 , X Y  5 y Y T Y  11

1 5  2  1 6  0, 463 F   11,959 ˆ   5  1 f  19 20 0, 463 5 Luego y SSER  11  1  5  6 , y (0.05, 2, 2) Ahora, como 11,959 < 19, entonces no se rechaza la hipótesis nula, y se concluye entonces que no hay suficiente evidencia, a un nivel de significancia del 5%, para apoyar la afirmación de que al menos uno de los parámetros es diferente de cero. Ejercicios: 1. Un agente de bolsa está interesado en saber qué factores pueden influir en las tasas de retorno de las acciones de los bancos. Se estimó el siguiente modelo de regresión a partir de una muestra de 30 bancos

Yˆ  2.37  0.84 X 1  0.15 X 2  0.13 X 3  1.67 X 4 Y  Tasa de retorno de las acciones

X 3  Préstamos concedidos

Realice el contraste concluir ?

X 1  Tasa de crecimiento de las ganancias de los

X 2  Tasa de crecimiento del

bancos

activo

1, si la central del Banco está en Bogotá X4   0, en otro caso

SST  3,881, SSR  3, 549

H 0 :  2   4  0 , donde el estimador de la varianza del modelo reducido es 0.01341. ¿ Qué puedes

2. Para los datos X Y

-3 3

-2 2

3 6

4 10

2 4

Y   X  X2 e

0 1 2 Se ajustó la parábola y se encontró que SSE = 0.358, ¿los datos proporcionan suficiente evidencia para afirmar que el modelo aporta información para la predicción de Y? Es decir pruebe la hipótesis

H 0 : 1  2  0

frente a la alternativa Ha: al menos uno de los parámetros es diferente de cero. Use un nivel de significancia del 3%.