Clase1

Bibliograf´ıa Introducci´ on Aspectos generales M´ etodos de estimaci´ on Elecci´ on del mejor modelo Modelos de Da

Views 182 Downloads 3 File size 540KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Modelos de Datos de Panel Lineales Mg. Heber J. Balde´ on Grupo Lambda

2017

Consistencia e inferencia

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Contenido Bibliograf´ıa Introducci´ on Definici´ on Aspectos generales Caracter´ısticas Heterogeneidad inobservable M´ etodos de estimaci´ on Estimador MCO pooled Estimador de Efectos Fijos o estimador within Estimador de Efectos Aleatorios Elecci´ on del mejor modelo Elecci´ on entre un estimador MCO pooled y un estimador EF Elecci´ on entre un estimador MCO pooled y un estimador EA Elecci´ on entre un estimador EF y un estimador EA Consistencia e inferencia Consistencia Inferencia

Consistencia e inferencia

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Bibliograf´ıa 1. Textos obligatorios Baltagi, Badi. “Econometric Analysis of Panel Data” 3rd edition, 2005. Nivel intermedio-avanzado. Hsiao, Cheng. “Analysis of Panel Data” 2nd edition. Cambridge University Press, 2002. Nivel intermedio. Arellano, Manuel. “Panel Data Econometrics” 2003. Cameron, A. Colin y Pravin K. Trivedi. “Microeconometrics. Methods and Applications” Cambridge University Press, 2005. Greene, William H. “Econometric Analysis” 6th edition, 2008. Wooldridge, Jeffrey M. “Econometric Analysis of Cross Section and Panel Data” Massachusetts Institute of Technology, 2002. 2. Referencias Baltagi, B.H. & J.M. Griffin (1983). “Gasoline demand in the OECD: An application of pooling and testing procedure”. European Economic Review. Guill´en, J. (2001). “Morosidad crediticia y tama˜ no: Un an´ alisis de la crisis bancaria”. Banco Central de Reserva del Per´ u. Aparicio, C., Jaramillo, M. y San Roman, C. (2011) “Desarrollo de la infraestructura y reducci´ on de la pobreza: El caso peruano”. CIES.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Econometr´ıa [Powel Ciompa (1910), Frisch Ragnar (1926)] • Modelos de Corte Transversal (Moore, Cowles Commission, Haavelmo,

Timberger, entre otros) yi = α + βxi + εi . Fuente de variabilidad: datos “transversales” Limitaciones inherentes: (i) no captura la dependencia intertemporal entre variables, (ii) no puede resolver el problema de persistencia en el comportamiento. • Modelos de Series de Tiempo (Bachelier, Cochrane, Orcutt, Durbin,

Watson) yt = α + βxt + εt . Fuente de variabilidad: datos “temporales”. Limitaciones: no se encuentran relaciones causales. Existe una alta multicolinealidad. • Modelos de Data Panel (Deaton, Hsiao, Baltagi, Arellano, Pesaran)

yit = α + βxit + νit Fuente de variabilidad: datos es “transversal” y “temporal”.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

¿Qu´ e son los Datos de Panel? Concepto Los datos de panel (o datos longitudinales) consiste en observaciones • de un corte transversal de unidades individuales (hogares, empresas,

pa´ıses, entre otros) • repetidas sobre el tiempo

Algunos ejemplos de bases de datos de tipo panel: • PSID (Panel Study of Income Dynamics) • ECHP (European Community Household Panel) • SHIW (Survey on Household Income and Wealth) • FES (Family Expenditure Survey) • ENAHO panel • International Financial Statistics • Penn World Table • Paneles de estados americanos, de pa´ıses, etc.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Caracter´ısticas de las bases de datos tipo Panel • Una base de datos posee las siguientes caracter´ısticas



Panel corto T pequeno (Micropaneles) Panel largo T grande (Macropanels)  Panel balanceados → N ×T Panel = Panel no − balanceado → 6= N × T

Panel =

2 sW =

XX 1 (xit − x¯i )2 NT − 1 i t

sB2 = sO2 =

1 X (¯ xi − x¯)2 N −1 i

XX 1 (xit − x¯)2 NT − 1 i t

• En general, los datos se observan a intervalos regulares de tiempo. • La selecci´ on muestral debe ser aleatoria (no correlacionada con los

regresores) para que los estimadores sean consistentes.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

¿Por qu´ e NO deber´ıamos utilizar los Modelos de Datos de Panel?

Desventajas de utilizar datos de panel • Problemas de Dise˜ no y Recolecci´ on de los datos. • Distorsiones en los errores de medici´ on • Problemas de Selecci´ on i. Problemas de autoselecci´ on ii. No respuesta iii. Atricci´ on • Los economistas que utilizan datos de panel o cualquier informaci´ on,

tienen que estar conscientes de las limitaciones de la base de datos (Griliches, 1986).

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

¿Por qu´ e deber´ıamos utilizar los Modelos de Datos de Panel? Beneficios de utilizar datos de panel Hsiao (2003) y Klevmarken (1989) sostienen que los beneficios de utilizar datos de panel son: • Incrementa la eficiencia de los estimadores.

N × T observaciones ⇒ ↓ Fuentes de colinealidad. • Amplia el rango de estudios, es mejor para estudiar las din´ amicas de ajuste.

Ejm: Desempleo transitorio y permanente, Pobreza transitoria o cr´ onica. • Reduce el sesgo por agregaci´ on. • Amplia la formas de inferencia asint´ otica: • NT → ∞ • N → ∞, T → ∞ • N → ∞, T fijo. • T → ∞, N fijo. • Controla por heterogeneidad individual y los problemas de mala

especificaci´ on por variables omitidas o efectos no observables.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

La heterogeneidad inobservable (I) • Definici´ on: Caracter´ısticas potencialmente importantes que no pueden

observarse (medibles). Ejm: Estimaci´ on de la curva de salarios cuando existen factores no observables. wi = α + βXi + µZi + εi Pero como las variables Z no son observables entonces se estima wi = α + βXi + ui y ui = µZi + εi . Que problema surge? Si E (µi Xi ) 6= 0 ⇒ Los βˆMCO ser´ an inconsistentes • Tipos de heterogeneidad:

Modelo general: yit = α + βit Xit + uit donde uit = µZi + λKt +εit , εit v IID(0, σν2 ) |{z} |{z} µi

λt

Modelo restringido: yit = α + βXit + uit donde uit = µi + λt + εit , εit v IID(0, σε2 ) yit = α + βXit + µi + εit (one-way) yit = α + βXit + µi + λt + εit (two-way)

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

La Heterogeneidad Inobservable (II) 1. Si Corr (µi , X ) = 0 yit = α + βXit + uit donde uit = µi + εit . Estimamos un Modelo de Efectos Aleatorios 2. Si Corr (µi , X ) 6= 0 yit = α + βXit + uit donde uit = µi + εit . Estimamos un Modelo de Efectos Fijos

Figura: Efectos fijos Corr (µi , X ) > 0

Figura: Efectos fijos Corr (µi , X ) < 0

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Estimador MCO pooled

Los modelo y m´etodos de estimaci´ on corresponden a paneles lineales, cortos y balanceados. • Estimador MCO pooled

yit = α + Xit0 β + uit donde uit = µi + λt +εit , εit v IID(0, σε2 ) |{z} |{z} 0

0

O demodo  matricial y = Z δ + u, donde yNT ×1 , Z = [iNT X ]NT ×(K +1) , α δ= y uNT ×1 β (K +1)×1 δˆMCOC = (Z 0 Z )−1 (Z 0 y )

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Estimador de Efectos Fijos o estimador “within” Mundlak (1961) y Wallace y Hussain (1969)

• Supuesto clave: λt = constante • Dado un modelo yit = α + Xit β + µi + εit . . . (i)

donde εit ∼ IID(0, σε2 ) P P P y¯i = T1 Tt=1 yit , X¯i = T1 Tt=1 Xit , α ¯ = T1 Tt=1 α = α, P P µ¯i = T1 Tt=1 µi = µi y ε¯i = T1 Tt=1 εi entonces expresamos el modelo en medias: y¯i = α + X¯i β + µi + ε¯i . . . (ii) Si restamos (i) − (ii), tenemos: (yit − y¯i ) = (Xit − X¯it )0 β + (εit − ε¯i ) • Por lo tanto el estimador:

" βˆEF =

T N X X (Xit − X¯i )(Xit − X¯i )0 i=1 t=1

#−1 "

# T N X X ¯ (Xit − Xi )(yit − y¯i ) i=1 t=1

Matricialmente: y = αiNT + X β + Zµ µ + , donde Zµ = IN ⊗ iT βˆEF = (X 0 QX )−1 X 0 Qy Donde Q = INT − Zµ (Zµ0 Zµ )−1 Zµ0 ;

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Modelo de Efectos Fijos • Se estima α e = y − βˆEF X y luego se calcula los efectos inobservables con:

µ ˆi = y¯i − α e − βˆEF X¯i . ˆ • Var (βEF ) = σε2 (X 0 QX )−1 = σε2 (X 0 X )−1 βˆEF

Estimadores de Errores est´ andar robustos • Cuando hay heteroscedasticidad y/o autocorrelaci´ on, los estimadores son

insesgados pero no eficientes. Y la varianza del estimador es inconsistente. Si yi = Zi δ + µi iT + εi . Y, E(εi ε0i ) = Ωi y E(εi ε0j ) = 0 para i 6= j βˆEF = (X 0 QX )−1 X 0 Qy N 1/2 (βˆEF − β) ∼ N(0, M −1 VM −1 ) N X ei0 uei uei 0 X ei ](X 0 QX )−1 Var (βˆEF ) = (X 0 QX )−1 [ X i=1

ei βˆEF y X ei = (IT − J T )X Donde: uei = yei − X

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Limitaciones del estimador de Efectos Fijos

• Problema de Par´ ametro Incidental (Neyman y Scott, 1948): Cuando el

panel es corto y hay un gran n´ umero de observaciones (N alto) se debe estimar un elevado n´ umero de interceptos, reduciendo los grados de libertad. Por lo que el estimador de µ no es consistente pero es insesgado. • Al controlar los factores individuales fijos no identificamos su influencia

espec´ıfica sobre el fen´ omeno explicado. • No permite hacer inferencia fuera de la muestra. Qu´ e efecto espec´ıfico

atribuimos a un “nuevo” individuo. • Las estructuras din´ amicas generan estimadores sesgados. Ejm:

yit = α + γyit−1 + βXit + µi + εit La transformaci´ on para calcular el estimador EF es (yit − y i ) = γ(yit−1 − y i∗ ) + β(Xit − X i ) + (εit − εi ) Problema: Cov (εit − εi , yit−1 − y i∗ ) 6= 0 ⇒ γ es sesgado. Soluci´ on: VI.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Estimador “between”

Tambi´en conocido como estimador entre grupos. • El estimador “between” explota s´ olo la variaci´ on temporal, es decir los

datos y¯i , X¯i1 , X¯i2 , ..., X¯ik . • Resulta de estimar por MCO el modelo (especificaci´ on):

y¯i = α + β1 X¯i1 + β2 X¯i2 + ... + βk X¯ik + ε¯i • En la pr´ actica apenas se utiliza porque el estimador “pooled” y el

estimador de efectos aleatorios son superiores. • Son m´ as eficientes asint´ oticamente.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Estimador de Efectos Aleatorios Balestra y Nerlove (1966)

Tambi´en conocido como Modelo de Componentes del Error. Corresponde a: yit = α + Xit β + uit uit = µi + εit Donde µ es una variable aleatoria para cada individuo. µ ∼ IID(0, σµ2 ) ε ∼ IID(0, σε2 ) Por lo tanto, como µ forma parte del t´ ermino de error que ahora tiene 2 componentes. Este modelo es apropiado para muestras aleatorias (Balestra y Nerlove, 1966).

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Estimador de Efectos Aleatorios

Supuestos: • E(µi /Xit ) = 0 (Supuesto de ortogonalidad, exogeneidad) • E(εit /Xit ) = 0 (Supuesto de ortogonalidad, exogeneidad) 2 • V (µi ) = σµ (Homoscedasticidad)

• V (εit ) = σε2 (Homoscedasticidad) • E(µi , µj ) = 0, i 6= j No autocorrelaci´ on en µ. • E(εit , εjs ) = 0, i 6= j, s o t No autocorrelaci´ on en εit . • E(µi , εit ) = 0 No autocorrelaci´ on entre µ y ε.

Sin embargo: • V (uit ) = Ω = IN ⊗ Σ

Consistencia e inferencia

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Matriz de Varianza y Covarianza V (uit ) = Ω = IN ⊗ Σ    Ω = V (uit ) = E(uit uit0 ) =      0 Σ = E(u1t u1t )= 

σµ2 + σε2 σµ2 .. . σµ2

Σ 0 .. . 0

0 Σ .. . 0

σµ2 σµ2 + σε2 .. . σµ2

··· ··· .. . ··· ··· ··· .. . ···

0 0 .. . Σ

    

σµ2 σµ2 .. . σµ2 + σε2

    

Donde Σ es una matriz sim´etrica y semidefinida positiva. Σ = σµ2 ii0 + σε2 IT Si: cov (uit , ujs ) = σµ2 + σε2 ⇒ ρ = correl(uit , ujs ) = 1 para i = j, t = s Si: cov (uit , ujs ) = σµ2 ⇒ ρ = correl(uit , ujs ) =

2 σµ 2 +σ 2 σµ ε

para i = j, t 6= s

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Estimador EA (I) El estimador MELI de β es: βˆMCG = (X 0 Ω−1 X )−1 X 0 Ω−1 y Ω = E(uu 0 ) = Zµ E(µµ0 )Zµ0 + E(εε0 ) Ω = σµ2 (IN ⊗ JT ) + σε2 (IN ⊗ IT ) Ω = (T σµ2 + σε2 )(IN ⊗ J T ) + σε2 (IN ⊗ ET ) = σ12 P + σε2 Q {z } | σ12

De acuerdo a Wansbeek y Kapteyn (1982, 1983): Ω−1 = Ω−1/2 =

1 1 P + 2Q σε σ12 1 1 P+ Q σ1 σε

Consistencia e inferencia

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Estimador EA (II) Fuller y Battese (1973, 1974) sugiere aplicar MCG, transformando la regresi´ on y ∗ = σε Ω−1/2 y cuyo elemento t´ıpico es yit − θy¯i sobre el vector de regresores xit − θ¯ xi donde: r σ2 θ = 1 − T σ2 ε+σ2 , µ

σ b12

=

u 0 Pu tr (P)

=T

u 2i. i=1 N

PN

y

σ bε2

=

ε

u 0 Qu tr (Q)

=

PN

i=1

PT

2 t=1 (uit −u it ) N(T −1)

M´ınimo Cuadrados Generalizado Factibles (MCGF) • Estimador de Wallace-Hussain (1969): Utiliza los u bOLS • Estimador de Amemiya (1971): Sugiere utilizar los u ewithin • Estimador de Swamy y Arora (1972): Utilizando las regresiones within y

between estima las varianzas mediante: 2 b σ bε = [y 0 Qy − y 0 QX (X 0 QX )−1 X 0 Qy ]/[N(T − 1) − K ] 2 b σ b1 = [y 0 Py − y 0 PX (Z 0 PZ )−1 Z 0 Py ]/[N − K − 1]

• Estimador de M´ axima Verosimilitud Iterativo

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Prueba F

Considerando el modelo de Efectos Fijos (within) en forma matricial: y = iNT α + X β + Zµ µ + ε Donde Z es un matriz con N − 1 variable binarias. Bajo el supuesto: H0 : µ1 = µ2 = µ3 = . . . = µN−1 = 0 (ausencia de efectos fijos) Esto puede evaluarse con una Prueba F de significancia conjunta de las N-1 variables binarias. 2 2 (REF − RMCOC )/N − 1 ∼ FN−1,NT −N−k F = 2 (1 − REF )/NT − N − k

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Prueba Breush-Pagan (1980)

Luego de estimar el modelo MCO combinado y EA, contrastar la hip´ otesis: Bajo el supuesto: H0 : Cov (µi ) = 0 Alternativamente, H1 : Cov (µi ) 6= 0 LM = [ LM1 =

∂ 2 L −1 ∂L ∂L ]0[ ] [ ] ∼ χ2 ∂θ0 ∂θ∂θ0 ∂θ0

ue0 (IN ⊗ JT )e u NT [1 − ] ∼ χ21 2(T − 1) ue0 ue

Donde: ue son los residuos OLS.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Prueba de Hausman Luego de estimar el modelo de EF y EA, contrastar la hip´ otesis: Bajo el supuesto: H0 : Heterogeneidad es aleatoria y no correlacionada con Xit (EA es consistente y eficiente, EF es consistente pero menos eficiente) H1 : Heterogeneidad es aleatoria y correlacionada con Xit (EF es consistente y eficiente, EA es inconsistente) Alternativamente, H0 : Cov (Xit , µi ) = 0 (Efectos aleatorios) H1 : Cov (Xit , µi ) 6= 0 (Efectos fijos)

H=

[βˆEA − βˆEF ]2 ∼ χ2k V (βˆEA ) − V (βˆEF )

Donde k es el n´ umero de par´ ametros

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Consistencia

1. Modelo de efectos fijos Si εit ∼ IID(0, σε2 ) y E(εit /Xit ) = 0. βˆEF es un estimador insesgado y consistente si se verifica que NTi → ∞ (Ti puede ser fijo y cumplirse que N → ∞), mientras que a µ bi es insesgado pero no ser´ a consistente salvo que se cumpla que Ti → ∞ para cada unidad i. 2. Modelo de efectos aleatorios En la pr´ actica, se tiene que trabajar con el estimador de MCGF, el cual usa estimaciones consistentes del par´ ametro θi . Generalmente se utiliza como estimaci´ on de la varianza σw2 la varianza residual obtenida del estimador within multiplicada por el factor (NT − k)/(NT − N − k), y σ2

como estimaci´ on de la varianza σµ2 el valor σw2 − Tb donde σb2 es la varianza residual estimada del estimador between. El estimador MCGF resultante ser´ a asint´ oticamente (NT → ∞) el mejor estimador lineal consistente y se distribuir´ a normalmente.

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

M´ etodos de Estimaci´ on de Modelos de Datos de Panel

Figura: Consistencia de los estimadores

Consistencia e inferencia

Bibliograf´ıa

Introducci´ on

Aspectos generales

M´ etodos de estimaci´ on

Elecci´ on del mejor modelo

Consistencia e inferencia

Inferencia

Inferencia La inferencia que se realicen ser´ a respecto a la poblaci´ on y no respecto a la muestra aleatoria extra´ıda. Por el contrario, el modelo de efectos fijos es m´ as apropiado cuando el an´ alisis se centra sobre un conjunto espec´ıfico de N unidades, y la inferencia que se haga ser´ a condicional al comportamiento de dicho conjunto particular.