Notas 1

Series de Tiempo Miguel de Carvalho DEPARTAMENTO DE ESTADÍSTICA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE mdecarvalho@ma

Views 85 Downloads 2 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Series de Tiempo Miguel de Carvalho DEPARTAMENTO DE ESTADÍSTICA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE

[email protected]

§1.

INTRODUCCIÓN AL MODELAMIENTO ESTADÍSTICO DE SERIES DE TIEMPO

Parte I Introducción y Motivación

Introducción

Las series de tiempo son un tema de amplio interés en estadística con diversas aplicaciones práticas. Mientras que en muchos contextos se parte del supuesto de que los datos son una muestra aleatoria (y por consiguiente independientes) i.i.d.

Yt ∼ FY (y ),

t = 1, . . . , n,

en nuestro contexto los datos estarán ordenados en el tiempo y por tanto son a menudo dependientes. Es así importante identificar la estructura de dependencia temporal que se oculta en los datos, para por ejemplo utilizar eventos pasados para predecir eventos futuros, o extraer el comportamiento cíclico de una serie de tiempo.

Economia Estadounidense—Mercado Laboral

500 400 300 200

Initial Claims (millares)

600

700

US Department of Labor—Employment & Training Administration http://www.ows.doleta.gov

1970

1980

1990

2000

Tiempo (años) †

Nota: Datos desestacionalizados.

2010

Economia Chilena—Estadísticas Macro

106 IPC

104

110 105

IMACEC

9

102

8

100

100

7 6

Tasa de Desempleo (%)

10

115

11

108

120

Banco Central de Chile http://si3.bcentral.cl

2010

2011

2012

Tiempo (años)



2013

2008

2010

2012

Tiempo (años)

2009

2010

2011

2012

2013

Tiempo (años)

IMACEC: Indicador Mensual de Actividad Económica; IPC: Índice de Precios al Consumidor.

Índice de Precio Selectivo de Acciones (IPSA)

0.0 −0.3

−0.2

−0.1

−log Retornos IPSA

3000 2000 1000

IPSA

4000

0.1

0.2

5000

Bolsa de Comercio de Santiago http://www.bolsantiago.cl

2004

2006

2008 Tiempo (años)

2010

2012

2004

2006

2008 Tiempo (años)

2010

2012

São Paulo, Brasil—Datos de Polución Companhia de Tecnologia de Saneamento Ambiental http://www.cetesb.sp.gov.br

Kazajstán—Granjas de Producción de Grano

1980

1980

2000

1960

1980

20 15 10 5

Producción (0.1 ton.)

20 15 10 5

Producción (0.1 ton.)

20 15 10 1960

Granja 4

2000

1960

1980

2000

Granja 6

Granja 7

Granja 8

2000

1960

1980

2000

1960

1980

15 10 5

20 15 10 5

15 10 5

20 15

1980

20

Granja 5

Producción (0.1 ton.)

Tiempo

Producción (0.1 ton.)

Tiempo

Producción (0.1 ton.)

Tiempo

10

2000

1960

1980

2000

Tiempo

Granja 9

Granja 10

Granja 11

Granja 12

15 10 0

5

Producción (0.1 ton.)

15 10 5

15 10 5

15 10 5

20

Tiempo

20

Tiempo

Producción (0.1 ton.)

Tiempo

Producción (0.1 ton.)

1960

5

2000

Granja 3

Tiempo

5

Producción (0.1 ton.)

1960

Producción (0.1 ton.)

Granja 2 Producción (0.1 ton.)

20 15 10 5

Producción (0.1 ton.)

Granja 1

1960

1980 Tiempo

2000

1960

1980 Tiempo

2000

1960

1980 Tiempo

2000

1960

1980 Tiempo

2000

Bosque de Beatenberg, Suiza—Datos Atmosféricos

20 10 0 −10 −20

Temperatura Media Diaria (° C)

30

40

Langfristige Waldökosystem-Forschung http://www.wsl.ch

1998

2000

2002 Tiempo (años)

2004

2006

Alpes Suizos—Suelo Permafrost

−2 −6

−4

Temperatura (ºC)

0

2

WSL Institute for Snow and Avalanche Research http://www.slf.ch

1998

2000

2002

2004

2006

2008

2010

Tiempo (años)

Figura : Temperatura del suelo sobre diferentes profundidades.

Salud Pública en Portugal—Influenza y Gripe

200 150 100 50

Número de Muertes por Semana

250

Instituto Nacional de Saúde, Dr. Ricardo Jorge http://www.insa.pt

1980

1985

1990

1995

Tiempo (años)

2000

2005

Detalles sobre el Funcionamiento del Curso http://www.mat.puc.cl/∼mdecarvalho/series_tiempo.html

Horario: martes y jueves, 17:00–18:20, sala 3. Evaluación: examen final (60 %) proyecto de análisis de datos (40 %) mini-proyectos (bónus). Mini-proyectos. Los mini-proyectos serán cinco y funcionan como un bonus —su entrega no es obligatoria. Proyecto de análisis de datos. Plazos: Propuesta: 30 abril, 2013; Entrega de Proyecto: 4 junio, 2013. Referencias clave. Brockwell y Davis (2001), Shumway y Stoffer (2011).

Parte II Introducción al Modelamiento Estadístico de Series de Tiempo —Dominio del Tiempo— El Análisis de la Dinamica Temporal de los Datos

Procesos Estocásticos Proceso Estocástico y Trayectoria

Definición (Proceso Estocástico) Sea T ⊆ R un conjunto de indexación. Un proceso estocástico es una familia de variables aleatorias {Yt }t∈T definidas en un espacio de probabilidad (Ω, A, P). Para ω ∈ Ω fijo, la función yt ≡ Yt (ω), para t ∈ T, es una trayectoria del proceso estocástico {Xt }t∈T .

Para series de tiempo igualmente espaciadas en el tiempo, el conjunto de indexación natural es T = Z, pero para otro tipo de datos T puede asumir otras formas (por ejemplo, T = R para datos continuos).

Características de un Proceso Estocástico Funciones de Media, Varianza, Autocovarianza y Autocorrelación Definición Sea {Yt }t∈T un proceso estocástico dónde E|Yt | < ∞; además, sea Ft (y ) = P(Yt ≤ y ). Las funciones de media y varianza son definida como Z Z µt = E(Yt ) = y dFt (y ), σt2 = var(Yt ) = E(Yt − µt )2 = (y − µt )2 dFt (y ). R

R

Definición (Funciones de Autocovarianza y Autocorrelación) Sea {Yt }t∈T un proceso estocástico donde σt2 < ∞, para t ∈ T. La función de autocovarianza γ(· , ·) de {Xt }t∈T es definida como γ(r , s) = cov(Yr , Ys ) = E{(Yr − µr )(Ys − µs )},

r , s ∈ T.

La función de autocorrelación ρY (· , ·) de {Xt }t∈T es definida como ρ(r , s) = corr(Yr , Ys ) =

γ(r , s) , {γ(s, s)γ(t, t)}1/2

r , s ∈ T.

Estacionariedad Estacionariedad—Definiciones

Definición Una serie de tiempo {Yt }t∈Z es fuertemente estacionaria si para todo el h ∈ Z y t1 , . . . , tk ∈ Z d

(Yt1 , . . . , Ytk ) = (Yt1 +h , . . . , Ytk +h ). Una serie de tiempo {Yt }t∈Z es (débilmente) estacionaria si, 1 E|Yt |2 < ∞, para todo el t ∈ Z, 2 µt = µ, para todo el t ∈ Z, 3 γ(r , s) = γ(r + t, s + t), para todo el r , s, t ∈ Z.

Estacionariedad Estacionariedad—Intuición y Otras Consideraciones

En palavras: Una serie de tiempo es fuertemente estacionaria si las distribuciones conjuntas son invariantes a cambios de tiempo. Una serie de tiempo es (débilmente) estacionaria si fluctúa alrededor de un nivel fijo (µ) y la dependencia de observaciones pasadas depende sólo de su rezago. Si {Yt }t∈Z es estacionario podemos redefinir la autocovarianza y autocorrelación del proceso como funciones de una única variable h ∈ Z, γh ≡ γ(0, h) = cov(Xt , Xt+h ),

ρh ≡ ρ(0, h) = corr(Xt , Xt+h ).

En la práctica, a menudo nos enfrentamos con la cuestión de si los datos son una trayectoria de un proceso estacionario; esto puede ser estudiado usando R y la prueba de KPSS, que será introducida adelante.

Ruido Blanco Definición

Definición Un proceso estocástico {Yt } es llamado ruido blanco si ninguno de sus elementos es correlacionado, y si µt = 0, para todo el t ∈ Z, σt2 = σ 2 , para todo el t ∈ Z. Si además los Yt siguen una distribución normal, entonces se denomina proceso de ruido blanco Gaussiano, i.i.d.

Yt ∼ N(0, σ 2 ). El término ‘blanco’ viene de la analogía con la luz blanca, y indica que todas las frecuencias están igualmente presentes.

Ejemplo Simulado Ruido Blanco Gaussiano Estándar

0 −1 −2 −3

Yt

1

2

3

## set.seed es usado para efectos de reproducibilidad set.seed(100) n