Series de Tiempo Miguel de Carvalho DEPARTAMENTO DE ESTADÍSTICA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE mdecarvalho@ma
Views 85 Downloads 2 File size 1MB
Series de Tiempo Miguel de Carvalho DEPARTAMENTO DE ESTADÍSTICA PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
[email protected]
§1.
INTRODUCCIÓN AL MODELAMIENTO ESTADÍSTICO DE SERIES DE TIEMPO
Parte I Introducción y Motivación
Introducción
Las series de tiempo son un tema de amplio interés en estadística con diversas aplicaciones práticas. Mientras que en muchos contextos se parte del supuesto de que los datos son una muestra aleatoria (y por consiguiente independientes) i.i.d.
Yt ∼ FY (y ),
t = 1, . . . , n,
en nuestro contexto los datos estarán ordenados en el tiempo y por tanto son a menudo dependientes. Es así importante identificar la estructura de dependencia temporal que se oculta en los datos, para por ejemplo utilizar eventos pasados para predecir eventos futuros, o extraer el comportamiento cíclico de una serie de tiempo.
Economia Estadounidense—Mercado Laboral
500 400 300 200
Initial Claims (millares)
600
700
US Department of Labor—Employment & Training Administration http://www.ows.doleta.gov
1970
1980
1990
2000
Tiempo (años) †
Nota: Datos desestacionalizados.
2010
Economia Chilena—Estadísticas Macro
106 IPC
104
110 105
IMACEC
9
102
8
100
100
7 6
Tasa de Desempleo (%)
10
115
11
108
120
Banco Central de Chile http://si3.bcentral.cl
2010
2011
2012
Tiempo (años)
†
2013
2008
2010
2012
Tiempo (años)
2009
2010
2011
2012
2013
Tiempo (años)
IMACEC: Indicador Mensual de Actividad Económica; IPC: Índice de Precios al Consumidor.
Índice de Precio Selectivo de Acciones (IPSA)
0.0 −0.3
−0.2
−0.1
−log Retornos IPSA
3000 2000 1000
IPSA
4000
0.1
0.2
5000
Bolsa de Comercio de Santiago http://www.bolsantiago.cl
2004
2006
2008 Tiempo (años)
2010
2012
2004
2006
2008 Tiempo (años)
2010
2012
São Paulo, Brasil—Datos de Polución Companhia de Tecnologia de Saneamento Ambiental http://www.cetesb.sp.gov.br
Kazajstán—Granjas de Producción de Grano
1980
1980
2000
1960
1980
20 15 10 5
Producción (0.1 ton.)
20 15 10 5
Producción (0.1 ton.)
20 15 10 1960
Granja 4
2000
1960
1980
2000
Granja 6
Granja 7
Granja 8
2000
1960
1980
2000
1960
1980
15 10 5
20 15 10 5
15 10 5
20 15
1980
20
Granja 5
Producción (0.1 ton.)
Tiempo
Producción (0.1 ton.)
Tiempo
Producción (0.1 ton.)
Tiempo
10
2000
1960
1980
2000
Tiempo
Granja 9
Granja 10
Granja 11
Granja 12
15 10 0
5
Producción (0.1 ton.)
15 10 5
15 10 5
15 10 5
20
Tiempo
20
Tiempo
Producción (0.1 ton.)
Tiempo
Producción (0.1 ton.)
1960
5
2000
Granja 3
Tiempo
5
Producción (0.1 ton.)
1960
Producción (0.1 ton.)
Granja 2 Producción (0.1 ton.)
20 15 10 5
Producción (0.1 ton.)
Granja 1
1960
1980 Tiempo
2000
1960
1980 Tiempo
2000
1960
1980 Tiempo
2000
1960
1980 Tiempo
2000
Bosque de Beatenberg, Suiza—Datos Atmosféricos
20 10 0 −10 −20
Temperatura Media Diaria (° C)
30
40
Langfristige Waldökosystem-Forschung http://www.wsl.ch
1998
2000
2002 Tiempo (años)
2004
2006
Alpes Suizos—Suelo Permafrost
−2 −6
−4
Temperatura (ºC)
0
2
WSL Institute for Snow and Avalanche Research http://www.slf.ch
1998
2000
2002
2004
2006
2008
2010
Tiempo (años)
Figura : Temperatura del suelo sobre diferentes profundidades.
Salud Pública en Portugal—Influenza y Gripe
200 150 100 50
Número de Muertes por Semana
250
Instituto Nacional de Saúde, Dr. Ricardo Jorge http://www.insa.pt
1980
1985
1990
1995
Tiempo (años)
2000
2005
Detalles sobre el Funcionamiento del Curso http://www.mat.puc.cl/∼mdecarvalho/series_tiempo.html
Horario: martes y jueves, 17:00–18:20, sala 3. Evaluación: examen final (60 %) proyecto de análisis de datos (40 %) mini-proyectos (bónus). Mini-proyectos. Los mini-proyectos serán cinco y funcionan como un bonus —su entrega no es obligatoria. Proyecto de análisis de datos. Plazos: Propuesta: 30 abril, 2013; Entrega de Proyecto: 4 junio, 2013. Referencias clave. Brockwell y Davis (2001), Shumway y Stoffer (2011).
Parte II Introducción al Modelamiento Estadístico de Series de Tiempo —Dominio del Tiempo— El Análisis de la Dinamica Temporal de los Datos
Procesos Estocásticos Proceso Estocástico y Trayectoria
Definición (Proceso Estocástico) Sea T ⊆ R un conjunto de indexación. Un proceso estocástico es una familia de variables aleatorias {Yt }t∈T definidas en un espacio de probabilidad (Ω, A, P). Para ω ∈ Ω fijo, la función yt ≡ Yt (ω), para t ∈ T, es una trayectoria del proceso estocástico {Xt }t∈T .
Para series de tiempo igualmente espaciadas en el tiempo, el conjunto de indexación natural es T = Z, pero para otro tipo de datos T puede asumir otras formas (por ejemplo, T = R para datos continuos).
Características de un Proceso Estocástico Funciones de Media, Varianza, Autocovarianza y Autocorrelación Definición Sea {Yt }t∈T un proceso estocástico dónde E|Yt | < ∞; además, sea Ft (y ) = P(Yt ≤ y ). Las funciones de media y varianza son definida como Z Z µt = E(Yt ) = y dFt (y ), σt2 = var(Yt ) = E(Yt − µt )2 = (y − µt )2 dFt (y ). R
R
Definición (Funciones de Autocovarianza y Autocorrelación) Sea {Yt }t∈T un proceso estocástico donde σt2 < ∞, para t ∈ T. La función de autocovarianza γ(· , ·) de {Xt }t∈T es definida como γ(r , s) = cov(Yr , Ys ) = E{(Yr − µr )(Ys − µs )},
r , s ∈ T.
La función de autocorrelación ρY (· , ·) de {Xt }t∈T es definida como ρ(r , s) = corr(Yr , Ys ) =
γ(r , s) , {γ(s, s)γ(t, t)}1/2
r , s ∈ T.
Estacionariedad Estacionariedad—Definiciones
Definición Una serie de tiempo {Yt }t∈Z es fuertemente estacionaria si para todo el h ∈ Z y t1 , . . . , tk ∈ Z d
(Yt1 , . . . , Ytk ) = (Yt1 +h , . . . , Ytk +h ). Una serie de tiempo {Yt }t∈Z es (débilmente) estacionaria si, 1 E|Yt |2 < ∞, para todo el t ∈ Z, 2 µt = µ, para todo el t ∈ Z, 3 γ(r , s) = γ(r + t, s + t), para todo el r , s, t ∈ Z.
Estacionariedad Estacionariedad—Intuición y Otras Consideraciones
En palavras: Una serie de tiempo es fuertemente estacionaria si las distribuciones conjuntas son invariantes a cambios de tiempo. Una serie de tiempo es (débilmente) estacionaria si fluctúa alrededor de un nivel fijo (µ) y la dependencia de observaciones pasadas depende sólo de su rezago. Si {Yt }t∈Z es estacionario podemos redefinir la autocovarianza y autocorrelación del proceso como funciones de una única variable h ∈ Z, γh ≡ γ(0, h) = cov(Xt , Xt+h ),
ρh ≡ ρ(0, h) = corr(Xt , Xt+h ).
En la práctica, a menudo nos enfrentamos con la cuestión de si los datos son una trayectoria de un proceso estacionario; esto puede ser estudiado usando R y la prueba de KPSS, que será introducida adelante.
Ruido Blanco Definición
Definición Un proceso estocástico {Yt } es llamado ruido blanco si ninguno de sus elementos es correlacionado, y si µt = 0, para todo el t ∈ Z, σt2 = σ 2 , para todo el t ∈ Z. Si además los Yt siguen una distribución normal, entonces se denomina proceso de ruido blanco Gaussiano, i.i.d.
Yt ∼ N(0, σ 2 ). El término ‘blanco’ viene de la analogía con la luz blanca, y indica que todas las frecuencias están igualmente presentes.
Ejemplo Simulado Ruido Blanco Gaussiano Estándar
0 −1 −2 −3
Yt
1
2
3
## set.seed es usado para efectos de reproducibilidad set.seed(100) n