Patrones puntuales en R

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II ANÁLISIS DE PATRONES PUNTUALES ESP

Views 105 Downloads 50 File size 894KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

ANÁLISIS DE PATRONES PUNTUALES ESPACIALES PARA DATOS DE RELÁMPAGOS DE UNA TORMETA EN HOUSTON TEXAS NORTEAMÉRICA Juan Manuel Carrillo García1 Cristian Enrique Mora Cortez2 Diego Armando Rodríguez Álvarez3

1

RESUMEN

Para la elaboración de este estudio se utilizaron datos de relámpagos correspondientes al día 9 de mayo de 2013 en un área al noroeste de la ciudad de Houston, Texas. A partir de un análisis exploratorio de los datos estimando la intensidad del patrón puntual sobre la ventana de interés y la presencia de dependencia espacial. Se determinó la no existencia de Completa Aleatoriedad Espacial (CRS) mediante la implementación de las funciones G, F, K y L con el uso del paquete Spatstat de R. Adicionalmente se generó el ajuste de un modelo de proceso no homogéneo de Poisson junto con una simulación del patrón generado por este modelo. Se utilizaron técnicas estadísticas de modelado espacial y en la metodología descrita en este documento se presenta la secuencia lógica de procedimientos aplicados. Palabras Claves: Patrones puntuales espaciales, relámpagos Abstract: For this study we were used lightning data for the day May 9 of 2013 in an area northwest of the city of Houston, Texas. For the exploratory data analysis we were estimated the intensity of the point pattern on the window of interest and the presence of spatial dependence. It was determined the existence of complete spatial randomness (CRS) through the implementation of the G, F, K and L functions with the use of spatstat package R. In addition, it was generated the adjustment of a model inhomogeneous Poisson process with a simulation of the pattern generated by this model. We were used techniques of Statistics and spatial modeling that are described in the methodology of this document whit the logical sequence of procedures applied. Key Words: spatial point pattern, lightning strikes

Estudiante del programa de Especialización en sistemas de información geográfica de la Universidad Distrital Francisco José de Caldas Código: 20142094023 2 Estudiante del programa de Especialización en sistemas de información geográfica de la Universidad Distrital Francisco José de Caldas Código: 20151094012 3 Estudiante del programa de Especialización en sistemas de información geográfica de la Universidad Distrital Francisco José de Caldas Código: 20151094015 1

1|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

2

INTRODUCCIÓN

El sur-este de Norteamérica es una de las zonas más afectadas por fenómenos de relámpagos tal y como lo evidencia el monitoreo del impacto de los mismos que ha logrado ser cartografiado por diversas entidades encargadas e interesadas en el tema como lo es el caso de la NASA - National Aeronautics and space administration y que con base en los sensores de bandas entre los 700 y 800 nanómetros registran estos eventos atmosféricos. En la Figura 1 se presenta la densidad de eventos registrados anualmente por unidad de área (relámpagos/km2/año).

Figura 1. Densidad de eventos ocurridos anualmente. Fuente: http://science.nasa.gov/science-news/science-at-nasa/2001/ast05dec_1/

Sin embargo el monitoreo terrestre de este fenómeno a partir de sensores de radiofrecuencia proporcionan mediciones locales de alta calidad, como lo son las mediciones de las redes United States and North American Precision Lightning Networks, administradas por la WSI división profesional de la TWC (the weather company), que en tiempo real y gracias a los aproximadamente 170 sensores instalados recopilan las características de los eventos ocurridos. Debido al número de eventos que ocurren diariamente, cerca de 8,6 millones alrededor del mundo, se seleccionaron registros de un día de tormenta con el objeto de establecer si la localización de los relámpagos obedece a una distribución aleatoria o si por el contrario sigue algún patrón en su distribución espacial. Adicional a la localización de cada evento se cuenta con la duración del mismo expresada en milisegundos y el amperaje pico de polaridad positiva o negativa. El monitoreo de este fenómeno adicionalmente es registrado con el objeto de estudiar su comportamiento, particularmente existen centros de investigación que además de su localización, realizan procesos de georreferenciación con el objeto de identificar patrones a escala global. En la Figura 2 se observan los eventos ocurridos en Norteamérica para el día de la tormenta objeto de estudio.

2|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

Figura 2. Eventos ocurridos para la tormenta del 9 de mayo de 2013. Fuente: http://www.lightningmaps.org/blitzortung/america/index.php?

El análisis de patrones puntuales espaciales sirve no solo para la identificación de algún tipo de agregación sino que va más allá pues busca mejorar la comprensión de estos eventos en la climatología global y dar pautas de agregaciones espaciales y temporales que buscan fortalecer la toma de decisiones que permitan evaluar el riesgo que existe ante fenómenos de cambio climático cuya ocurrencia y magnitud afectan cada vez más a un número mayor de población. El análisis se apoyará en la aplicabilidad de funciones implementadas en la herramienta R V. 3.1.2, proyecto para la estadística computacional y particularmente el uso de sus paquetes de estadística espacial como spatstat y splancs, para el análisis y visualización de datos espaciales y entre ellos patrones espaciales puntuales en una región bidimensional como lo es la zona de estudio comprendida en Houston Texas (Baddeley, Rubak, & Turner, Spatial Point Patterns: Methodology and Applications with R, 2005).

3

METODOLOGÍA

Para el presente análisis se tomaron los datos de relámpagos en el área de estudio, sin embargo si bien se conocen los registros de cada evento, no se conocen las demás condiciones que permiten obtener dichos registros como lo son las condiciones climáticas y de carga eléctrica en la atmosfera. A continuación se describen los datos empleados así como el procedimiento desarrollado y los métodos aplicados. Datos de eventos registrados: De las series de registros de relámpagos es importante mencionar que al ser un fenómeno atmosférico su ocurrencia no es por si aleatoria pues como se mencionó obedecen a la presencia de tormentas y cambios en la carga eléctrica de la atmosfera y es por ello que la escala del análisis debe ser relativamente menor acorde con la escala de los eventos de tormenta (Schabenberger &

3|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

Gotway, 2009); para el análisis se han seleccionado eventos ocurridos durante una hora, entre las 8:27 am y las 9:27 am del día 9 de mayo de 2013. Determinación de patrón espacial: Para evaluar el posible patrón espacial que presentan los datos puntuales se realizara el análisis exploratorio de los mismos el cual consiste en la visualización, la estimación de la densidad y dependencia espacial, para lo cual se seguirán y aplicaran los siguientes métodos: Método de los cuadrantes (densidad): Este método permite estimar la intensidad de los eventos en subregiones de igual tamaño definidas como una división del área de estudio; posteriormente el método requiere el conteo de los eventos en cada subregión con el objeto de calcular la intensidad como la relación entre el número de eventos y el área de la subregión. Para validar la hipótesis de completa aleatoriedad espacial (CSR), se requiere determinar la proporción varianza media (VMR), cuya prueba de significancia es realizada bajo una distribución chi-cuadrado. Método Densidad de Kernel: La estimación kernel permite conocer la densidad de eventos dentro de un radio de búsqueda específico alrededor de cada punto o evento. Se define como una función matemática que pondera las distancias entre vecinos del área de influencia determinada por el ancho de banda o los parámetros utilizados para definir la forma del kernel. Según los parámetros la función de densidad de Kernel puede tener el ancho de banda fijo (Kernel fijo) o el número de eventos dentro del área de influencia fijo (Kernel adaptativo). Así mismo se requiere determinar el ancho de banda óptimo caso para el cual se estableció mediante el uso del error medio cuadrático (Minarro, 1998). Distancias de vecinos más cercanos y Función K (dependencia): para las evaluaciones de dependencia se realiza una simulación CSR con el objeto de identificar visualmente si la gráfica de eventos presenta un comportamiento típico de un patrón aleatorio. La Función G estudia la distribución acumulada del número de parejas de vecinos en la medida en que se va incrementando el umbral de distancia entre ellos hasta llegar al par de vecinos más cercanos que se hallan a mayor distancia. La Función F genera un número aleatorio de ubicaciones al interior del área de interés, luego se observa la mínima distancia entre cada uno de estos puntos y el evento más cercano. Considerando que en este método los pares se forman entre puntos aleatorios y eventos, es comprensible que la función tenga un comportamiento opuesto al de la función G Por su parte, la Función K tiene en cuenta los efectos de agregación a varias escalas sobre la base de todas las distancias entre los eventos asumiendo isotropía en la región de estudio. Evalúa el patrón espacial mediante el conteo de eventos al interior de un círculo con radios definidos aleatoriamente, haciendo lo mismo para todos los puntos en el área de estudio. Se controla el resultado mediante la modificación del parámetro h o rezago espacial. Finalmente se presenta la función L como una estandarización de esta última.

4|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

Estimación de los modelos: La aplicación de un modelo teórico resulta de gran utilidad para comprender mejor el comportamiento así como la posible interacción espacial con otras variables aún no observadas o consideradas. Uno de los beneficios de obtener este modelo es predecir la intensidad del patrón en locaciones de interés y de esta forma hacer inferencias acerca del patrón en sitios no completamente muestreados. El paquete a utilizar para la generación del modelo es spatstat. En este paquete se utiliza la función “Ajuste de Modelo de Proceso Puntual a Datos” (Fit Point Process Model to Data), la cual recibe como parámetros un objeto del tipo parón puntual y una función con la que se espera modelar una posible tendencia (trend) presente en los datos. En este caso de estudio se utiliza una función lineal de x e y, que corresponde a un plano en el espacio tridimensional. La función calcula cuáles serían los coeficientes para construir un plano mediante el método de máxima verosimilitud, que busca obtener como resultado el modelo óptimo que más se asemeje a los datos observados.

4

RESULTADOS

Conforme a la metodología presentada, a continuación en la Figura 3 se muestran los eventos considerados así como el resumen de las características del objeto ppp que es la clase definida en la herramienta R para representar patrones puntuales en dos dimensiones.

Figura 3. Esquema y resumen de los eventos considerados.

Como se puede observar existen unos límites de los eventos definidos como se indica en la Figura 2 seguramente contenidos por los núcleos de precipitación de la tormenta. Por otra parte, como análisis exploratorio de las características de los eventos considerados se presentan los histogramas y diagramas de cajas de las dos variables disponibles que obedecen a la duración y al amperaje máximo registrado.

5|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

Figura 4. Análisis exploratorio - variables amps máximo y duración.

Es importante observar las distribuciones, una en forma de campana y la otra uniforme, que presentan las dos variables, que si bien no son objeto de análisis del presente estudio, son útiles en la descripción e interpretación del fenómeno. Adicionalmente se presenta la distribución de los eventos en las coordenadas este y norte, observando principalmente comportamientos bimodales.

Figura 5. Análisis exploratorio - histogramas coordenadas este y norte.

Una vez revisados los datos y las variables de estudio, se procedió a determinar la densidad de los eventos a partir de la aplicación del método de cuadrantes descrito anteriormente; El p-valor de la prueba de significancia obtenido sobre una distribución a dos colas, indica claramente que se 6|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

rechaza la hipótesis nula. Por lo anterior es posible afirmar que los datos conforman un patrón puntual agregado. A continuación se presenta el grafico de los cuadrantes definidos con base en el área recomendada de cada uno así como el resultado del test aplicado.

Figura 6. Método de cuadrantes – conteo y resumen del test.

Continuando con la evaluación de densidad, se aplicó el kernel tanto fijo como adaptativo; para el primero de ellos se requirió de la definición del ancho de banda óptimo a partir del error medio cuadrático cuyos resultados indican un ancho de banda de 1,5 km.

Figura 7. Kernel fijo – ancho de banda 1.5 km.

Figura 8. Kernel adaptativo.

Como se puede observar las zonas identificadas por ambos tipos de kernel son similares, la diferencia varia en el suavizado de la superficie que genera un kernel fijo.

7|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

Los resultados de las pruebas de dependencia a través de las funciones definidas anteriormente comparan las funciones esperadas para la hipótesis de completa aleatoriedad espacial con los resultados observados. A continuación se presentan las funciones obtenidas para los eventos considerados.

Figura 9. Funciones de dependencia espacial.

Dado que la función G presenta un rápido crecimiento con la distancia, se establece que existe una agrupación de los datos, debido a que a distancias más cortas existe mayor cantidad de eventos. De manera opuesta, para la función F, una gran cantidad de distancias menores indica agrupación, por lo tanto la curva crece lentamente por debajo de la simulación. En la función K o su estandarización L, los patrones agregados presentan un crecimiento rápido por encima de la curva de simulaciones que representa CSR. Por consiguiente se puede concluir que los relámpagos ocurridos en la mañana del 9 de mayo en Houston Texas, no cumplen la hipótesis de completa aleatoriedad espacial y se valida que presentan un patrón espacial agregado. El siguiente paso después de analizar el comportamiento del patrón puntual desde diferentes puntos de vista, es ajustar un modelo teórico que represente el patrón observado.

8|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

El modelo resultante corresponde a un proceso no homogéneo de Poisson; se obtienen el intersecto y los coeficientes que describen el plano que subyace al modelo estimado.

Figura 10. Resultados proceso no homogéneo de Poisson.

Al examinar las características del modelo se analizan los intervalos de confianza al 95% para los coeficientes, encontrando que ninguno de ellos contiene el valor cero. Lo anterior ratifica que los coeficientes son significativos y efectivamente el plano describe una tendencia espacial en la intensidad del patrón observado.

Figura 11. Resultados errores de lo modelo.

En la izquierda de la Figura 11 se observa el modelo ajustado para la tendencia de la intensidad, con la sobre posición de los eventos observados y en la derecha se observa el error estándar estimado para la predicción de la intensidad en el área de estudio con el uso del modelo de proceso no homogéneo de Poisson. Se puede ver cómo el error estándar es mayor en el borde noroccidental del área de estudio, mientras que para la zona suroriental la predicción para la intensidad del patrón es considerablemente mejor.

Figura 12. Histogramas de predicciones y errores del modelo.

9|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

En la Figura 12 se compara el histograma de la intensidad en el patrón observado (izquierda) y el histograma del error estándar observado contra la predicción obtenida del modelo. La gran parte de los errores se encuentran por debajo de 0.02, valor significativamente inferior respecto del intervalo de variación de la intensidad observada en el patrón original. Finalmente se procede a generar una simulación del patrón puntual mediante el uso del modelo ajustado de proceso no homogéneo de Poisson.

Figura 13. Eventos registrados evaluados vs predicciones del modelo de ajuste.

En la Figura 13 se observa a la izquierda el patrón observado y a la derecha el patrón simulado con base en el modelo de proceso no homogéneo de Poisson. Visualmente se evidencia similitud entre los dos patrones, sin embargo persisten algunas agregaciones en el patrón observado que el modelo no logra representar completamente.

5

CONCLUSIONES

El análisis exploratorio de los datos permite evaluar las diferentes distribuciones que presentan las variables de un fenómeno climático como los relámpagos, los cuales, para unos mismos registros, pueden presentar comportamientos completamente diferentes como lo son distribuciones de campana o distribuciones uniformes. Si bien dentro de un área de baja extensión como la analizada, una serie de relámpagos puede parecer aleatoria sin un patrón definidos, se pudo concluir que este fenómeno, particularmente el ocurrido en la mañana del 9 de mayo en Houston Texas, presenta un patrón espacial agregado, potencialmente atribuible a los núcleos de precipitación de los frentes de tormenta. Si se evaluasen tormentas diferentes en un área de mayor extensión el patrón de agregación espacial sería más notorio pues es ampliamente conocido dentro de la ciencia hidrológica que la precipitación presenta una distribución en el espacio y no es uniforme en toda la extensión de una cuenca hidrográfica. Mediante el uso de una función de ajuste por el método de máxima verosimilitud se logró modelar satisfactoriamente la intensidad del patrón puntual observado, obteniendo como modelo un proceso no homogéneo de Poisson.

10|P á g i n a

03 de noviembre de 2015

ESTADÍSTICA ESPACIAL ESPECIALIZACIÓN EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA – 2015 II

6

BIBLIOGRAFÍA

Baddeley, A., Rubak, E., & Turner, R. (2005). Spatial Point Patterns: Methodology and Applications with R. Baddeley, A., Rubak, E., & Turner, R. (2005). spatstat: An R Package for Analyzing Spatial Point Patterns. Journal of Statistical Software. Cressie, N. (1993). Statistics for Spatial Data. Jhon Wiley & Sons. Minarro, A. (1998). Estimación no paramétrica de la función de densidad. Barcelona. Schabenberger, O., & Gotway, C. (2009). Statistical Methods for Spatial Data Analysis. Florida: Taylor & Francis.

11|P á g i n a

03 de noviembre de 2015