ANALISIS ESTADISTICO

ANALISIS ESTADISTICO- ESTACIÓN PLUVIOMETRICA DE LABATECA. Patricia, Dayana Cordoba, Departamento de Ingenierías y Arquit

Views 188 Downloads 4 File size 326KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ANALISIS ESTADISTICO- ESTACIÓN PLUVIOMETRICA DE LABATECA. Patricia, Dayana Cordoba, Departamento de Ingenierías y Arquitectura, Facultad de Ingeniería Ambiental y Civil, Universidad de Pamplona; Pamplona-Norte de Santander. Mayo 11 de 2017 1. INTRODUCCIÓN Para llevar a cabo el análisis estadístico de los datos de precipitaciones máximas multianuales del año 1956 al 2016 de la estación de Labateca, suministrados por el IDEAM, fue necesario examinar éstos antes de aplicar cualquiera de los métodos estadístico, para así completar los datos faltantes a través del método de media general, Hot Deck y razón de proporciones para una misma estación; posteriormente se determinó la gráfica de curva masa y el coeficiente pluviométrico de los datos completos para después aplicar las pruebas no paramétricas de Chi-cuadrado, Kolmogorov-Smirnov y Arima, para poder describir la variabilidad y condiciones futuras de las precipitaciones 2. OBJETIVOS 2.1. OBJETIVO GENERAL  Realizar el análisis estadístico los datos de precipitaciones de la estación de Labateca suministrados por el IDEAM 2.2. OBJETIVOS ESPECIFICOS  Solicitar los datos de precipitaciones de la estación de Labateca al Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM)  Completar los datos faltantes a través de los métodos de estimación.  Determinar la variabilidad de las precipitaciones futuras en ésta zona.  Graficar y analizar las curvas IDF (Intensidad-Duración-Frecuencia). 3. MARCO TEORICO. ESTACIÓN PLUVIOMETRICA Es una estación meteorológica dotada de un pluviómetro que permite medir la cantidad de lluvia caída entre mediciones realizadas consecutivas 1. La estación pluviométrica de Labateca en el departamento de Norte de Santander está ubicada a 1560msnm (N 7° 17’ W 72°30') Media general Al tener una serie de datos dividida en t grupos, donde: 1

Glosario, IDEAM.

Son el número de elementos de los grupos Son las medias de los correspondientes grupos. La media general de la serie de datos se define como:

Hot Deck Es un método para ajustar conjuntos de datos cuando hay datos faltantes. Un procedimiento de imputación es definido como un procedimiento que reemplaza un valor faltante por otro mediante un proceso (exactamente, como el valor imputado es calculado no es importante a la definición). En general, el procedimiento Hot Deck es un proceso de duplicación: cuando un valor es faltante de una muestra, un valor registrado es duplicado para representar este valor faltante. Así, el término “procedimiento de imputación” y “procedimiento Hot Deck” no son intercambiables. Por ejemplo, un procedimiento que imputa el promedio de todos los valores registrados para cada uno de los valores faltantes es un procedimiento de imputación pero no es un procedimiento Hot Deck. El adjetivo Hot se refiere a imputar con valores de la encuesta presente. En cambio el procedimiento “Cold Deck” se refiere a usar información de otras encuestas anteriores en vez de la información actual2. La razón principal para usar el procedimiento Hot Deck es que reduce el sesgo de no respuesta. Para reducir este sesgo, el procedimiento Hot Deck por lo general tiene un proceso de clasificación asociada a ella. Todas las unidades de la muestra están clasificadas en grupos disjuntos así que las unidades son tan homogéneas como sea posible dentro de cada grupo. Para cada valor faltante, un valor registrado es imputado el cual está en el mismo grupo de clasificación. Así la suposición se basa en que dentro de cada grupo de clasificación las unidades que no responden siguen la misma distribución como aquellos que responden Prueba Chi-Cuadrado (x2) La prueba Chi-Cuadrado fue desarrollada por Karl Pearson (1857-1936) en 1900, y es la prueba de bondad de ajuste más popular aplicada en hidrología para escoger la distribución o las distribuciones que más se ajustan a determinada serie de datos de caudales mínimos. Para aplicar la prueba, el

2

http://sisbib.unmsm.edu.pe/bibvirtualdata/monografias/basic/avila_gc/cap3.pdf

primer paso es dividir los datos en un número K de intervalos de clase, de tal forma que: Donde K, es el número de intervalos de clase, y n el tamaño de la muestra. Una vez obtenido el número K, hallamos el rango R de los intervalos superiores e inferiores para la muestra, así:

La estadística X2 está distribuida asintóticamente como Chi-Cuadrado, con Km-1 grados de libertad y su ecuación es la siguiente:

Donde Oj es el número observado de eventos en el intervalo de clase j y Ej es el número esperado de eventos en el mismo intervalo de la distribución teórica. Si los intervalos de clase son escogidos tales que, cada intervalo corresponde a una probabilidad igual, entonces Ej = n/k; donde n es el tamaño de la muestra y k es el número de intervalos de clase. Los intervalos de clase también pueden ser obtenidos usando el inverso de las funciones de distribución correspondientes a diferentes valores de probabilidad F, similar a la estimación de cuartiles de cada distribución; esta estimación se describe en el siguiente capítulo. Después de aplicar la prueba ChiCuadrado en cada una de las distribuciones, en la tabla de función de distribución Chi-Cuadrado, se determina el nivel de significación. El valor más común de α es de 0,05 (5%). Para este nivel de significancia, suelen aceptarse varias funciones de distribución de probabilidad. Por otra parte, siempre se debe tener precaución al aplicar la prueba, pues sus resultados dependen mucho de la selección de los intervalos y del tamaño de 94 la muestra; y sobre todo si se va a utilizar para descartar distribuciones y no para compararlas. Por otro lado si algunas estaciones poseen coeficientes de asimetría negativos o muy grandes los valores de la prueba suelen dar erróneos. Kolmogorov Smirnov La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una

distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada. Esta prueba

consiste en hallar el máximo valor absoluto de la diferencia D entre la función de distribución de probabilidad observada Fo (Xm) y la estimada F (Xm). Luego de obtener el Dmax se multiplica por la raíz cuadrada del tamaño de la muestra n, para obtener la prueba Kolmogorov-Smirnov (λn) así: Donde n es el tamaño de la muestra. Los valores críticos de la prueba Kolmogorov-Smirnov para diferentes niveles de significación se presentan en tablas.

El valor crítico de (λn) depende del nivel de significación seleccionado. Si el valor de (λn), es menor que el valor del nivel de significación seleccionado se acepta la función de distribución evaluada. Esta prueba tiene la ventaja

sobre la Prueba Chi-Cuadrado (X2), que compara los datos con el modelo estadístico sin necesidad de agruparlos. La función de distribución de probabilidad observada se calcula de la siguiente manera: Donde m es el número del orden del dato Xm en una lista de mayor a menor y n es el número total de datos; la función de distribución de probabilidad estimada F (Xm), se calcula según las funciones de distribución teóricas que se utilicen. Arima Son modelos paramétricos que tratan de obtener la representación de la serie en términos de la interrelación temporal de sus elementos. Este tipo de modelos que caracterizan las series como sumas o diferencias, ponderadas o no, de variables aleatorias o de las series resultantes, fue propuesto por Yule y Slutzky en la década de los 20. Fueron la base de los procesos de medias móviles y autor regresivos que han tenido un desarrollo espectacular tras la publicación en 1970 del libro de Box-Jenkins sobre modelos ARIMA. El instrumento fundamental a la hora de analizar las propiedades de una serie temporal en términos de la interrelación temporal de sus observaciones es el denominado coeficiente de auto correlación que mide la correlación, es decir, el grado de asociación lineal que existe entre observaciones separadas k periodos. Estos coeficientes de auto correlación proporcionan

mucha información sobre como están relacionadas entre sí las distintas observaciones de una serie temporal, lo que ayudará a construir el modelo apropiado para los datos. 4. ANALISIS DE DATOS

PONER LAS TABLAS Y LAS GRAFICAS CON LA TOMA DE DECISIONES QUE SE HIZO EN CLASE 5. CONCLUSIONES  A través de los métodos para datos faltantes vistos en clase se consiguió completar los datos carentes en las tablas de precipitaciones de una forma confiable y adecuada.  En el presente informe a través del método de Arima se logró pronosticar que para el año 2017 la probabilidad de que se presenten precipitaciones es de un 57,627 %  Para la selección de funciones de distribución de probabilidad que se ajustaron más al comportamiento de precipitaciones de la estación de Labateca, se utilizaron pruebas, que presentan una metodología de soporte aritmético y proporcionan un criterio más preciso en la selección, la prueba de bondad de ajuste que obtuvo mejores resultados fue la de Kolmogorov Smirnov 6. BIBLIOGRAFIA  IDEAM (Instituto de Hidrología, Meteorología y Estudios Ambientales) http://www.ideam.gov.co/  Modelo Arima http://www.estadistica.net/ECONOMETRIA/SERIESTEMPORALES/modelo-arima.pdf  Modelo Kolmogorov Smirnov, Chi Cuadrado http://repository.unimilitar.edu.co/bitstream/10654/11999/1/ANALISIS%20T ENDENCIAL%20DE%20LA%20VARIACION%20CLIMATICA.pdf