4to Informe Geoestadistica Marin

1 AÑO DE LA PROMOCIÓN DE LA INDUSTRIA RESPONSABLE Y COMPROMISO CLIMÁTICO CUARTO INFORME DE GEOESTADÍSTICA DOCENTES: PH

Views 102 Downloads 0 File size 586KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

1 AÑO DE LA PROMOCIÓN DE LA INDUSTRIA RESPONSABLE Y COMPROMISO CLIMÁTICO

CUARTO INFORME DE GEOESTADÍSTICA

DOCENTES: PHD. MARIN SUAREZ, VALERIANO ALFREDO ING. TEVES ROJAS, AUGUSTO

ALUMNO: PILA HUANCACHOQUE, RUSSOU ADRIEL CÓDIGO: 20124092I

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA GEOLÓGICA MINERA Y METALURGICA Lima 5 de noviembre de 2014

2 TABLA DE CONTENIDO 1.

OBJETIVOS......................................................................................................................

2.

ALCANCES......................................................................................................................

3.

INTRODUCCIÓN.............................................................................................................

4.

FUNDAMENTO TEORICO.............................................................................................

5.

PRIMER TRABAJO DEJADO POR EL PHD . MARÍN.................................................

6.

TABLAS Y FIGURAS......................................................................................................

6.1 Tablas de datos

Tabla de datos de población anormal....................................................

6.2 Figuras histogramas y P-P plot.......................................................................................... 7.

8.

9.

SEGUNDO TRABAJO DEJADO POR EN PHD. MARÍN............................................ 7.1

Algoritmo del Variograma...................................................................................11

7.2

Visualización del programa.................................................................................11

7.3

Algoritmo del programa en VBA........................................................................11

7.4

Creación de datos con el T.L.C iniciar el programa............................................12

TABLAS Y FIGURAS.................................................................................................... 8.1

Tablas de datos generados...................................................................................13

8.2

Figuras.................................................................................................................14

CONCLUSIONES...........................................................................................................

10. REFERENCIAS...............................................................................................................

3 1. OBJETIVOS 

Analizar la gráfica p-p plot de los Ln de los datos dejador por el PHD Marín.



Analizar la gráfica p-p plot de los Ln de los datos con un incremento de datos anormales.



Tener capacidad para comprender porque se produce cambios es la grppafica p-p plot.



Crear un algoritmo para generar datos con distribución de gauss usando el Teorema del Limite Central. 2. ALCANCES En el transcurso de este informe se podrá dar cuenta de que el análisis de la curva p-p plot del Ln de los datos nos da información de posibles anomalías en nuestros datos. 3. INTRODUCCIÓN La necesidad de acudir a herramientas estadísticas para el análisis de datos en todas las áreas del conocimiento, ha hecho que aparezcan con el correr de los años nuevas metodologías que, no obstante se centran en fundamentos probabilísticos comunes, son específicas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre otros, la econometría, psicometría o la bioestadística. La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadística encaminen esfuerzos en el desarrollo de nuevas técnicas apropiadas para el análisis de información enmarcada dentro de este contexto. Como consecuencia de este impulso surgió la geoestadística, teniendo como padre a George Matheron. 4. FUNDAMENTO TEORICO PROBABILIDAD-PROBABILIDAD (PP) TERRENO Una probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado conjunto de datos sigue alguna distribución especificado. Debe ser aproximadamente lineal si la distribución especificado es el modelo correcto.

4 La probabilidad-probabilidad (PP) trama se construye utilizando la función de distribución acumulada teórica, F (x), del modelo especificado. Los valores de la muestra de datos, en orden de menor a mayor x, se denotan (1), X (2), ..., x (n). Para i = 1, 2, ....., n, F (x (i)) se representa frente a (i-0.5) / n. Ejemplo En la figura de abajo, dos conjuntos de datos se han visualizado en gráficos de probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente proviene de una distribución normal, por lo que la trama PP es lineal. El segundo conjunto de datos (que se muestra en rojo) proviene de una distribución exponencial, por lo que no es ni siquiera cerca de simetría, y la trama del PP se desvía de una línea recta. El uso de estas parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la segunda no lo es.

5 HISTOGRAMA En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador (como la longitud o la masa). De esta manera ofrece una visión en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas. En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o subrango de valores de la característica conocido como intervalo de clase. En el eje horizontal se representa el espectro de valores posibles que toma la característica de interés, evidentemente, cuando éste espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones éste espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés. TEOREMA DEL LIMITE CENTRAL

6 El teorema del límite central o teorema central del límite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula pero finita, entonces la función de distribución de Sn «se aproxima bien» a una distribución normal (también llamada distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande. Sea

la función de densidad de la distribución normal definida como1

con una media µ y una varianza σ2. El caso en el que su función de densidad sea

,a

la distribución se le conoce como normal estándar. Se define Sn como la suma de n variables aleatorias, independientes, distribuidas, y con una media µ y varianza σ2 finitas (σ2≠0):

de manera que, la media de Sn es n·µ y la varianza n·σ2, dado que son variables aleatorias independientes. Con tal de hacer más fácil la comprensión del teorema y su posterior uso, se hace una estandarización de Sn como

para que la media de la nueva variable sea igual a 0 y la desviación estándar sea igual a 1. Así, las variables Zn convergerán en distribución a la distribución normal estándar N(0,1), cuando n tienda a infinito. Como consecuencia, si Φ(z) es la función de distribución de N(0,1), para cada número real z:

donde Pr( ) indica probabilidad y lim se refiere a límite matemático.

7

5. PRIMER TRABAJO DEJADO POR EL PHD . MARÍN Agregar datos al archivo una población anormal y ver la media y desviación típica hacer el P-P plot 6. 6.1 Tablas de datos # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 … 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 # 1 2 3 4 5 6

TABLAS Y FIGURAS Tabla de datos de población anormal

datos Ln(datos) Datos 1,91 ,65 ,76 -,27 ,76 -,27 ,90 -,10 2,99 1,10 ,49 -,71 ,69 -,37 1,59 ,46 2,39 ,87 ,87 -,14 1,88 ,63 ,97 -,03 1,10 ,10 2,08 ,73 … … ,74 -,30 ,91 -,10 2,05 ,72 1,51 ,41 3,03 1,11 1,12 ,12 ,61 -,49 ,95 -,05 1,44 ,37 1,16 ,15 1,41 ,35 1,15 ,14 ,86 -,15 2,65 ,97 5.04 6.53 4.45 5.86 4.93 5.07

1.62 1.88 1.49 1.77 1.59 1.62

8 7 8 9 10 11 12 13 14 … 87 88 89 90 91 92 93 94 95 96 97 98 99 100

5.12 5.84 4.14 4.03 4.63 5.85 5.01 4.91 … 6.39 5.86 3.30 3.71 4.65 5.22 4.05 4.68 5.43 5.37 4.82 2.73 5.73 4.55

1.63 1.76 1.42 1.39 1.53 1.77 1.61 1.59 … 1.85 1.77 1.19 1.31 1.54 1.65 1.40 1.54 1.69 1.68 1.57 1.00 1.75 1.52

6.2 Figuras histogramas y P-P plot HISTOGRAMA DE DATOS DEL PHD. MARÍN

9

HISTOGRAMA DE LN(DATOS)

P-P PLOT DE LN DE DATOS

HISTOGRAMA DE DATOS AÑADIDOS CON POBLACIÓN ANORMAL

10

HISTOGRAMA DE LN(DATOS+POBLACION ANORMAL)

11 P-P PLOT DE LN(DATOS+POBLACION ANORMAL)

7.

SEGUNDO TRABAJO DEJADO POR EN PHD. MARÍN

Hacer un programa para generar datos con distribución de gauss usando el Teorema de Limite Central 7.1

Algoritmo del Variograma El algoritmo fue desarrollado en el programa VBA, de tal manera que podamos

generar 1000 grupos de 100 datos aleatorios y por cada grupo obtener un valor con el T.L.C. Los datos serán puestos en una hoja de Excel pudiendo realizar luego la gráfica del histograma correspondiente. 7.2

Visualización del programa

12

7.3

Algoritmo del programa en VBA

Dim aleatorio(1 To 100) As Double Dim alfa, beta As Double Dim i, j As Integer Private Sub CommandButton1_Click() Randomize alfa = Val(txt1.Text) beta = Val(txt2.Text) For i = 1 To 1000 For j = 1 To 100 aleatorio(j) = Rnd() suma = suma + aleatorio(j) Next Cells(i, 1) = beta * ((suma - 100 * (1 / 2)) / ((100 ^ 0.5) / (12 ^ 0.5))) + alfa suma = 0 Next End Sub End Sub 7.4 Creación de datos con el T.L.C iniciar el programa Asignamos una media = 3 y una desviación = 1

13

# 1 2 3 4 5 Media

6

7 3.024287 12 8 9 10 11 12 13 14 15 16 … 981 982 983 984 985 986 987 988 989 990 991 992 993 994

Dato generado 3.2368601 07 2.5025089 26 8. TABLAS Y FIGURAS 3.0441233 36 Tablas de datos generados 4.0368648 8.1 83 1.- Tabla de 1000 datos generados 2.5923189 56 2.7435083 51 Varianza 1.5668361Desviación 75estándar 0.911503 3.0168416 0.954726727 12 72 4.0481431 27 3.9468615 91 2.5769194 39 3.8224913 52 3.0955878 63 2.2100416 71 4.1637045 81 3.7637225 11 … 3.4556116 01 3.2345961 33 3.5300825 71 2.5591918 59 2.6242491 5 2.1236994 56 3.1514805 68 3.8543488 66 2.5671506 21 1.6016831 39 2.0288917 03 2.9643986 12 2.5860830 34 3.3085827 91 2.7549795

14

15 8.2

Figuras

Histograma de los valores generados con el TLC 50 45 40 35 30 Frecuencia

25

Frecuencia

20 15 10 5 0

Clase

16 9.

CONCLUSIONES

  

El p-p plot sirve para identificar la función más adecuada para representar los datos. El p-p plot ayuda a identificar posibles anomalías en el muestreo al variar la recta. El Teorema del Limite central nos ayuda a simular datos con una media y desviación



estándar dados. El teorema del límite central nos da como resultado una función de gauss 10. REFERENCIAS

Clases de Informática por Ing. Chávez, Adolfo Clases del PhD. Alfredo Marín Suarez Clases realizadas por el Ing. Téves. http://www.stats.gla.ac.uk/glossary/?q=node/392 http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central