MINIMOS CUADRADOS

MÉTODO DE LOS MÍNIMOS CUADRADOS 1. MARCO TEORICO Es una técnica en la que, dados un conjunto de pares ordenados, se int

Views 296 Downloads 10 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

MÉTODO DE LOS MÍNIMOS CUADRADOS

1. MARCO TEORICO Es una técnica en la que, dados un conjunto de pares ordenados, se intenta encontrar la función continua (ecuación de la recta) que mejor se aproxime a los datos (un "mejor ajuste"). FIGURA 1

(Fuente, http://fisicamatematic.wordpress.com)

FIGURA 2 (Fuente, https://sites.google.com/site/metalmetnumericos/home/unidad-3/3-9-metodo-deminimos-cuadrados)

La ecuación de la recta de la figura anterior es: 𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏 Donde:  

𝑌̂𝑖 es el valor estimado para cada 𝑋𝑖 . n es el número de pares ordenados; 𝑖 varía desde 1 hasta n.

La distancia vertical entre el 𝑌𝑖 , que es el valor observado o real de las ordenadas de los datos, e "𝑒𝑖 " se le denomina error y está representado por: 𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖

También se puede trabajar elevando la ecuación anterior al cuadrado, obteniendo: 2 𝑒𝑖2 = (𝑌𝑖 − 𝑌̂𝑖 )

Lo que resulta el “error cuadrático”; si se hace la sumatoria de todos los errores cuadráticos desde “i” hasta “n” se obtiene:

𝑛

𝑛

∑ 𝑒𝑖2 𝑖

2 = ∑(𝑌𝑖 − 𝑌̂𝑖 ) 𝑖

¿Por qué? -

Lo que se busca es minimizar el valor de la sumatoria del error cuadrático, si esto se aproxima más a cero significa que se ha encontrado la recta que mejor se ajuste a los datos.

Reemplazando en la ecuación anterior, la sumatoria del error cuadrático, el valor de 𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏 se obtiene: 𝑛

∑ 𝑒𝑖2 𝑖

𝑛

= ∑(𝑌𝑖 − 𝒂 ∗ 𝑿𝒊 − 𝒃)2 𝑖

2 El valor de ∑𝑛 𝑖 𝑒𝑖 va a depender de los valores de “a” y “b” para que sea mínimo por lo que se puede representar la ecuación anterior como una función que depende de los valores de “a” y “b”.

𝑛

𝐹(𝑎, 𝑏) =

𝑛

∑ 𝑒𝑖2 𝑖

= ∑(𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏)2 𝑖

Para encontrar los valores de “a” y “b” los cuales hagan que el valor de F(a,b) sea mínimo se tiene que desarrollar las derivadas parciales de la función respecto a “a” y “b” e igualar a cero. 𝜕𝐹(𝑎, 𝑏) =0 𝜕𝑎 𝜕𝐹(𝑎, 𝑏) =0 𝜕𝑏 

Desarrollando la derivada parcial de F(a,b) respecto a “b” se obtiene: 𝑛

𝜕𝐹(𝑎, 𝑏) = ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) = 0 𝜕𝑏 𝑖

𝑛

𝑛

𝑛

∑ 𝑌𝑖 − ∑ 𝑎 ∗ 𝑋𝑖 − ∑ 𝑏 = 0 𝑖

𝑖

𝑖

Sí “a” y “b” son constantes, se obtiene: 𝑛

𝑛

𝑛

∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ ∑ 1 = 0 𝑖

Si se resuelve

∑𝑛𝑖 1

, resulta que

𝑖

∑𝑛𝑖 1

𝑖

= 𝑛.

𝑛

𝑛

∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ 𝑛 = 0 𝑖

𝑖

La ecuación anterior es igual a: 𝑛

𝑛

∑ 𝑌𝑖 = 𝑎 ∗ ∑ 𝑋𝑖 + 𝑏 ∗ 𝑛 … … . . (1) 𝑖



𝑖

Desarrollando la derivada parcial de F(a,b) respecto a “a” se obtiene: 𝑛

𝜕𝐹(𝑎, 𝑏) = ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) ∗ 𝑋𝑖 = 0 𝜕𝑎 𝑖

𝑛

𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑎 𝑖

𝑖

𝑛

∗ 𝑋𝑖2

− ∑ 𝑏 ∗ 𝑋𝑖 = 0 𝑖

Extrayendo “a” y “b” de la sumatorias: 𝑛

𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) − 𝑎 𝑖

∗ ∑ 𝑋𝑖2 𝑖

𝑛

− 𝑏 ∗ ∑ 𝑋𝑖 = 0 𝑖

La ecuación anterior es igual a: 𝑛

𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) = 𝑎 ∗ 𝑖

𝑛

∑ 𝑋𝑖2 𝑖

+ 𝑏 ∗ ∑ 𝑋𝑖 … … (2) 𝑖

Para poder resolver las ecuaciones (1) y (2) y encontrar los valores de “a” y “b” se resuelve por medio de matrices.

𝑛

𝑛

𝑛

∑ 𝑋𝑖2 𝑖 𝑛

∑ 𝑋𝑖

∑ 𝑋𝑖

𝑛

[

]

𝑖

∑(𝑌𝑖 ∗ 𝑋𝑖 )

𝑎 ∗[ ]= 𝑏

𝑖

𝑖

[

𝑛

∑ 𝑌𝑖 𝑖

]

El sistema de ecuaciones anterior puede ser resuelto por la regla de Cramer, mediante el uso de determinantes.

𝑛

𝑛

∑ 𝑋𝑖2 𝑖 𝑛

∑ 𝑋𝑖

∑ 𝑋𝑖

𝑛

[

𝑛

𝑖

𝑖

]

𝑛

𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) ∑ 𝑋𝑖

[

𝑛

∑ 𝑌𝑖 𝑖

2

= 𝑛 ∗ ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 ) … … … … … . (3)

𝑖

𝑖

𝑛

𝑖

𝑛

𝑖

𝑛

𝑛

= 𝑛 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑋𝑖 ∗ ∑ 𝑌𝑖 … … … … … . (4) 𝑖

𝑛 ]

𝑖

𝑖

𝑛

𝑛

∑ 𝑋𝑖2 𝑖 𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 )

∑ 𝑋𝑖

∑ 𝑌𝑖

[

𝑖

𝑖

=

𝑛

𝑖

𝑛

𝑛

∑ 𝑌𝑖 ∗ ∑ 𝑋𝑖2 𝑖 𝑖

𝑛

𝑛

− ∑ 𝑋𝑖 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) … … . (5) 𝑖

𝑖

]

Dividiendo las determinantes se obtiene:

𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(4) 𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖 𝑎= = 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2

𝑏=

𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(5) ∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) = 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2

2.

COEFICIENTE DE DETERMINACION Y CORRELACION

Una vez ajustada la recta de regresión, es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es correcto. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido por: 2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) R = 𝑛 ∑𝑖 (𝑌𝑖 − 𝑌̅)2 2

𝑟 = √𝑅 2 

Donde R2 es el coeficiente de determinación y mide la cantidad de datos

que se encuentran sobre la recta linealizada. 

“r” es el coeficiente de correlación y mide cuan relacionados están las

variable Y y X. 3. APLICANDO A LA DISTRIBUCIÓN DE WEIBULL La función acumulativa de distribución de fallos F(t) está dada por:

𝐹(𝑡) = 1 − 𝑒

−(

𝑡−𝛾 𝛽 ) 𝜂

𝑡−𝛾 𝛽 −( ) 𝑒 𝜂

1 − 𝐹(𝑡) = 𝑡−𝛾 𝛽 1 ( ) =𝑒 𝜂 1 − 𝐹(𝑡)

Para determinar los parámetros de la distribución de Weibull es necesario linealizar la ecuación de la infiabilidad para que este se asemeje a la ecuación de una recta. Esto se logra aplicando doble logaritmo neperiano a la ecuación anterior.

ln (ln (

1 )) = 𝛽 ∗ ln(𝑡 − 𝛾) − 𝛽 ∗ ln(𝜂) 1 − 𝐹(𝑡)

Si igualamos a la ecuación de la recta: 1 𝑌 = ln (ln ( )) 1 − 𝐹(𝑡) 𝑋 = ln(𝑡 − 𝛾) 𝑎=𝛽 𝑏 = −𝛽 ∗ ln(𝜂) Para resolver estas ecuaciones se recurrirá a la fórmula de Bernard y que es igual a:

𝐹(𝑖) =

fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299

𝑖 − 0.3 𝑛 + 0.4

Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657

41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 

4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683

0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988

Con estos datos se procede a calcular los parámetros de la distribución Weibull con mínimos cuadrados con un Y=0:

fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353

Fi=(i-0.3)/(n+0.4) Yi=ln(ln(1/1-Fi)) 0.012 -4.452 0.028 -3.556 0.045 -3.085 0.061 -2.761 0.078 -2.513 0.094 -2.311 0.111 -2.141 0.127 -1.992 0.144 -1.861 0.161 -1.743 0.177 -1.635 0.194 -1.536 0.210 -1.444 0.227 -1.358 0.243 -1.277 0.260 -1.201 0.276 -1.128 0.293 -1.059 0.310 -0.993

Xi=ln(t-γ) 6.254 6.354 6.946 6.958 7.157 7.539 7.707 7.787 7.831 7.907 7.988 8.006 8.056 8.064 8.071 8.088 8.114 8.118 8.118

Xi^2 39.110 40.378 48.247 48.420 51.222 56.837 59.399 60.637 61.322 62.513 63.806 64.102 64.906 65.033 65.145 65.420 65.837 65.896 65.896

Xi*Yi -27.841 -22.597 -21.428 -19.214 -17.987 -17.425 -16.498 -15.514 -14.572 -13.778 -13.059 -12.295 -11.631 -10.949 -10.306 -9.711 -9.154 -8.597 -8.060

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683

0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988

-0.929 -0.868 -0.809 -0.752 -0.697 -0.643 -0.590 -0.539 -0.488 -0.439 -0.390 -0.343 -0.296 -0.249 -0.203 -0.157 -0.112 -0.067 -0.022 0.023 0.068 0.114 0.159 0.205 0.251 0.298 0.346 0.394 0.444 0.496 0.549 0.604 0.661 0.723 0.788 0.859 0.937 1.027 1.134 1.273 1.495 ∑Y=-33.790

8.138 66.227 -7.564 8.146 66.359 -7.074 8.172 66.789 -6.614 8.184 66.973 -6.156 8.186 67.018 -5.704 8.192 67.105 -5.265 8.192 67.114 -4.835 8.215 67.482 -4.425 8.246 67.995 -4.027 8.249 68.047 -3.621 8.260 68.223 -3.225 8.261 68.244 -2.831 8.273 68.448 -2.446 8.273 68.448 -2.060 8.283 68.604 -1.681 8.288 68.691 -1.303 8.331 69.403 -0.932 8.350 69.722 -0.557 8.350 69.730 -0.180 8.355 69.805 0.196 8.366 69.992 0.573 8.372 70.093 0.952 8.376 70.163 1.333 8.382 70.255 1.718 8.392 70.431 2.108 8.404 70.635 2.506 8.414 70.789 2.910 8.422 70.926 3.322 8.463 71.618 3.760 8.469 71.725 4.197 8.477 71.859 4.650 8.494 72.147 5.128 8.514 72.491 5.632 8.542 72.967 6.172 8.547 73.044 6.734 8.584 73.693 7.373 8.700 75.696 8.156 8.721 76.052 8.956 8.756 76.671 9.929 8.832 78.004 11.240 8.947 80.045 13.372 ∑X=489.183 ∑X^2=4003.849 ∑X*Y=-240.203

Entonces reemplazando en las ecuaciones siguientes, resulta:

𝑎=

𝑏=

𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )

2

=

60 ∗ (−240.203) − (489.183) ∗ (−33.79) 60 ∗ (4003.849) − (489.183)^2

∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) (−33.79) ∗ (4003.849) − (489.183) ∗ (−240.203) = 60 ∗ (4003.849) − (489.183)^2 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2

a= b=

2.28 -19.11

Y los parámetros 𝛽 & 𝜂 son: 

𝛽 = 𝑎 = 2.28



𝑏 = −𝛽 ∗ ln(𝜂) 𝑏

𝜂 = 𝑒 −𝑎 = 𝑒 −(

−19.11 ) 2.28

= 4449.64

BETA (𝛽) ETA (𝜂)

2.28 4449.64

 Reemplazando los parámetros “eta” y “beta” en la ecuación de infiabilidad se obtiene: 𝐹(𝑡) = 1 − 𝑒

fallas 1 2 3 4 5 6 7 8 9 10 11 12 13

Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154

−(

𝑡−𝛾 𝛽 ) 𝜂

−(

𝐹(𝑡) = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668

𝑡−𝛾 𝛽 ) 𝜂

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58

3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350

0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942

59 60 

6850 7683

0.9307 0.9687

Con estos datos se calcula los coeficientes de determinación y correlación

fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232

𝑡−𝛾 𝛽 −( ) 𝜂

𝐹(𝑡) = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902

Ŷi=ln(ln(1/1- 𝐹(𝑡))) -4.8843 -4.6556 -3.3094 -3.2812 -2.8295 -1.9602 -1.5779 -1.3961 -1.2963 -1.1240 -0.9390 -0.8969 -0.7830 -0.7651 -0.7494 -0.7106 -0.6520 -0.6438 -0.6438 -0.5975 -0.5789 -0.5190 -0.4935 -0.4872 -0.4752 -0.4739 -0.4228 -0.3519 -0.3448 -0.3205 -0.3175 -0.2895 -0.2895 -0.2681 -0.2561 -0.1586 -0.1152 -0.1141

39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683

0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687

-0.1039 -0.0784 -0.0646 -0.0552 -0.0427 -0.0188 0.0089 0.0296 0.0482 0.1414 0.1558 0.1739 0.2124 0.2585 0.3219 0.3321 0.4184 0.6820 0.7285 0.8091 0.9816 1.2427

Del cuadro anterior obtenemos 𝑌̅, que es igual al promedio de la columna Ŷi: 𝑌̅ = −0.563 Para reemplazar en la fórmula del coeficiente de determinación se necesita el 𝑌̅ : R2 = Yi=ln(ln(1/1- Ŷi=ln(ln(1/1Fi)) 𝐹(𝑡))) -4.452 -4.8843 -3.556 -4.6556 -3.085 -3.3094 -2.761 -3.2812 -2.513 -2.8295 -2.311 -1.9602 -2.141 -1.5779 -1.992 -1.3961 -1.861 -1.2963 -1.743 -1.1240 -1.635 -0.9390 -1.536 -0.8969

2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) ∑𝑛𝑖(𝑌𝑖 − 𝑌̅)2

(Ŷi- Ῡ)^2 18.672 16.748 7.542 7.387 5.136 1.952 1.030 0.694 0.538 0.315 0.141 0.111

(Yi-Ῡ)^2 15.122 8.958 6.359 4.831 3.803 3.056 2.489 2.043 1.684 1.391 1.148 0.946

-1.444 -1.358 -1.277 -1.201 -1.128 -1.059 -0.993 -0.929 -0.868 -0.809 -0.752 -0.697 -0.643 -0.590 -0.539 -0.488 -0.439 -0.390 -0.343 -0.296 -0.249 -0.203 -0.157 -0.112 -0.067 -0.022 0.023 0.068 0.114 0.159 0.205 0.251 0.298 0.346 0.394 0.444 0.496 0.549 0.604 0.661 0.723 0.788 0.859 0.937 1.027

-0.7830 -0.7651 -0.7494 -0.7106 -0.6520 -0.6438 -0.6438 -0.5975 -0.5789 -0.5190 -0.4935 -0.4872 -0.4752 -0.4739 -0.4228 -0.3519 -0.3448 -0.3205 -0.3175 -0.2895 -0.2895 -0.2681 -0.2561 -0.1586 -0.1152 -0.1141 -0.1039 -0.0784 -0.0646 -0.0552 -0.0427 -0.0188 0.0089 0.0296 0.0482 0.1414 0.1558 0.1739 0.2124 0.2585 0.3219 0.3321 0.4184 0.6820 0.7285

0.048 0.041 0.035 0.022 0.008 0.007 0.007 0.001 0.000 0.002 0.005 0.006 0.008 0.008 0.020 0.045 0.048 0.059 0.060 0.075 0.075 0.087 0.094 0.164 0.201 0.202 0.211 0.235 0.249 0.258 0.271 0.296 0.327 0.351 0.374 0.496 0.517 0.543 0.601 0.675 0.783 0.802 0.964 1.551 1.669

0.775 0.631 0.509 0.406 0.319 0.246 0.185 0.134 0.093 0.061 0.036 0.018 0.006 0.001 0.001 0.006 0.015 0.030 0.049 0.072 0.099 0.130 0.165 0.204 0.247 0.293 0.344 0.399 0.458 0.522 0.590 0.663 0.742 0.826 0.917 1.015 1.121 1.236 1.362 1.500 1.653 1.826 2.022 2.252 2.529

1.134 1.273 1.495

0.8091 0.9816 1.2427

𝑛

1.883 2.386 3.261 2

∑(𝑌̂𝑖 − 𝑌̅) = 80.294

𝑛

2.880 3.370 4.235

∑(𝑌𝑖 − 𝑌̅)2 = 89.019

𝑖

𝑖

Reemplazando: 2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) 80.294 R = 𝑛 = = 0.902 2 ∑𝑖 (𝑌𝑖 − 𝑌̅) 89.019 2

 

El coeficiente de determinación: R^2=0.902 ó 90.2% El coeficiente de correlación de Pearson: r= 0.95

¿Cómo se interpretan estos resultados?  El coeficiente de correlación de Pearson indica que el 95% de nuestros datos (pares ordenados) están relacionados, es decir hay una correlacionan entre X y Y.  Mientras el coeficiente de determinación nos indica que el 90.2% de nuestros datos están sobre la recta.

4.

PRUEBAS DE BONDAD DE AJUSTE

a. PRUEBA DEL CHI CUADRADO

Compara las frecuencias que entregan los datos de la muestra (frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:

Donde “Oi” representa a cada frecuencia observada y “ei” representa a cada frecuencia esperada. Grados de libertad: 𝒓 = 𝑵 − 𝟏 − 𝒑 Donde p es el número de variables estimadas, siendo para el caso de la distribución weibull p=3.

Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442

−(

F̂ i = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807

𝑡−𝛾 𝛽 ) 𝜂

(Fi-F̂i)^2/(F̂i) 0.0022 0.0369 0.0022 0.0161 0.0073 0.0104 0.0306 0.0384 0.0379 0.0492 0.0663 0.0595 0.0668 0.0567 0.0472 0.0424 0.0414 0.0327 0.0240 0.0222 0.0174 0.0177 0.0144 0.0097 0.0063 0.0031 0.0031

0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988

0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687

0.0043 0.0021 0.0011 0.0002 0.0000 0.0004 0.0010 0.0024 0.0005 0.0005 0.0020 0.0037 0.0048 0.0070 0.0101 0.0133 0.0155 0.0172 0.0201 0.0234 0.0164 0.0199 0.0232 0.0237 0.0232 0.0206 0.0250 0.0198 0.0043 0.0048 0.0042 0.0018 0.0004 ∑(FiF̂i)^2/(F̂i)=1.0790

Como el valor de X^2 es X^2=

, tenemos: 1.0790

El GRADO DE LIBERTAD es: 60-1-3=56

GRADO DE CONFIANZA DE 95%

GRADO DE LIBERTAD DE 56

(Fuente: ttp://www.davidgiuliodori.com.ar/IUA_Estadistica_Superior.html)

Comparando con la tabla anterior para un nivel de significación de 0.05 o un grado de confianza de 95%, el valor de chi cuadrado es menor para un grado de libertad entre 40 y 60. X^2(calculado) < X^2(tabla) 1.079 < 1.6745 Por lo que sí se puede usar la distribución de Weibull para los datos analizados.

b.

PRUEBA DE KOLMOGOROV-SMIRNOV

En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí. 𝐷 + 𝑛=max(Fn(x)−F(x)) 𝐷 − 𝑛 =max(F(x)−Fn(x)) D=max[𝐷 + 𝑛, 𝐷 − 𝑛] Donde:  Fn(x) es la frecuencia observada  Fn es la frecuencia esperada

Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492

𝑡−𝛾 𝛽 −( ) 𝑒 𝜂

F̂ i = 1 − 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161

Fi-F̂i 0.00405 0.01868 0.00882 0.02437 0.02048 -0.03699 -0.07557 -0.09181 -0.09528 -0.11685 -0.14648 -0.14120 -0.15657 -0.14524 -0.13328 -0.12826 -0.12959 -0.11557 -0.09901 -0.09701 -0.08636 -0.08921 -0.08109 -0.06663 -0.05408 -0.03794 -0.03860 -0.04646 -0.03240 -0.02434

F̂i-Fi -0.0041 -0.0187 -0.0088 -0.0244 -0.0205 0.0370 0.0756 0.0918 0.0953 0.1169 0.1465 0.1412 0.1566 0.1452 0.1333 0.1283 0.1296 0.1156 0.0990 0.0970 0.0864 0.0892 0.0811 0.0666 0.0541 0.0379 0.0386 0.0465 0.0324 0.0243

0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988

0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687

-0.00881 -0.00215 0.01440 0.02337 0.03563 0.01706 0.01777 0.03394 0.04677 0.05396 0.06548 0.07857 0.09052 0.09831 0.10469 0.11360 0.12332 0.10577 0.11710 0.12710 0.12977 0.12987 0.12414 0.13717 0.12444 0.06054 0.06467 0.06112 0.04120 0.01969

D+max D-max

0.137 0.157

D

0.157

0.0088 0.0022 -0.0144 -0.0234 -0.0356 -0.0171 -0.0178 -0.0339 -0.0468 -0.0540 -0.0655 -0.0786 -0.0905 -0.0983 -0.1047 -0.1136 -0.1233 -0.1058 -0.1171 -0.1271 -0.1298 -0.1299 -0.1241 -0.1372 -0.1244 -0.0605 -0.0647 -0.0611 -0.0412 -0.0197

GRADO DE CONFIANZA DE 95%

60

0.138

0.147

0.158

0.176

0.210

Para un nivel de significancia igual a 0.05 el Dcritico es 0.176

Por lo que: D W tabla "la muestra no procede de una población normal".

Instrucciones 

Resuelve el valor W. La prueba Shapiro Wilks es interpretada basada en este valor. Por lo tanto, debes calcularlo.



Identifica el nivel alfa. Este nivel se usa cuando comparas el valor W. El nivel alfa se ofrece con frecuencia en problemas o puede localizarse en la gráfica alfa.



Compara el nivel alfa con el valor W. Rechaza la hipótesis nula de que el valor W es menor que el nivel alfa. Si éste es mayor que el nivel alfa, no rechaces la hipótesis nula.

fallas

horas menor

horas mayor a

coeficiente para

a mayor

menor

contraste “a”

D=a*(X(ni+1)-Xi)

1

520

7683

0.3751

2687

2

575

6850

0.2574

1615

3

1039

6350

0.226

1200

4

1052

6129

0.2032

1032

5

1283

6005

0.1847

872

6

1880

5348

0.1691

586

7

2224

5149

0.1554

455

8

2409

5126

0.143

389

9

2517

4985

0.1317

325

10

2715

4885

0.1212

263

11

2945

4803

0.1113

207

12

3000

4765

0.102

180

13

3154

4735

0.0932

147

14

3179

4545

0.0846

116

15

3201

4508

0.0764

100

16

3256

4467

0.0685

83

17

3341

4413

0.0608

65

18

3353

4367

0.0532

54

19

3353

4343

0.0459

45

20

3422

4325

0.0386

35

21

3450

4299

0.0314

27

22

3542

4251

0.0244

17

23

3582

4232

0.0174

11

24

3592

4230

0.0104

7

25

3611

4150

0.0035

2

26

3613

3976

27

3695

3955

28

3812

3918

29

3824

3918

30

3865

3870

31

3870

3865

32

3918

3824

33

3918

3812

34

3955

3695

35

3976

3613

36

4150

3611

37

4230

3592

38

4232

3582

39

4251

3542

40

4299

3450

41

4325

3422

42

4343

3353

43

4367

3353

44

4413

3341

45

4467

3256

46

4508

3201

47

4545

3179

48

4735

3154

49

4765

3000

50

4803

2945

51

4885

2715

52

4985

2517

53

5126

2409

54

5149

2224

55

5348

1880

56

6005

1283

57

6129

1052

58

6350

1039

∑D

10519

S^2=

403427

59

6850

575

60

7683

520

Analizamos el estadístico:

W>W tabla 4.57>0.974

CONCLUSIÓN La muestra proviene de una distribución normal, por lo tanto podemos usar la distribución de weibull.

COEFICIENTES a PARA LA PRUEBA DE NORMALIDAD DE SHAPIROWILK.