MÉTODO DE LOS MÍNIMOS CUADRADOS 1. MARCO TEORICO Es una técnica en la que, dados un conjunto de pares ordenados, se int
Views 296 Downloads 10 File size 1MB
MÉTODO DE LOS MÍNIMOS CUADRADOS
1. MARCO TEORICO Es una técnica en la que, dados un conjunto de pares ordenados, se intenta encontrar la función continua (ecuación de la recta) que mejor se aproxime a los datos (un "mejor ajuste"). FIGURA 1
(Fuente, http://fisicamatematic.wordpress.com)
FIGURA 2 (Fuente, https://sites.google.com/site/metalmetnumericos/home/unidad-3/3-9-metodo-deminimos-cuadrados)
La ecuación de la recta de la figura anterior es: 𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏 Donde:
𝑌̂𝑖 es el valor estimado para cada 𝑋𝑖 . n es el número de pares ordenados; 𝑖 varía desde 1 hasta n.
La distancia vertical entre el 𝑌𝑖 , que es el valor observado o real de las ordenadas de los datos, e "𝑒𝑖 " se le denomina error y está representado por: 𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
También se puede trabajar elevando la ecuación anterior al cuadrado, obteniendo: 2 𝑒𝑖2 = (𝑌𝑖 − 𝑌̂𝑖 )
Lo que resulta el “error cuadrático”; si se hace la sumatoria de todos los errores cuadráticos desde “i” hasta “n” se obtiene:
𝑛
𝑛
∑ 𝑒𝑖2 𝑖
2 = ∑(𝑌𝑖 − 𝑌̂𝑖 ) 𝑖
¿Por qué? -
Lo que se busca es minimizar el valor de la sumatoria del error cuadrático, si esto se aproxima más a cero significa que se ha encontrado la recta que mejor se ajuste a los datos.
Reemplazando en la ecuación anterior, la sumatoria del error cuadrático, el valor de 𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏 se obtiene: 𝑛
∑ 𝑒𝑖2 𝑖
𝑛
= ∑(𝑌𝑖 − 𝒂 ∗ 𝑿𝒊 − 𝒃)2 𝑖
2 El valor de ∑𝑛 𝑖 𝑒𝑖 va a depender de los valores de “a” y “b” para que sea mínimo por lo que se puede representar la ecuación anterior como una función que depende de los valores de “a” y “b”.
𝑛
𝐹(𝑎, 𝑏) =
𝑛
∑ 𝑒𝑖2 𝑖
= ∑(𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏)2 𝑖
Para encontrar los valores de “a” y “b” los cuales hagan que el valor de F(a,b) sea mínimo se tiene que desarrollar las derivadas parciales de la función respecto a “a” y “b” e igualar a cero. 𝜕𝐹(𝑎, 𝑏) =0 𝜕𝑎 𝜕𝐹(𝑎, 𝑏) =0 𝜕𝑏
Desarrollando la derivada parcial de F(a,b) respecto a “b” se obtiene: 𝑛
𝜕𝐹(𝑎, 𝑏) = ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) = 0 𝜕𝑏 𝑖
𝑛
𝑛
𝑛
∑ 𝑌𝑖 − ∑ 𝑎 ∗ 𝑋𝑖 − ∑ 𝑏 = 0 𝑖
𝑖
𝑖
Sí “a” y “b” son constantes, se obtiene: 𝑛
𝑛
𝑛
∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ ∑ 1 = 0 𝑖
Si se resuelve
∑𝑛𝑖 1
, resulta que
𝑖
∑𝑛𝑖 1
𝑖
= 𝑛.
𝑛
𝑛
∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ 𝑛 = 0 𝑖
𝑖
La ecuación anterior es igual a: 𝑛
𝑛
∑ 𝑌𝑖 = 𝑎 ∗ ∑ 𝑋𝑖 + 𝑏 ∗ 𝑛 … … . . (1) 𝑖
𝑖
Desarrollando la derivada parcial de F(a,b) respecto a “a” se obtiene: 𝑛
𝜕𝐹(𝑎, 𝑏) = ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) ∗ 𝑋𝑖 = 0 𝜕𝑎 𝑖
𝑛
𝑛
∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑎 𝑖
𝑖
𝑛
∗ 𝑋𝑖2
− ∑ 𝑏 ∗ 𝑋𝑖 = 0 𝑖
Extrayendo “a” y “b” de la sumatorias: 𝑛
𝑛
∑(𝑌𝑖 ∗ 𝑋𝑖 ) − 𝑎 𝑖
∗ ∑ 𝑋𝑖2 𝑖
𝑛
− 𝑏 ∗ ∑ 𝑋𝑖 = 0 𝑖
La ecuación anterior es igual a: 𝑛
𝑛
∑(𝑌𝑖 ∗ 𝑋𝑖 ) = 𝑎 ∗ 𝑖
𝑛
∑ 𝑋𝑖2 𝑖
+ 𝑏 ∗ ∑ 𝑋𝑖 … … (2) 𝑖
Para poder resolver las ecuaciones (1) y (2) y encontrar los valores de “a” y “b” se resuelve por medio de matrices.
𝑛
𝑛
𝑛
∑ 𝑋𝑖2 𝑖 𝑛
∑ 𝑋𝑖
∑ 𝑋𝑖
𝑛
[
]
𝑖
∑(𝑌𝑖 ∗ 𝑋𝑖 )
𝑎 ∗[ ]= 𝑏
𝑖
𝑖
[
𝑛
∑ 𝑌𝑖 𝑖
]
El sistema de ecuaciones anterior puede ser resuelto por la regla de Cramer, mediante el uso de determinantes.
𝑛
𝑛
∑ 𝑋𝑖2 𝑖 𝑛
∑ 𝑋𝑖
∑ 𝑋𝑖
𝑛
[
𝑛
𝑖
𝑖
]
𝑛
𝑛
∑(𝑌𝑖 ∗ 𝑋𝑖 ) ∑ 𝑋𝑖
[
𝑛
∑ 𝑌𝑖 𝑖
2
= 𝑛 ∗ ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 ) … … … … … . (3)
𝑖
𝑖
𝑛
𝑖
𝑛
𝑖
𝑛
𝑛
= 𝑛 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑋𝑖 ∗ ∑ 𝑌𝑖 … … … … … . (4) 𝑖
𝑛 ]
𝑖
𝑖
𝑛
𝑛
∑ 𝑋𝑖2 𝑖 𝑛
∑(𝑌𝑖 ∗ 𝑋𝑖 )
∑ 𝑋𝑖
∑ 𝑌𝑖
[
𝑖
𝑖
=
𝑛
𝑖
𝑛
𝑛
∑ 𝑌𝑖 ∗ ∑ 𝑋𝑖2 𝑖 𝑖
𝑛
𝑛
− ∑ 𝑋𝑖 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) … … . (5) 𝑖
𝑖
]
Dividiendo las determinantes se obtiene:
𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(4) 𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖 𝑎= = 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2
𝑏=
𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(5) ∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) = 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2
2.
COEFICIENTE DE DETERMINACION Y CORRELACION
Una vez ajustada la recta de regresión, es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es correcto. Como medida de bondad del ajuste se utiliza el coeficiente de determinación, definido por: 2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) R = 𝑛 ∑𝑖 (𝑌𝑖 − 𝑌̅)2 2
𝑟 = √𝑅 2
Donde R2 es el coeficiente de determinación y mide la cantidad de datos
que se encuentran sobre la recta linealizada.
“r” es el coeficiente de correlación y mide cuan relacionados están las
variable Y y X. 3. APLICANDO A LA DISTRIBUCIÓN DE WEIBULL La función acumulativa de distribución de fallos F(t) está dada por:
𝐹(𝑡) = 1 − 𝑒
−(
𝑡−𝛾 𝛽 ) 𝜂
𝑡−𝛾 𝛽 −( ) 𝑒 𝜂
1 − 𝐹(𝑡) = 𝑡−𝛾 𝛽 1 ( ) =𝑒 𝜂 1 − 𝐹(𝑡)
Para determinar los parámetros de la distribución de Weibull es necesario linealizar la ecuación de la infiabilidad para que este se asemeje a la ecuación de una recta. Esto se logra aplicando doble logaritmo neperiano a la ecuación anterior.
ln (ln (
1 )) = 𝛽 ∗ ln(𝑡 − 𝛾) − 𝛽 ∗ ln(𝜂) 1 − 𝐹(𝑡)
Si igualamos a la ecuación de la recta: 1 𝑌 = ln (ln ( )) 1 − 𝐹(𝑡) 𝑋 = ln(𝑡 − 𝛾) 𝑎=𝛽 𝑏 = −𝛽 ∗ ln(𝜂) Para resolver estas ecuaciones se recurrirá a la fórmula de Bernard y que es igual a:
𝐹(𝑖) =
fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299
𝑖 − 0.3 𝑛 + 0.4
Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683
0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988
Con estos datos se procede a calcular los parámetros de la distribución Weibull con mínimos cuadrados con un Y=0:
fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353
Fi=(i-0.3)/(n+0.4) Yi=ln(ln(1/1-Fi)) 0.012 -4.452 0.028 -3.556 0.045 -3.085 0.061 -2.761 0.078 -2.513 0.094 -2.311 0.111 -2.141 0.127 -1.992 0.144 -1.861 0.161 -1.743 0.177 -1.635 0.194 -1.536 0.210 -1.444 0.227 -1.358 0.243 -1.277 0.260 -1.201 0.276 -1.128 0.293 -1.059 0.310 -0.993
Xi=ln(t-γ) 6.254 6.354 6.946 6.958 7.157 7.539 7.707 7.787 7.831 7.907 7.988 8.006 8.056 8.064 8.071 8.088 8.114 8.118 8.118
Xi^2 39.110 40.378 48.247 48.420 51.222 56.837 59.399 60.637 61.322 62.513 63.806 64.102 64.906 65.033 65.145 65.420 65.837 65.896 65.896
Xi*Yi -27.841 -22.597 -21.428 -19.214 -17.987 -17.425 -16.498 -15.514 -14.572 -13.778 -13.059 -12.295 -11.631 -10.949 -10.306 -9.711 -9.154 -8.597 -8.060
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683
0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988
-0.929 -0.868 -0.809 -0.752 -0.697 -0.643 -0.590 -0.539 -0.488 -0.439 -0.390 -0.343 -0.296 -0.249 -0.203 -0.157 -0.112 -0.067 -0.022 0.023 0.068 0.114 0.159 0.205 0.251 0.298 0.346 0.394 0.444 0.496 0.549 0.604 0.661 0.723 0.788 0.859 0.937 1.027 1.134 1.273 1.495 ∑Y=-33.790
8.138 66.227 -7.564 8.146 66.359 -7.074 8.172 66.789 -6.614 8.184 66.973 -6.156 8.186 67.018 -5.704 8.192 67.105 -5.265 8.192 67.114 -4.835 8.215 67.482 -4.425 8.246 67.995 -4.027 8.249 68.047 -3.621 8.260 68.223 -3.225 8.261 68.244 -2.831 8.273 68.448 -2.446 8.273 68.448 -2.060 8.283 68.604 -1.681 8.288 68.691 -1.303 8.331 69.403 -0.932 8.350 69.722 -0.557 8.350 69.730 -0.180 8.355 69.805 0.196 8.366 69.992 0.573 8.372 70.093 0.952 8.376 70.163 1.333 8.382 70.255 1.718 8.392 70.431 2.108 8.404 70.635 2.506 8.414 70.789 2.910 8.422 70.926 3.322 8.463 71.618 3.760 8.469 71.725 4.197 8.477 71.859 4.650 8.494 72.147 5.128 8.514 72.491 5.632 8.542 72.967 6.172 8.547 73.044 6.734 8.584 73.693 7.373 8.700 75.696 8.156 8.721 76.052 8.956 8.756 76.671 9.929 8.832 78.004 11.240 8.947 80.045 13.372 ∑X=489.183 ∑X^2=4003.849 ∑X*Y=-240.203
Entonces reemplazando en las ecuaciones siguientes, resulta:
𝑎=
𝑏=
𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )
2
=
60 ∗ (−240.203) − (489.183) ∗ (−33.79) 60 ∗ (4003.849) − (489.183)^2
∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) (−33.79) ∗ (4003.849) − (489.183) ∗ (−240.203) = 60 ∗ (4003.849) − (489.183)^2 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2
a= b=
2.28 -19.11
Y los parámetros 𝛽 & 𝜂 son:
𝛽 = 𝑎 = 2.28
𝑏 = −𝛽 ∗ ln(𝜂) 𝑏
𝜂 = 𝑒 −𝑎 = 𝑒 −(
−19.11 ) 2.28
= 4449.64
BETA (𝛽) ETA (𝜂)
2.28 4449.64
Reemplazando los parámetros “eta” y “beta” en la ecuación de infiabilidad se obtiene: 𝐹(𝑡) = 1 − 𝑒
fallas 1 2 3 4 5 6 7 8 9 10 11 12 13
Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154
−(
𝑡−𝛾 𝛽 ) 𝜂
−(
𝐹(𝑡) = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668
𝑡−𝛾 𝛽 ) 𝜂
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232 4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350
0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942
59 60
6850 7683
0.9307 0.9687
Con estos datos se calcula los coeficientes de determinación y correlación
fallas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
Horas (t) 520 575 1039 1052 1283 1880 2224 2409 2517 2715 2945 3000 3154 3179 3201 3256 3341 3353 3353 3422 3450 3542 3582 3592 3611 3613 3695 3812 3824 3865 3870 3918 3918 3955 3976 4150 4230 4232
𝑡−𝛾 𝛽 −( ) 𝜂
𝐹(𝑡) = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902
Ŷi=ln(ln(1/1- 𝐹(𝑡))) -4.8843 -4.6556 -3.3094 -3.2812 -2.8295 -1.9602 -1.5779 -1.3961 -1.2963 -1.1240 -0.9390 -0.8969 -0.7830 -0.7651 -0.7494 -0.7106 -0.6520 -0.6438 -0.6438 -0.5975 -0.5789 -0.5190 -0.4935 -0.4872 -0.4752 -0.4739 -0.4228 -0.3519 -0.3448 -0.3205 -0.3175 -0.2895 -0.2895 -0.2681 -0.2561 -0.1586 -0.1152 -0.1141
39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
4251 4299 4325 4343 4367 4413 4467 4508 4545 4735 4765 4803 4885 4985 5126 5149 5348 6005 6129 6350 6850 7683
0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687
-0.1039 -0.0784 -0.0646 -0.0552 -0.0427 -0.0188 0.0089 0.0296 0.0482 0.1414 0.1558 0.1739 0.2124 0.2585 0.3219 0.3321 0.4184 0.6820 0.7285 0.8091 0.9816 1.2427
Del cuadro anterior obtenemos 𝑌̅, que es igual al promedio de la columna Ŷi: 𝑌̅ = −0.563 Para reemplazar en la fórmula del coeficiente de determinación se necesita el 𝑌̅ : R2 = Yi=ln(ln(1/1- Ŷi=ln(ln(1/1Fi)) 𝐹(𝑡))) -4.452 -4.8843 -3.556 -4.6556 -3.085 -3.3094 -2.761 -3.2812 -2.513 -2.8295 -2.311 -1.9602 -2.141 -1.5779 -1.992 -1.3961 -1.861 -1.2963 -1.743 -1.1240 -1.635 -0.9390 -1.536 -0.8969
2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) ∑𝑛𝑖(𝑌𝑖 − 𝑌̅)2
(Ŷi- Ῡ)^2 18.672 16.748 7.542 7.387 5.136 1.952 1.030 0.694 0.538 0.315 0.141 0.111
(Yi-Ῡ)^2 15.122 8.958 6.359 4.831 3.803 3.056 2.489 2.043 1.684 1.391 1.148 0.946
-1.444 -1.358 -1.277 -1.201 -1.128 -1.059 -0.993 -0.929 -0.868 -0.809 -0.752 -0.697 -0.643 -0.590 -0.539 -0.488 -0.439 -0.390 -0.343 -0.296 -0.249 -0.203 -0.157 -0.112 -0.067 -0.022 0.023 0.068 0.114 0.159 0.205 0.251 0.298 0.346 0.394 0.444 0.496 0.549 0.604 0.661 0.723 0.788 0.859 0.937 1.027
-0.7830 -0.7651 -0.7494 -0.7106 -0.6520 -0.6438 -0.6438 -0.5975 -0.5789 -0.5190 -0.4935 -0.4872 -0.4752 -0.4739 -0.4228 -0.3519 -0.3448 -0.3205 -0.3175 -0.2895 -0.2895 -0.2681 -0.2561 -0.1586 -0.1152 -0.1141 -0.1039 -0.0784 -0.0646 -0.0552 -0.0427 -0.0188 0.0089 0.0296 0.0482 0.1414 0.1558 0.1739 0.2124 0.2585 0.3219 0.3321 0.4184 0.6820 0.7285
0.048 0.041 0.035 0.022 0.008 0.007 0.007 0.001 0.000 0.002 0.005 0.006 0.008 0.008 0.020 0.045 0.048 0.059 0.060 0.075 0.075 0.087 0.094 0.164 0.201 0.202 0.211 0.235 0.249 0.258 0.271 0.296 0.327 0.351 0.374 0.496 0.517 0.543 0.601 0.675 0.783 0.802 0.964 1.551 1.669
0.775 0.631 0.509 0.406 0.319 0.246 0.185 0.134 0.093 0.061 0.036 0.018 0.006 0.001 0.001 0.006 0.015 0.030 0.049 0.072 0.099 0.130 0.165 0.204 0.247 0.293 0.344 0.399 0.458 0.522 0.590 0.663 0.742 0.826 0.917 1.015 1.121 1.236 1.362 1.500 1.653 1.826 2.022 2.252 2.529
1.134 1.273 1.495
0.8091 0.9816 1.2427
𝑛
1.883 2.386 3.261 2
∑(𝑌̂𝑖 − 𝑌̅) = 80.294
𝑛
2.880 3.370 4.235
∑(𝑌𝑖 − 𝑌̅)2 = 89.019
𝑖
𝑖
Reemplazando: 2 ∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) 80.294 R = 𝑛 = = 0.902 2 ∑𝑖 (𝑌𝑖 − 𝑌̅) 89.019 2
El coeficiente de determinación: R^2=0.902 ó 90.2% El coeficiente de correlación de Pearson: r= 0.95
¿Cómo se interpretan estos resultados? El coeficiente de correlación de Pearson indica que el 95% de nuestros datos (pares ordenados) están relacionados, es decir hay una correlacionan entre X y Y. Mientras el coeficiente de determinación nos indica que el 90.2% de nuestros datos están sobre la recta.
4.
PRUEBAS DE BONDAD DE AJUSTE
a. PRUEBA DEL CHI CUADRADO
Compara las frecuencias que entregan los datos de la muestra (frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:
Donde “Oi” representa a cada frecuencia observada y “ei” representa a cada frecuencia esperada. Grados de libertad: 𝒓 = 𝑵 − 𝟏 − 𝒑 Donde p es el número de variables estimadas, siendo para el caso de la distribución weibull p=3.
Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442
−(
F̂ i = 1 − 𝑒 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807
𝑡−𝛾 𝛽 ) 𝜂
(Fi-F̂i)^2/(F̂i) 0.0022 0.0369 0.0022 0.0161 0.0073 0.0104 0.0306 0.0384 0.0379 0.0492 0.0663 0.0595 0.0668 0.0567 0.0472 0.0424 0.0414 0.0327 0.0240 0.0222 0.0174 0.0177 0.0144 0.0097 0.0063 0.0031 0.0031
0.459 0.475 0.492 0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988
0.5051 0.5076 0.5161 0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687
0.0043 0.0021 0.0011 0.0002 0.0000 0.0004 0.0010 0.0024 0.0005 0.0005 0.0020 0.0037 0.0048 0.0070 0.0101 0.0133 0.0155 0.0172 0.0201 0.0234 0.0164 0.0199 0.0232 0.0237 0.0232 0.0206 0.0250 0.0198 0.0043 0.0048 0.0042 0.0018 0.0004 ∑(FiF̂i)^2/(F̂i)=1.0790
Como el valor de X^2 es X^2=
, tenemos: 1.0790
El GRADO DE LIBERTAD es: 60-1-3=56
GRADO DE CONFIANZA DE 95%
GRADO DE LIBERTAD DE 56
(Fuente: ttp://www.davidgiuliodori.com.ar/IUA_Estadistica_Superior.html)
Comparando con la tabla anterior para un nivel de significación de 0.05 o un grado de confianza de 95%, el valor de chi cuadrado es menor para un grado de libertad entre 40 y 60. X^2(calculado) < X^2(tabla) 1.079 < 1.6745 Por lo que sí se puede usar la distribución de Weibull para los datos analizados.
b.
PRUEBA DE KOLMOGOROV-SMIRNOV
En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí. 𝐷 + 𝑛=max(Fn(x)−F(x)) 𝐷 − 𝑛 =max(F(x)−Fn(x)) D=max[𝐷 + 𝑛, 𝐷 − 𝑛] Donde: Fn(x) es la frecuencia observada Fn es la frecuencia esperada
Fi=(i-0.3)/(n+0.4) 0.012 0.028 0.045 0.061 0.078 0.094 0.111 0.127 0.144 0.161 0.177 0.194 0.210 0.227 0.243 0.260 0.276 0.293 0.310 0.326 0.343 0.359 0.376 0.392 0.409 0.425 0.442 0.459 0.475 0.492
𝑡−𝛾 𝛽 −( ) 𝑒 𝜂
F̂ i = 1 − 0.0075 0.0095 0.0359 0.0369 0.0573 0.1314 0.1865 0.2193 0.2393 0.2774 0.3236 0.3349 0.3668 0.3721 0.3767 0.3882 0.4061 0.4086 0.4086 0.4232 0.4291 0.4485 0.4569 0.4590 0.4630 0.4634 0.4807 0.5051 0.5076 0.5161
Fi-F̂i 0.00405 0.01868 0.00882 0.02437 0.02048 -0.03699 -0.07557 -0.09181 -0.09528 -0.11685 -0.14648 -0.14120 -0.15657 -0.14524 -0.13328 -0.12826 -0.12959 -0.11557 -0.09901 -0.09701 -0.08636 -0.08921 -0.08109 -0.06663 -0.05408 -0.03794 -0.03860 -0.04646 -0.03240 -0.02434
F̂i-Fi -0.0041 -0.0187 -0.0088 -0.0244 -0.0205 0.0370 0.0756 0.0918 0.0953 0.1169 0.1465 0.1412 0.1566 0.1452 0.1333 0.1283 0.1296 0.1156 0.0990 0.0970 0.0864 0.0892 0.0811 0.0666 0.0541 0.0379 0.0386 0.0465 0.0324 0.0243
0.508 0.525 0.541 0.558 0.575 0.591 0.608 0.624 0.641 0.657 0.674 0.690 0.707 0.724 0.740 0.757 0.773 0.790 0.806 0.823 0.839 0.856 0.873 0.889 0.906 0.922 0.939 0.955 0.972 0.988
0.5171 0.5270 0.5270 0.5346 0.5389 0.5740 0.5898 0.5902 0.5940 0.6033 0.6084 0.6118 0.6164 0.6252 0.6354 0.6430 0.6499 0.6840 0.6892 0.6957 0.7096 0.7261 0.7484 0.7519 0.7812 0.8616 0.8741 0.8942 0.9307 0.9687
-0.00881 -0.00215 0.01440 0.02337 0.03563 0.01706 0.01777 0.03394 0.04677 0.05396 0.06548 0.07857 0.09052 0.09831 0.10469 0.11360 0.12332 0.10577 0.11710 0.12710 0.12977 0.12987 0.12414 0.13717 0.12444 0.06054 0.06467 0.06112 0.04120 0.01969
D+max D-max
0.137 0.157
D
0.157
0.0088 0.0022 -0.0144 -0.0234 -0.0356 -0.0171 -0.0178 -0.0339 -0.0468 -0.0540 -0.0655 -0.0786 -0.0905 -0.0983 -0.1047 -0.1136 -0.1233 -0.1058 -0.1171 -0.1271 -0.1298 -0.1299 -0.1241 -0.1372 -0.1244 -0.0605 -0.0647 -0.0611 -0.0412 -0.0197
GRADO DE CONFIANZA DE 95%
60
0.138
0.147
0.158
0.176
0.210
Para un nivel de significancia igual a 0.05 el Dcritico es 0.176
Por lo que: D W tabla "la muestra no procede de una población normal".
Instrucciones
Resuelve el valor W. La prueba Shapiro Wilks es interpretada basada en este valor. Por lo tanto, debes calcularlo.
Identifica el nivel alfa. Este nivel se usa cuando comparas el valor W. El nivel alfa se ofrece con frecuencia en problemas o puede localizarse en la gráfica alfa.
Compara el nivel alfa con el valor W. Rechaza la hipótesis nula de que el valor W es menor que el nivel alfa. Si éste es mayor que el nivel alfa, no rechaces la hipótesis nula.
fallas
horas menor
horas mayor a
coeficiente para
a mayor
menor
contraste “a”
D=a*(X(ni+1)-Xi)
1
520
7683
0.3751
2687
2
575
6850
0.2574
1615
3
1039
6350
0.226
1200
4
1052
6129
0.2032
1032
5
1283
6005
0.1847
872
6
1880
5348
0.1691
586
7
2224
5149
0.1554
455
8
2409
5126
0.143
389
9
2517
4985
0.1317
325
10
2715
4885
0.1212
263
11
2945
4803
0.1113
207
12
3000
4765
0.102
180
13
3154
4735
0.0932
147
14
3179
4545
0.0846
116
15
3201
4508
0.0764
100
16
3256
4467
0.0685
83
17
3341
4413
0.0608
65
18
3353
4367
0.0532
54
19
3353
4343
0.0459
45
20
3422
4325
0.0386
35
21
3450
4299
0.0314
27
22
3542
4251
0.0244
17
23
3582
4232
0.0174
11
24
3592
4230
0.0104
7
25
3611
4150
0.0035
2
26
3613
3976
27
3695
3955
28
3812
3918
29
3824
3918
30
3865
3870
31
3870
3865
32
3918
3824
33
3918
3812
34
3955
3695
35
3976
3613
36
4150
3611
37
4230
3592
38
4232
3582
39
4251
3542
40
4299
3450
41
4325
3422
42
4343
3353
43
4367
3353
44
4413
3341
45
4467
3256
46
4508
3201
47
4545
3179
48
4735
3154
49
4765
3000
50
4803
2945
51
4885
2715
52
4985
2517
53
5126
2409
54
5149
2224
55
5348
1880
56
6005
1283
57
6129
1052
58
6350
1039
∑D
10519
S^2=
403427
59
6850
575
60
7683
520
Analizamos el estadístico:
W>W tabla 4.57>0.974
CONCLUSIÓN La muestra proviene de una distribución normal, por lo tanto podemos usar la distribución de weibull.
COEFICIENTES a PARA LA PRUEBA DE NORMALIDAD DE SHAPIROWILK.