Clase integradora EB 2015-2 ESTADÍSTICA – MA444 1. Una de las características de los satélites es su altitud respecto a
Views 39 Downloads 0 File size 984KB
Clase integradora EB 2015-2 ESTADÍSTICA – MA444 1. Una de las características de los satélites es su altitud respecto a la tierra, estas altitudes están distribuidas normalmente con una media 35 789,5 km y una desviación estándar de 10,69 km. La Unión Internacional de Telecomunicaciones ha establecido un rango para la altitud de los satélites, esta debe encontrarse entre 35786 km y 35800 km. Si se elige un satélite al azar ¿cuál es la probabilidad que no se encuentre dentro del rango de altitud? X: altitud del satélite respecto a la tierra (Km)
Z=
𝑥− 𝜇 𝜎
X N (=35789.5 ; 2 =10.692)
P(a): Valor T =
v GL = 49
Prueba T de dos muestras Muestra A B
N 31 25
Media 12.97 11.99
Desv.Est. 4.25 2.47
Error estándar de la media 0.76 0.49
Homogéneas
S2p = 3.5702
Diferencia = mu (A) - mu (B) Estimado de la diferencia: 0.980 Límite inferior 96% de la diferencia: -0.732 Prueba T de diferencia = 0 (vs. >): Valor T = Ambos utilizan Desv.Est. agrupada = 3.5702
GL = 54
7. Una empresa dedicada a la fabricación de equipos de comunicación considera que la vida útil de los equipos está relacionada linealmente con la temperatura del ambiente en el que trabaja. Para establecer dicha relación se tomaron en consideración los siguientes datos: Temperatura (°C) Vida útil (años)
Estadística MA86
24 8.0
20 6,4
18 5,5
16 4,6
10 3,8
12 3,9
11 7,6
28 6,5
16 6,6
15 4,5
23 8,8
5
Análisis de regresión: Y vs. X Ecuación de regresión es Y = 1.49 + 0.255 X S = 0.951584
R-cuad. = 72.3%
R-cuad.(ajustado) = 69.2%
Análisis de varianza Fuente Regresión Error residual Total
X Y
GL 1 9 10
SC 21.282 8.154 29.447
MC 21.282 0.906
F 23.49
P 0.003
Temperatura (°C) Vida útil (años)
a. Realice el proceso de validación del modelo anterior usando un nivel de significación del 5%. Interprete el coeficiente de regresión. Ho: 𝛽1 = 0 [El modelo lineal NO es válido] H1: 𝛽1 ≠ 0 [El modelo lineal es válido] Alfa = 0.05
Si P_valor < alfa Si P_valor > alfa
P_valor = 0.003
SRHo NSRHo
Decision: Se Rechaza Ho Conclusion: A un ns del 5% el modelo es valido. b. Calcule la estimación puntual de la vida útil para una temperatura de 20°C. Y = 1.49 + 0.255 X Y = 1.49 + 0.255 (20) Y = 6.59 años
c. Pronostique con 92% de confianza la vida útil de un equipo para una temperatura de ambiente de 25°C. X0 = 25 S = 0.951584 SCReg S xx ˆ12
Y0 = 1.49 + 0.255 (25) = 7.865
2
= 21.282 / 0.255 = 327.2895
1 ( x x )2 yˆ 0 t( n2, / 2) S 1 0 n S xx
T (9, 0.04) = 1.97265 Reemplazando en la fórmula de amarillo se obtiene el intervalo: [5.085 ; 10.645]
Con una confianza del 92% el intervalo [5.085 ; 10.645] años, contendrá la vida útil de un equipo para una temperatura de ambiente de 25°C.
Estadística MA86
6
8. El jefe del área de compra de materiales realizó un estudio para comparar los precios, en nuevos soles, del ciento de barras de acero de 1/2” pulgadas de diámetro para construcción. El estudio se realizó en tres localidades, eligiendo al azar seis tiendas en las localidades 1 y 2 y cinco en la localidad 3. Toda la información se muestra a continuación: Precios L2 580 610 640 590 620 630 3670
L1 590 630 650 610 640 610 3730
L3 540 590 550 560 570 2810
a. Con un nivel de significación de 0,05, pruebe si hay diferencia en los precios por localidad. Completar la tabla. Fuente de Variación Tratamiento
3
𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚 = ∑ 𝑖=3
Fuente Localidad Error Total
Grados Suma de de Cuadrados Libertad k-1 SCTra
Error
n-k
SCE
Total
n-1
SCTotal
Cuadrado Medio
FCal
CMT
SCTra CMTra FC k 1 CME
CME
SCE nk
𝑇𝑖2 𝑇 2 37302 36702 28102 102102 − =[ + + ]− = 10847.45 𝑛𝑖 𝑛 6 6 5 17 GL 2 14 16
SC CM 10847.45065 5423.725325 6646.667003 474.7619288 17494.11765
F 11.4201
K = 3 n = 17
Estadística MA86
7
Hipótesis Ho: µ1= µ2 = µ3 (El precio promedio de las barras de acero es el mismo para cada localidad) H1: Al menos una localidad tiene un precio promedio diferente a las otras localidades. Nivel de significación: α = 0.05
Si Fc > Ftabla
Fc = 11.4201
SRHo
Ftabla = F(0.05,2,14) = 3.74 Decisión: SE RECHAZA H0 Conclusión: Con un nivel de significación del 5%, se puede afirmar que al menos una localidad tiene un precio promedio diferente a las otras localidades.
b. Si hay diferencias significativas en los precios, ¿en qué localidad es preferible comprar? Justifique su respuesta. Tomando la salida de TUKEY
L3
L2
L1
Con un ns del 5%, es preferible comprar en la localidad 3, por tener los precios promedios más bajos.
9. El Jefe de logística debe presentar el presupuesto del siguiente año y por tal motivo desea saber si existen diferencias significativas en los costos unitarios de los tipos de acabados de las obras multifamiliares (1 = puertas de madera, 2 = Ventanas y mamparas de aluminio, 3 = Muebles de cocina). Las salidas de Minitab para que realice las pruebas necesarias se muestran a continuación: One-way ANOVA: COSTO_UNITARIO versus TIPO_DE ACABADO 46241
4204 Fuentes Tipo de acabado Error Total
S = 64.84
gl 2
SC 63989
13
110230
R-Sq = 58.05%
CM 31995
F
R-Sq(adj) = 50.42%
a. Complete la tabla del ANVA presentada. Plantee la hipótesis del diseño y pruebe al nivel de significación del 5% si existen diferencias entre los costos de acabado. Fuentes Tipo de acabado Error Total
gl 2 11 13
SC 63989 46241 110230
CM 31995 4203,727
F 7.6111
1°. Hipótesis Ho: µ1= µ2 = µ3 (El costo promedio es el mismo para cada tipo de acabado) H1: Al menos un tipo de acabado tiene un costo promedio diferente. 2°. Nivel de significación: α = 0.05
Estadística MA86
8
3°. F (2,11)gl ; 0.05 = 3.98 SE RECHAZA H0 Conclusión: Con un nivel de significación del 5%, se puede afirmar que al menos un tipo de acabado tiene un costo promedio diferente.
b. Los resultados de la prueba de Tukey se dan a continuación. Si existen diferencias entre los promedios de los costos de los acabados ¿a qué tipo de acabado se debe destinar un mayor presupuesto? TIPO_DE ACABADO 2 3 1
N 4 4 6
Mean 194.93 180.19 51.41
A1
Grouping A A B
A3
A2
Se puede concluir que no existen diferencias significativas entre los costos de acabados 3 y 2, pero si hay diferencia con el acabado 1. Se debe destinar un mayor presupuesto al acabado 2 o 3. 10. El jefe de recursos humanos desea modelar el número de horas hombre que va a presupuestar en un mes en función del número de trabajadores de la obra. De los últimos seis meses registra los datos y obtiene las siguientes salidas del Minitab para realizar el modelo.
N° trabajadores X 23 Cantidad de Horas Y 1682.5
25 2711.875
16 1360
2 90.5
15 1695
4 672
Regression Analysis: HORAS TRABAJADAS versus NUMERO DE TRABAJADORES Predictor Constant Núm_trab. S = 367.885
Coef SE Coef 105.0 287.8 89.20 17.33 R-Sq = 86.9%
T 0.36 5.15
P 0.734 0.007
R-Sq(adj) = 83.6%
Análisis de Varianza Fuentes Regresión Error Total
gl 1 4 5
SC 3586966 541357 4128323
CM 3586966 135339
F 26,5036
P_valor 0.007
a. Valide el modelo de regresión lineal simple al nivel de significación del 1%. Si pvalor < alfa SRHo Si pvalor > alfa NSRHo
α=0.01 pvalor = 0.007 Decision: SRHo Conclusion: A un ns del 1% el modelo es valido. b. Escriba la ecuación de regresión lineal estimada. Interprete el coeficiente de regresión. 𝑌̂ = 105 + 89.20𝑋 Cantidad de horas = 105.0 + 89,20 Número de trabajadores X número de trabajadores Estadística MA86
9
Y horas b1= +89.20, por cada trabajador adicional, la cantidad de horas hombre trabajadas en el mes se va a incrementar en 89.20 horas.
c. Estime con una confianza del 96% el número de horas hombre trabajada cuando el número total de trabajadores en ese mes es de 30. yˆ 0 ˆ0 ˆ1 x0
S CME S xx
SCReg ˆ12
= 2781 = raíz (135339)= 367.88 = 3586966
/ 89.202
=
450.81
T(4, 0.02) = 2.99853 [1333,1223; 4228,8777] Con un nivel de confianza del 96% el número de horas hombre trabajada cuando el número total de trabajadores en ese mes es de 30 está contenido en [1333,1223; 4228,8777 ].
11. El inspector sospecha que el número de horas hombre trabajadas y el número de trabajadores no sigue una relación lineal. Líneas abajo se presentan las salidas del Minitab, se pide: a. Validar y escribir la ecuación del mejor modelo de regresión simple. Use un nivel de significación del 1%.
b. Con el mejor modelo elegido en el ítem anterior estime el número de horas hombre trabajada cuando el número de trabajadores al mes es 25. Estadística MA86
10
Regression Analysis: LNY versus N° trabajadores(X) Análisis de varianza Fuentes Regresión Error Total
Gl 1 4 5
SC 5.474 2.061 7.535
CM 5.474 0.5153
F 10.62
Valor-p 0.031
Si observo 2 Ln es el potencia y si observo un solo Ln es el exponencial.
Resumen del modelo S 0.717856
R2 72.65%
R-sq(adj) 65.81%
R-sq(pred) 15.57%
Coefficients Term Constant N° trabajadores
Coef SE Coef 5.272 0.562 0.1102 0.0338
T-Value 9.39 3.26
P-Value 0.001 0.031
Regression Analysis: LNY versus LNX Análisis de varianza Fuentes Regresión Error Total
Gl 1 4 5
SC 6.6079 0.9273 7.5353
CM 6.6079 0.2318
F 28.50
Valor-p 0.006
Resumen del modelo S 0.481484
R2 87.69%
R-sq(adj) 84.62%
R-sq(pred) 50.03%
Coefficients Term Constant LNX
Coef 4.255 1.112
SE Coef 0.521 0.208
T-Value 8.16 5.34
P-Value 0.001 0.006
a) Modelo Exponencial Potencia
R2 72,65% 87,69%
Prioridad 2 1
Se elige el potencia por tener el r2 mas alto y se valida:
Estadística MA86
11
Validación del modelo:
p-valor = 0,006 < α = 0,05 Se rechaza Ho Con un ns de significación del 5% el modelo potencia es válido.
B1 = 1.112 Bo = antiLn(4.255) = 70.4568 Modelo Potencia: 𝑌 = 𝑏𝑜 𝑋 𝑏1
Coefficients Term Value Constant LNX
Coef 4.255 1.112
SE Coef 0.521 0.208
T-Value 8.16 5.34
Modelo hallado: 𝑦̂ = 70,4568 𝑋 1.112 b) Con el Modelo hallado, cuando x= 25 se obtiene la siguiente estimación puntual: 𝑦̂ = 70,4568 (25)1.112
𝑦̂ = 2525.99
FIN
Estadística MA86
12
P0.001 0.006