Actividad 1.1 Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diésel como combustible para sab
Views 510 Downloads 6 File size 106KB
Actividad 1.1 Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diésel como combustible para saber si la humedad, la temperatura del aire y la presión barométrica influyen en la cantidad de óxido nitroso que emiten (en ppm). Las emisiones se midieron en distintos momentos y en diversas condiciones experimentales. Los datos se presentan en la siguiente tabla: Óxido nitroso, y 0.90 0.91 0.96 0.89 1.00 1.10 1.15 1.03 0.77 1.07 1.07 0.94 1.10 1.10 1.10 0.91 0.87 0.78 0.82 0.95 a) Ajusta
los
datos
Humedad, x1 72.4 41.6 34.3 35.1 10.7 12.9 8.3 20.1 72.2 24.0 23.2 47.4 31.5 10.6 11.2 73.3 75.4 96.6 107.4 54.9 al
siguiente
Temperatura, x2 76.3 70.3 77.1 68.0 79.0 67.4 66.8 76.9 77.7 67.7 76.8 86.6 76.9 86.3 86.0 76.3 77.9 78.7 86.8 70.9 modelo
de
regresión
Presión, x3 29.18 29.35 29.24 29.27 29.78 29.39 29.69 29.48 29.09 29.60 29.38 29.35 29.63 29.56 29.48 29.40 29.28 29.29 29.03 29.37 lineal
múltiple:
y i=β 0 + β 1 x 1 i+ β 2 x 2i + β 3 x3 i + ε i, para i=1,2 , … , 20. ¿Cuál es la ecuación de regresión de los datos de la muestra, ^y =b0 +b1 x 1+b 2 x 2 +b3 x 3? Resuelve el inciso mediante la resolución del sistema de ecuaciones normales. nb 0+ b1 ∑ x 1 i +b2 ∑ x 2i +b 3 ∑ x 3 i=∑ yi b 0 ∑ x 1 i+ b1 ∑ x21 i +b2 ∑ x 1i x 2 i+ b3 ∑ x 1 i x 3 i=∑ x 1 i yi b 0 ∑ x 2 i+ b1 ∑ x1 i x2 i +b 2 ∑ x 22 i+ b3 ∑ x2 i x3 i=∑ x2 i y i b 0 ∑ x 3 i +b1 ∑ x1 i x3 i +b 2 ∑ x 2 i x 3 i+ b3 ∑ x 23i =∑ x 3i y i
−1
b) Resuelve el inciso anterior mediante la relación matricial b=( X ' X ) ( X ' Y ) c) Estima la cantidad de óxido nitroso que emiten los camiones en las siguientes condiciones: 50% de humedad, temperatura de 76 °F y una presión barométrica de 29.30 d) Prueba la significancia de la regresión completa mediante el análisis de varianza. Es decir, prueba la hipótesis de que ninguna de las variables regresoras contribuye de manera significativa al modelo contra la alternativa de que por lo menos una de las variables independientes contribuye de manera significativa para explicar la variable de respuesta. e) Calcula e interpreta el coeficiente de determinación múltiple R2 y R2adj f) Prueba la significancia de los coeficientes de regresión individuales. Esto es, prueba la hipótesis nula de que la variable regresora x j NO contribuye significativamente en el modelo y SÍ puede eliminarse del modelo contra la hipótesis alternativa de que la variable regresora x j SÍ contribuye significativamente en el modelo y NO puede eliminarse del modelo. ¿Qué término es el que tiene mayor contribución a la respuesta? Actividad 1.2 Dados los siguientes datos: x y
0 9.1
1 7.3
2 3.2
3 4.6
4 4.8
5 2.9
6 5.7
7 7.1
8 8.8
9 10.2
a) Ajusta los datos al siguiente modelo de regresión lineal múltiple: μ y∨ x =β 0+ β1 x+ β2 x 2. ¿Cuál es la ecuación de regresión de los datos de la muestra, ^y =b0 +b1 x+ b2 x 2? −1
Resuelve el inciso mediante la relación b=( X ' X ) ( X ' Y ) b) Estima μ y∨2 Actividad 1.3 Los datos de la tabla representan el porcentaje de impurezas que resultaron de diversas temperaturas y del tiempo de esterilización durante una reacción asociada con la fabricación de cierta bebida.
Tiempo de esterilización, x2 (min) 15 20 25 a) Estima
los
Temperatura, x1 (°C) 75
100
125
14.05 14.93 16.56 15.85 22.41 21.66
10.55 9.48 13.63 11.75 18.55 17.98
7.55 6.59 9.23 8.78 15.93 16.44
coeficientes
de
regresión
en
el
modelo
polinomial
y i=β 0 + β 1 x 1 i+ β 2 x 2i + β 11 x 21i + β 22 x 22 i+ β12 x1 i x2 i +ε i, para i=1,2 , … ,18. b) Prueba la significancia de la regresión completa mediante el análisis de varianza. c) Calcula e interpreta el coeficiente de determinación múltiple R2 y R2adj . d) Prueba la significancia de los coeficientes de regresión individuales. Actividad 1.4 Se midió el porcentaje de supervivencia de los espermatozoides de cierto tipo de semen animal, después de almacenarlo con distintas combinaciones de concentraciones de tres materiales que se emplean para incrementar la supervivencia. En la siguiente tabla se presentan los datos: y (% de supervivencia) 25.5 31.2 25.9 38.4 18.4 26.7 26.4
x1 (peso %)
x2 (peso %)
x3 (peso %)
1.74 6.32 6.22 10.52 1.19 1.22 4.10
5.30 5.42 8.41 4.63 11.60 5.85 6.62
10.80 9.40 7.20 8.50 9.40 9.90 8.00
25.9 32.0 25.2 39.7 35.7 26.5
6.32 4.08 4.15 10.15 1.72 1.70
8.72 4.42 7.60 4.83 3.12 5.30
9.10 8.70 9.20 9.40 7.60 8.20
a) Obtén la ecuación de regresión ^y =b0 +b1 x 1+b 2 x 2 +b3 x 3 de los datos muestrales. b) Calcula e interpreta el coeficiente de determinación múltiple R2. c) Prueba la significación de la regresión completa mediante el análisis de varianza. d) Prueba la significancia de los coeficientes de regresión individuales. e) Obtén los intervalos de confianza del 95% para los coeficientes de regresión. f) Estima, con una confianza del 95%, la respuesta media para x 1=6 , x 2=4 y x 3=8 . g) Estima, con una confianza del 95%, la respuesta individual para x 1=6, x 2=4 y x 3=8 . h) Determina el modelo más adecuado para predecir la variable de respuesta. Es decir, obtén todas las regresiones posibles con todas las combinaciones de las variables predictoras y compáralas en función de sus respectivos valores de R2adj , R2pred y Cp de Mallows. Determina el modelo de regresión con el mayor R2adj . i) Verifica los supuestos del modelo mediante el análisis de las gráficas de residuales. Actividad 1.5 Se piensa que la energía eléctrica consumida mensualmente ( y ) por una planta química se relaciona con la temperatura ambiental promedio ( x 1 ), el número de días laborales del mes
( x 2 ), la pureza promedio del producto ( x 3 ) y las toneladas del producto producido ( x 4 ). Se cuenta con los datos del último año, los cuales se presentan en la siguiente tabla: y (miles de kWh) 240 236 290 274 301 316
x1 (°F)
x2 (días)
x3 (%)
x4 (toneladas)
25 31 45 60 65 72
24 21 24 25 25 26
91 90 88 87 91 94
100 95 110 88 94 99
300 296 267 276 288 261
80 84 75 60 50 38
25 25 24 25 25 23
87 86 88 91 90 89
97 96 110 105 100 98
a) Obtén la ecuación de regresión ^y =b0 +b1 x 1+b 2 x 2 +b3 x 3+ b4 x 4 de los datos muestrales b) Calcula e interpreta el coeficiente de determinación múltiple R2. c) Prueba la significación de la regresión completa mediante el análisis de varianza. d) Prueba la significancia de los coeficientes de regresión individuales. e) Obtén el “mejor” modelo de regresión mediante el método de selección hacia adelante (agregando variables). f) Obtén todas las regresiones posibles con todas las combinaciones de las variables predictoras y compáralas en función de sus respectivos valores de R2adj , R2pred y Cp de Mallows. Determina el modelo de regresión con el mayor R2adj . g) Obtén los intervalos de confianza del 95% para los coeficientes de regresión del mejor modelo. h) Estima, con una confianza del 95%, la respuesta media para x 1=75 °F, x 2=24 días, x 3=90 % y x 4 =98 toneladas, utilizando la ecuación del mejor modelo. i) Estima, con una confianza del 95%, la respuesta individual para x 1=75 °F, x 2=24 días, x 3=90 % y x 4 =98 toneladas, utilizando la ecuación del mejor modelo. j) Verifica los supuestos del modelo mediante el análisis de las gráficas de residuales.