Problema No.1

Problema No.1 En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un d

Views 42 Downloads 0 File size 746KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Problema No.1 En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación: Horas de uso

Diámetro (mm)

16

26.2

32

25.7

48

26.0

64

27.7

80

28.3

96

29.5

112

30.1

128

31.8

144

31.4

160

33.4

176

33.6

192

32.7

208

35.0

224

36.1

240

35.7

256

36.2

272

36.8

288

39.1

304

38.7

320

39.2

a) ¿En este problema cuál variable se considera independiente y cuál dependiente? R: La variable dependiente serán las horas de trabajo mientras que la independiente será el diámetro de la pieza. b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos) d) ¿La calidad de ajuste es satisfactoria? Argumente e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa herramienta? f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de ajuste. y = 0.0464x + 24.863 R² = 0.9768

grafica de dispersion

45 40

horas de trabajo

35 30 25 20 15 10 5 0

0

50

100

150

200

diametro de la pieza

250

300

350

Columna 1 Columna 1 Columna 2

y = 0.0464x + 24.863 R² = 0.9768

Columna 2

1 0.988325658

grafica de dispersion

45

1

40

horas de trabajo

35

Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

0.988325658 0.976787606 0.975498029 14.81680342 20

30

25 20 15 10 5 0 0

50

100

150

200

250

300

350

diametro de la pieza

ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total

1 18 19 Coeficientes -519.3957825 21.04702335

Intercepción Variable X 1

Suma de cuadrados Promedio de los cuadrados F 166288.3221 166288.3221 757.447808 3951.677944 219.5376635 170240 Error típico 25.19522479 0.764740915

Estadístico t Probabilidad -20.61485011 5.7073E-14 27.52176971 3.6672E-16

Valor crítico de F 3.66724E-16

Inferior 95% Superior 95%Inferior 95.0%Superior 95.0% -572.3289856 -466.462579 -572.328986 -466.462579 19.4403623 22.6536844 19.4403623 22.6536844

a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las piezas. b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.

Gráfico de Diámetro vs Horas de uso

40

Diámetro

37 34 31 28 25 0

100

200

300

400

c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre las horas de uso y el diámetro está dada por: Diámetro = 24.8632 + 0.0464098*Horas de uso La cual se puede observar en el grafico del modelo ajustado: Gráfico del Modelo Ajustado Diámetro = 24.8632 + 0.0464098*Horas de uso 40

Diámetro

37 34 31 28 25 0

100

200 Horas de uso

300

400

Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables horas de uso y diámetro si existe una relación. Coeficientes Mínimos Cuadrados Parámetro Estimado Intercepto 24.8632 Pendiente 0.0464098

Estándar

Estadístico

Error T 0.323206 76.9267 0.00168629 27.5218

Valor-P 0.0000 0.0000

Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación: Análisis de Varianza Fuente Suma de Cuadrados Modelo 366.674 Residuo 8.71365 Total (Corr.) 375.388

Gl Cuadrado Medio 1 366.674 18 0.484092 19

Razón-F Valor-P 757.45

0.0000

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula. Verificación de supuestos: El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón definido. Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8

residuo

0.4 0 -0.4 -0.8 -1.2 25

28

31

34

37

40

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos predicho Diámetro de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna tendencia. Gráfico de Residuos Diámetro = 24.8632 + 0.0464098*Horas de uso 1.2 0.8

residuo

0.4 0 -0.4 -0.8 -1.2 0

4

8

12

16

20

d) el coeficiente de determinación R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro. e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 25.7 a 39.2 mm de diámetro. f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y) con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se varíen las horas de uso. g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste será mayor.

Problema No. 2 Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se muestra la temperatura y el consumo anual: Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

Temperatura 21 24 32 47 50 59 68 74 62 50 41 30

Consumo/1000 185.79 214.47 288.03 424.84 454.58 539.03 621.55 657.06 562.03 452.93 369.95 273.98

A) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso?

R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que temperatura es conveniente tratar el consumo.

B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de regresión que relacione el consumo de vapor (𝑦) con la temperatura promedio ( 𝑥). ¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es 55°F? R= 497.3545

C) ¿Qué cambio se espera en el consumo de vapor promedio cuando la temperatura mensual promedio cambia 1°F? R= 2.15% R= 108.7056 consumo/1000 D) Suponga que la temperatura mensual promedio es de 47°F. Calcule el vapor ajustado y el residual correspondiente. VAPOR= 424.84 RESIDUAL= -0.042718344

Columna 1 Columna 1 Columna 2

Columna 2

1 0.999518769

1 y = 9.0588x - 0.8795 R² = 0.999

Título del gráfico

800 700

Resumen

600

Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

500

0.999518769 0.99903777 0.998941547 5.114063557 12

300 200 100 0

0

ANÁLISIS DE VARIANZA Regresión Residuos Total

400

Grados de libertad 1 10 11

10

20

30

40

Suma de cuadrados Promedio de los cuadrados F 271540.889 271540.889 10382.5252 261.5364607 26.15364607 271802.4255

50

60

Valor crítico de F 2.03081E-16

70

80

Problema No. 3 En un artículo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la viscosidad del aceite. Los datos representativos, con 𝑥 = 𝑣𝑖𝑠𝑐𝑜𝑠𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑎𝑐𝑒𝑖𝑡𝑒 y 𝑦 = 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝑑𝑒𝑙 𝑑𝑒𝑠𝑔𝑎𝑠𝑡𝑒 (10−4 𝑚𝑚 ), son: Y 240 181 193 155 172 110 113 75 94

x 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0

a) Construya un diagrama de dispersión de los datos. ¿Parecería plausible un modelo de regresión lineal simple? R= Si, parece correcto usar el diagrama

b) Ajuste el modelo de regresión lineal simple usando mínimos cuadrados.

c) Estime el desgaste por rozamiento cuando la viscosidad es 𝑥 = 30. R= 62.3768 d) Obtenga el valor ajustado de 𝑦 cuando 𝑥 = 22.0 y calcule el residual correspondiente. Y=172 Residual= 15.11749821

y = -0.2506x + 61.623 R² = 0.8794

Columna 1

Columna 2

45

1 -0.93776177

1

40

volumen del desgaste

Columna 1 Columna 2

Título del gráfico

50

Resumen Estadísticas de la regresión Coeficiente de correlación 0.93776177 múltiple Coeficiente de determinación 0.879397137 R^2 R^2 ajustado 0.862168156 Error típico 19.95696437 Observaciones 9

35 30 25

20 15 10

5 0

0

50

100

150

200

250

300

viscosidad del aceite

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Regresión 1 20328.9259 20328.9259 51.0417397 Residuos 7 2787.962989 398.280427 Total 8 23116.88889

Intercepción Variable X 1

Coeficientes 234.0707398 -3.508556273

Error típico 13.74839579 0.491095226

Estadístico t Probabilidad 17.02531287 5.9137E-07 -7.144350198 0.00018628

Valor crítico de F 0.000186278

Inferior 95% Superior 95% Inferior 95.0% Superior 95.0% 201.5609497 266.5805299 201.5609497 266.5805299 -4.669811953 -2.347300592 -4.669811953 -2.347300592

Análisis de los residuales Observación Pronóstico para Y 1 228.4570498 2 201.0903108 3 179.6881176 4 163.8996143 5 156.8825018 6 109.5169921 7 83.20282006 8 91.97421075 9 118.2883828

Residuos 11.54295024 -20.09031083 13.31188243 -8.899614339 15.11749821 0.48300789 29.79717994 -16.97421075 -24.28838279

Problema No. 4 En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la siguiente tabla.

Tiempo (minutos) 10 15 20 8 12 13 15 12 14 20 19

Rendimiento (%) 64 81.7 76.2 68.5 77.9 82.2 74.2 70 76 83.2 85.3

a) ¿En este problema cuál variable se considera independiente y cuál dependiente? b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis y verifique residuos). d) ¿La calidad del ajuste es satisfactoria? Argumente e) Destaque el valor de la pendiente de la recta e interprételo en términos prácticos. f) Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta estimación.

a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en minutos. b) Diagrama de dispersión: se puede visualizar que no existe una relación ya que los puntos son muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendría que verificar los supuestos y comprobar si en verdad existe una relación entre el rendimiento y el tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran.

Gráfico de Rendimiento vs Tiempo

88

Rendimiento

84 80 76 72 68 64 8

10

12

14 Tiempo

16

18

20

c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre el tiempo y el porcentaje de rendimiento está dada por: Rendimiento = 57.9578 + 1.19492*Tiempo La cual se puede observar en el grafico del modelo ajustado: Gráfico del Modelo Ajustado Rendimiento = 57.9578 + 1.19492*Tiempo 88

Rendimiento

84 80 76 72 68 64 8

10

12

14 Tiempo

16

18

20

Prueba de Hipótesis: H0: β1= 0 o H0: El modelo no se ajusta H0: β1≠ 0 o H0: El modelo si se ajusta De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables tiempo y porcentaje de rendimiento si existe una relación. Coeficientes Mínimos Cuadrados

Estándar Estadístico

Parámetro Estimado Intercepto 57.9578 Pendiente 1.19492

Error T 6.28403 9.22303 0.414959 2.87962

Valor-P 0.0000 0.0164

Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza del modelo, el cual se presenta a continuación: Análisis de Varianza Fuente Suma de Cuadrados Modelo 243.684 Residuo 293.872 Total (Corr.) 537.557

Gl Cuadrado Medio 1 243.684 10 29.3872 11

Razón-F Valor-P 8.29

0.0164

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hipótesis nula. Verificación de supuestos: El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de forma aleatoria por toda la gráfica a lo largo de la banda horizontal. Gráfico de Residuos Rendimiento = 57.9578 + 1.19492*Tiempo 7.5

residuo

4.5 1.5 -1.5 -4.5 -7.5 67

70

73 76 predicho Rendimiento

79

82

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna tendencia. Gráfico de Residuos Rendimiento = 57.9578 + 1.19492*Tiempo 7.5

residuo

4.5 1.5 -1.5

d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento. Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de explicación del modelo. e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y) con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el tiempo. f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región de estudio va de 8 a 20 min de Tiempo.

Problema No. 5 En un artículo de Journal of Environmental Energineering se reportan los resultados de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de la parte central de Rhode Island. Los datos que se presentan a continuación corresponden a la concentración de cloruros y (en mg/l) y al área de carretera de la vertiente x (en %). x 0.19 0.15 0.57 0.70 0.67 0.63 0.47 0.70 0.60 0.78 0.81 0.78 0.69 1.30 1.05 1.06 1.74 1.62

y 4.4 6.6 9.7 10.6 10.8 10.9 11.8 12.1 14.3 14.7 15.0 17.3 19.2 23.1 27.4 27.7 31.8 39.5

a) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este caso? R= Si, para ver la relación aunque presentan un índice de error alto

B) Ajuste el modelo de regresión lineal simple usando el método de mínimos cuadrados.

b) Estime la concentración de cloruros media de una vertiente que tiene 1% del área de carretera.

R= 20.567

Encuentre el valor ajustado que corresponde a 𝑥 = 0.47 R= 10.13