lab07-CO3212EM

500 REGRESIÓN POR MÍNIMOS CUADRADOS 28.65 26.55 26.65 27.65 27.35 28.35 26.85 28.65 29.65 27.85 27.05 28.25

Views 559 Downloads 24 File size 46KB

Report DMCA / Copyright

DOWNLOAD FILE

Citation preview

500

REGRESIÓN POR MÍNIMOS CUADRADOS

28.65

26.55

26.65

27.65

27.35

28.35

26.85

28.65

29.65

27.85

27.05

28.25

28.35

26.75

27.65

28.45

28.65

28.45

31.65

26.35

27.75

29.25

27.65

28.65

27.65

28.55

27.55

27.25

Determine a) la media, b) la desviación estándar, c) la varianza, d) el coeficiente de variación, y e) el intervalo de confianza del 90% para la media. f ) Construya un histograma. Use un rango de 26 a 32 con incrementos de 0.5. g) Si se supone que la distribución es normal y que la estimación de la desviación estándar es válida, calcule el rango (es decir, los valores inferior y superior) que agrupa al 68% de los datos. Determine si esta es una estimación válida para los datos del problema. 17.4 Utilice la regresión por mínimos cuadrados para ajustar una línea recta a x

0

2

4

6

9

11

12

15

17

19

y

5

6

7

6

9

8

7

10

12

12

Además de la pendiente y la intersección, calcule el error estándar de la estimación y el coeficiente de correlación. Haga una gráfica de los datos y la línea de regresión. Después repita el problema, pero ahora efectúe la regresión de x versus y, es decir, intercambie las variables. Interprete sus resultados. 17.5 Use la regresión por mínimos cuadrados para ajustar una línea recta a x

6

7

11

15

17

21

23

29

29

37

39

y

29

21

29

14

21

15

7

7

13

0

3

Además de la pendiente y la intersección, calcule el error estándar de la estimación y el coeficiente de correlación. Haga una gráfica de los datos y la línea de regresión. ¿Si otra persona hiciera una medición adicional de x = 10, y = 10, usted pensaría, con base en una evaluación visual y el error estándar, que la medición era válida o inválida? Justifique su conclusión. 17.6 Con el mismo enfoque que se empleó para obtener las ecuaciones (17.15) y (17.16), obtenga el ajuste por mínimos cuadrados del modelo siguiente: y = a1x + e Es decir, determine la pendiente que resulta en el ajuste por mínimos cuadrados para una línea recta con intersección en el origen. Ajuste los datos siguientes con dicho modelo e ilustre el resultado con una gráfica. x

2

4

6

7

10

11

14

17

20

y

1

2

5

2

8

7

6

9

12

17.7 Emplee la regresión por mínimos cuadrados para ajustar una línea recta a x

1

2

3

4

5

6

7

8

9

y

1

1.5

2

3

4

5

8

10

13

a) Además de la pendiente y la intersección, calcule el error estándar de la estimación y el coeficiente de correlación. Grafique los datos y la línea recta. Evalúe el ajuste. b) Vuelva a hacer el cálculo del inciso a), pero use regresión polinomial para ajustar una parábola a los datos. Compare los resultados con los del inciso a). 17.8 Ajuste los datos siguientes con a) un modelo de tasa de crecimiento de saturación, b) una ecuación de potencias, y c) una parábola. En cada caso, haga una gráfica de los datos y la ecuación. x

0.75

2

3

4

6

8

8.5

y

1.2

1.95

2

2.4

2.4

2.7

2.6

17.9 Ajuste los datos siguientes con el modelo de potencias (y = axb). Use la ecuación de potencias resultante para hacer el pronóstico de y en x = 9. x

2.5

3.5

5

6

7.5

y

13

11

8.5

8.2

7

10 12.5 15 17.5 20 6.2

5.2

4.8

4.6

4.3

17.10 Ajuste a un modelo exponencial a x

0.4

0.8

1.2

1.6

2

2.3

y

800

975

1500

1950

2900

3600

Grafique los datos y la ecuación tanto en papel milimétrico como en semilogarítmico. 17.11 En vez de usar el modelo exponencial de base e (ecuación 17.22), una alternativa común consiste en utilizar un modelo de base 10. y = a510b5x Cuando se usa para ajustar curvas, esta ecuación lleva a resultados idénticos que los de la versión con base e, pero el valor del parámetro del exponente (b5) difiere del estimado con la ecuación 17.22 (b1). Use la versión con base 10 para resolver el problema 17.10. Además, desarrolle una formulación para relacionar b1 con b5. 17.12 Además de los ejemplos de la figura 17.10, existen otros modelos que se pueden hacer lineales con el empleo de transformaciones. Por ejemplo, y = a4xeb4x

501

PROBLEMAS

Haga lineal este modelo y úselo para estimar a4 y b4 con base en los datos siguientes. Elabore una gráfica del ajuste junto con los datos. x y

0.1

0.2

0.4

0.6

0.9

1.3

1.5

1.7

1.8

0.75 1.25 1.45 1.25 0.85 0.55 0.35 0.28 0.18

17.13 Un investigador reporta los datos tabulados a continuación, de un experimento para determinar la tasa de crecimiento de bacterias k (per d), como función de la concentración de oxígeno c (mg/L). Se sabe que dichos datos pueden modelarse por medio de la ecuación siguiente: k=

k máxc 2 cs + c 2

donde cs y kmáx son parámetros. Use una transformación para hacer lineal esta ecuación. Después utilice regresión lineal para estimar cs y kmáx, y pronostique la tasa de crecimiento para c = 2 mg/L. c

0.5

0.8

1.5

2.5

4

k

1.1

2.4

5.3

7.6

8.9

17.14 Dados los datos x

5

10

15

20

25

30

35

40

45

50

y

17

24

31

33

37

37

40

40

42

41

use regresión por mínimos cuadrados para ajustar a) una línea recta, b) una ecuación de potencias, c) una ecuación de tasa de crecimiento de saturación, y d) una parábola. Grafique los datos junto con todas las curvas. ¿Alguna de las curvas es superior a las demás? Si así fuera, justifíquelo. 17.15 Ajuste una ecuación cúbica a los datos siguientes:

17.17 Use regresión lineal múltiple para ajustar x1

0

3

4

5

7

8

9

11

12

y

1.6

3.6

4.4

3.4

2.2

2.8

3.8

4.6

2

0

1

2

2

1

0

2

2

4

4

6

6

2

1

y

14

21

11

12

23

23

14

6

11

Calcule los coeficientes, el error estándar de la estimación y el coeficiente de correlación. 17.18 Emplee regresión no lineal para ajustar una parábola a los datos siguientes: x

0.2

0.5

y

500

700

0.8

1.2

1.7

2

2.3

1 000 1 200 2 200 2 650 3 750

17.19 Use regresión no lineal para ajustar una ecuación de tasa de crecimiento de saturación a los datos del problema 17.14. 17.20 Vuelva a calcular los ajustes de regresión de los problemas a) 17.4, y b) 17.15, con el enfoque matricial. Estime los errores estándar y desarrolle intervalos de confianza del 90% para los coeficientes. 17.21 Desarrolle, depure y pruebe un programa en cualquier lenguaje de alto nivel o de macros que elija, para implantar el análisis de regresión lineal. Entre otras cosas: a) incluya comentarios para documentar el código, y b) determine el error estándar y el coeficiente de determinación. 17.22 Se hace la prueba a un material para estudiar la falla por fatiga cíclica, en la que se aplica un esfuerzo, en MPa, al material y se mide el número de ciclos que se necesita para hacer que falle. Los resultados se presentan en la tabla siguiente. Al hacerse una gráfica log-log, del esfuerzo versus los ciclos, la tendencia de los datos presenta una relación lineal. Use regresión por mínimos cuadrados para determinar la ecuación de mejor ajuste para dichos datos. 1

10

Esfuerzo, MPa 1 100 1 000

100

1 000

10 000

925

800

625

100 000 1 000 000 550

420

17.23 Los datos siguientes muestran la relación entre la viscosidad del aceite SAE 70 y su temperatura. Después de obtener el logaritmo de los datos, use regresión lineal para encontrar la ecuación de la recta que se ajuste mejor a los datos y al valor de r 2.

Además de los coeficientes, determine r2 y sy/x. 17.16 Utilice regresión lineal múltiple para ajustar x1

0

1

1

2

2

3

3

4

4

x2

0

1

2

1

2

1

2

1

2

y

1

x2

N, ciclos

x

0

15.1 17.9 12.7 25.6 20.5 35.1 29.7 45.4 40.2

Calcule los coeficientes, el error estándar de la estimación y el coeficiente de correlación.

Temperatura, oC Viscosidad, m, N ⋅ s/m2

26.67

93.33

148.89

315.56

1.35

0.085

0.012

0.00075

17.24 Los datos siguientes representan el crecimiento bacterial en un cultivo líquido durante cierto número de días.

502

REGRESIÓN POR MÍNIMOS CUADRADOS

Día Cantidad × 106

0

4

8

12

16

20

67

84

98

125

149

185

Encuentre la ecuación de mejor ajuste a la tendencia de los datos. Pruebe varias posibilidades: lineal, parabólica y exponencial. Utilice el paquete de software de su elección para obtener la mejor ecuación para pronosticar la cantidad de bacterias después de 40 días. 17.25 Después de una tormenta, se vigila la concentración de la bacteria E. coli en un área de natación: t (hrs)

4

c (CFU/100mL)

8

12

16

1 590 1 320 1 000 900

20

24

650

560

El tiempo se mide en horas transcurridas después de finalizar la tormenta, y la unidad CFU es una “unidad de formación de colonia”. Use los datos para estimar a) la concentración al final de la tormenta (t = 0), y b) el tiempo en el que la concentración alcanzará 200 CFU / 100 mL. Observe que la elección del modelo debe ser consistente con el hecho de que las concentraciones negativas son imposibles y de que la concentración de bacterias siempre disminuye con el tiempo. 17.26 Un objeto se suspende en un túnel de viento y se mide la fuerza para varios niveles de velocidad del viento. A continuación están tabulados los resultados. Use la regresión por mínimos cuadrados para ajustar una línea recta a estos datos. v, m/s

10

20

30

40

FN

25

70

380

550

50

60

70

80

610 1 220 830 1 450

Emplee regresión por mínimos cuadrados para ajustar estos datos con a) una línea recta, b) una ecuación de potencias basada en transformaciones logarítmicas, y c) un modelo de potencias con base en regresión no lineal. Muestre los resultados gráficamente. 17.27 Ajuste un modelo de potencias a los datos del problema 17.26, pero emplee logaritmos naturales para hacer las transformaciones. 17.28 Con el mismo enfoque que se empleó para obtener las ecuaciones (17.15) y (17.16), obtenga el ajuste por mínimos cuadrados del modelo siguiente: y = a1x + a2x2 + e Es decir, determine los coeficientes que generan el ajuste por mínimos cuadrados de un polinomio de segundo orden con intersección en el origen. Pruebe el enfoque con el ajuste de los datos del problema 17.26. 17.29 En el problema 17.12, en el que se usaron transformaciones para hacer lineal y ajustar el modelo siguiente: y = a4xeb4x Emplee regresión no lineal para estimar a4 y b4 con base en los datos siguientes. Haga una gráfica del ajuste junto con los datos. x y

0.1

0.2

0.4

0.6

0.9

1.3

1.5

1.7

1.8

0.75 1.25 1.45 1.25 0.85 0.55 0.35 0.28 0.18