Universidad Nacional De Ingenieria Facultad De Ingenieria Quimica Y Textil Area Academica De Ingenieria Quimica

UNIVERSIDAD NACIONAL DE INGENIERIA UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE INGENIERIA QUIMICA Y TEXTIL AREA ACAD

Views 91 Downloads 9 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL DE INGENIERIA

UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE INGENIERIA QUIMICA Y TEXTIL AREA ACADEMICA DE INGENIERIA QUIMICA

TEMA: “REGRESION LINEAL APLICADA A LA INGENIERIA QUIMICA”

  

CURSO: CALCULOS EN INGENIERIA QUIMICA (PI523-A). PROFESOR: JOSÉ DAVILA TAPIA. ALUMNOS: VILLENA ARANCIBIA, ROSARIO ELIZABETH. ARTEAGA OROSCO, JOSE LUIS RICARDO. SATISTEBAN OBREGON, LUIS STEVEN.



FECHA DE ENTREGA Y EXPOSICIÓN: 6/12/14

ÍNDICE 1

UNIVERSIDAD NACIONAL DE INGENIERIA 1. INTRODUCCIÓN 3 2. FUNDAMENTO TEÓRICO 3 2.1.

REGRESIÓN LINEAL SIMPLE

2.1.1.

3 LA MEJOR RECTA DE REGRESIÓN

2.1.2.

4 ESTIMACIÓN DE PARÁMETROS

4 2.1.2.1. MÉTODO DE MÍNIMOS CUADRADOS 4 2.1.2.2. MÉTODO DE MÁXIMA VEROSIMILITUD 5 REGRESIÓN LINEAL MÚLTIPLE

2.2.

6 MEJOR

2.2.1.

EL

7 2.2.2.

ESTIMACIÓN

7 2.2.2.1. MÉTODO 2.3.

HIPERPLANO

DE

DE DE

7 BONDAD

REGRESIÓN PARÁMETROS

MÍNIMOS

CUADRADOS

DE

9 2.3.1.

COSTRASTE

9 2.3.2.

COEFICIENTE

AJUSTE

DE DE

REGRESIÓN DETERMINACIÓN

12 3. APLICACIÓN DE LA REGRESIÓN LINEAL A LA INGENIERÍA QUÍMICA 12 3.1.

PROBLEMA

13 3.2.

PROBLEMA

DE DE

REGRESIÓN REGRESIÓN

16

2

LINEAL LINEAL

SIMPLE MÚLTIPLE

UNIVERSIDAD NACIONAL DE INGENIERIA 4. CONCLUSIONES 19 5. BIBLIOGRAFÍA 20

1. INTRODUCCION.Históricamente el nombre de regresión lineal se debe a los estudios de Francis Galton en biología. Cuando Galton estudiaba la relación entre las alturas de los Hijos (Y) con la de sus padres (X) se dio cuenta que los hijos de padres altos son más altos que la media pero no tanto como los padres, y los hijos de padres bajos, en general, son más bajos que la media pero no tanto como sus padres, es decir, que la altura de los hijos tiende a “regresar” a la media, de ahí el nombre de regresión. La regresión lineal es un método matemático y estadístico utilizado para modelar la relación entre variables. El modelo de regresión lineal simple consiste en relacionar una variable denominada dependiente (Y) y otra variable denominada independiente o explicativa (X) a través de una recta que toma el nombre de recta de regresión.

En la regresión lineal múltiple manejaremos más de una variable explicativa, y al igual que la regresión lineal simple, vamos a considerar que los valores de la variable dependiente Y han sido generados de una combinación lineal de los valores de las variables explicativas:

3

UNIVERSIDAD NACIONAL DE INGENIERIA

2.1. FUNDAMENTO TEORICO.2.1.1.

REGRESION LINEAL SIMPLE:

Para explicar la manera en que procede este método y la importancia de ser aplicado en la Ingeniería Química tenemos el siguiente ejemplo: Supongamos que hemos recopilado datos con información sobre 35 marcas de cerveza y que necesitamos estudiar la relación existente entre el grado de alcohol de las cervezas y su contenido calórico. Como inicio del análisis tendremos los datos en una gráfica de dispersión, que se muestra:

Se observa que conforme aumenta el porcentaje de alcohol, también aumenta el número de calorías. Además podemos señalar que en esta muestra no hay cervezas que teniendo alto contenido de alcohol tengan pocas calorías y tampoco que teniendo muchas calorías tengan poco alcohol. Para obtener una descripción más concreta de los resultados relacionaremos las variables mediante una función matemática simple, a primera vista una recta puede ser una buena aproximación.

2.1.1.

LA MEJOR RECTA DE REGRESION:

Si tenemos una situación ideal en la que los datos se muestren en la gráfica de dispersión en una línea recta, no tendríamos que encontrar la mejor recta que describa el comportamiento de los datos; pues tomaríamos 2 puntos y mediante relaciones matemáticas hallaríamos los parámetros obteniendo así un buen ajuste. Pero en una nube de puntos realista como el de nuestro ejemplo se podría trazar muchas rectas diferentes y cada una se ajustara también diferente a la nube de puntos. Existen diferentes métodos para este ajuste cada uno de ellos intenta minimizar una medida diferente del grado de ajuste, pero el más usado es el

4

UNIVERSIDAD NACIONAL DE INGENIERIA de la recta que hace mínima la suma de los cuadrados de las diferencias verticales entre cada punto y la recta.

2.1.2.

ESTIMACION DE PARÁMETROS:

2.1.2.1. MÉTODO DE MÍNIMOS CUADRADOS: En mínimos cuadrados se estiman los parámetros de la recta que minimice la varianza de la perturbación aleatoria o varianza residual, es decir, se buscan unos valores de y regresión sea mínimo.

de forma que la distancia de cada punto a la recta de

Es decir, se calcularán los parámetros de la recta de regresión de forma que dicha recta pase lo más cerca posible (en promedio) de todos los puntos. Derivando la expresión anterior respecto de los parámetros, igualando a cero y aplicando un poco de algebra obtenemos las expresiones de la estimación de cada parámetro.

Derivando respecto de

:

Derivando respecto de

:

5

UNIVERSIDAD NACIONAL DE INGENIERIA

Resolviendo las ecuaciones 1 y 2 utilizando los datos de las mediciones tomadas, se determinan los parámetros de la recta de regresión.

2.1.1.1.2.2.

MÉTODO DE MÁXIMA VEROSIMILITUD:

Si consideramos que la perturbación aleatoria sigue una distribución normal, podemos aplicar el método de estimación de máxima verosimilitud. La función de densidad para un caso concreto es:

De donde la función de soporte de la muestra, es decir, la verosimilitud de la muestra en estudio es:

El logaritmo de la función soporte será:

Derivando esta expresión respecto de los parámetros y , e igualando a cero, de forma que se obtenga unos parámetros que maximicen la verosimilitud de la muestra, obtendremos:

Derivando respecto de

:

6

UNIVERSIDAD NACIONAL DE INGENIERIA

Derivando respecto de

:

Al coincidir estas ecuaciones con las obtenidas por mínimos cuadrados se demuestra que los parámetros estimados por ambos métodos van a coincidir.

.2. REGRESION LINEAL MULTIPLE: En la regresión lineal múltiple vamos a utilizar más de una variable explicativa lo que nos significará más información para la construcción del modelo y en consecuencia realizar estimaciones más precisas. Al manejar más de una variable vamos a considerar que los valores de la variable independiente Y se generan por una combinación lineal de los valores de las variables explicativas y un término aleatorio.

Los coeficientes se determinarán de manera que la suma de cuadrados entre los valores observados y los pronosticados sea mínima, es decir, que se va a minimizar la varianza residual. La ecuación mostrada anteriormente recibe el nombre de hiperplano, pues cuando tenemos dos variables explicativas, en vez de una recta tenemos un plano:

7

UNIVERSIDAD NACIONAL DE INGENIERIA

2.2.1.

EL MEJOR HIPERPLANO DE REGRESIÓN:

De manera análoga al caso de la regresión lineal simple, en la nube de puntos o grafica de dispersión para la regresión lineal múltiple se pueden trazar muchos hiperplanos de regresión, pero debemos elegir un criterio para basándonos en él, determinar el mejor hiperplano de regresión.

.2.2. ESTIMACION DE PARÁMETROS: 2.2.2.1. MÉTODO DE MÍNIMOS CUADRADOS: Calcularemos un hiperplano de regresión de forma que minimice la varianza residual:

Utilizando notación matricial:

8

UNIVERSIDAD NACIONAL DE INGENIERIA

.Y teniendo en cuenta la definición de

:

.Por tanto:

.La varianza se pude expresar como:

.Es decir:

.La varianza residual es una función del vector de parámetros para que tenga un mínimo será:

9

y la condición

UNIVERSIDAD NACIONAL DE INGENIERIA .Para hacer más sencilla la derivación desarrollemos la expresión de la varianza residual:

.Igualando a cero y despejando:

.Y se

es matriz no singular y por lo tanto tiene inversa, tenemos:

.Multiplicando por

:

Esta expresión del estimador de parámetros

.

.3. BONDAD DE AJUSTE: 2.31. CONTRASTE DE REGRESIÓN: Para proponer un modelo (ajuste) que explique el comportamiento de una variable dependiente respecto de sus variables explicativas, como ya hemos visto, se realiza un estudio con pruebas experimentales, es decir, estamos sacando conclusiones de una muestra de un conjunto amplio de datos. Es obvio que distintas muestras van a dar distintos valores de los parámetros. Se denomina contraste de regresión al estudio de la posibilidad de que el modelo de regresión sea nulo, es decir que el valor de la variable explicativa (x) no van a influir de manera significativa en la variable y. Teniendo en cuenta 10

UNIVERSIDAD NACIONAL DE INGENIERIA el modelo de regresión lineal simple, lo anterior sería equivalente a afirmar que:

Si esto es cierto, se sigue que:

Es decir, la medida de la magnitud x no va a proporcionar información sobre el comportamiento de y. Para aceptar o descartar la posibilidad de nulidad se hace un estudio de la variabilidad (VT), en la que esta se divide en dos componentes, una componente explicada por el modelo de regresión (VE) y otra componente no explicada (VNE). La siguiente igualdad es conocida como el teorema fundamental de la descomposición de la suma de cuadrados:

11

UNIVERSIDAD NACIONAL DE INGENIERIA

2. Dividiendo la variabilidad total entre sus grados de libertad, obtenemos la varianza estimada de la variable dependiente:

Dividiendo la variabilidad no explicada entre sus grados de libertad, obtenemos la varianza residual de la variable dependiente:

Dividiendo la varianza explicada entre sus grados de libertad, obtenemos estimador de la varianza explicada:

Fuentes

Suma de cuadrados

Grados de libertad

12

Estimadores

UNIVERSIDAD NACIONAL DE INGENIERIA

Si los residuos siguen una distribución normal y

, tenemos que:

Por tanto:

Es decir, el cociente entre la varianza explicada y la no explicada será aproximadamente 1. Además, al seguir una distribución F, podemos asignar una medida de probabilidad (p-value) a la hipótesis de que la varianza explicada es igual a la varianza no explicada. En caso contrario la varianza no explicada será muy inferior a la varianza explicada y, por lo tanto este cociente tendrá un valor muy superior a 1. En general, si p-value es menor que 0.05 se acepta que el modelo de regresión es significativo; en caso contrario no podemos hablar de regresión pues el modelo sería nulo. Si aceptamos que el modelo de regresión es significativo, es habitual indicar el p-value como dato adicional del ajuste.

.3.2. COEFICIENTE DE DETERMINACIÓN (R2): La varianza residual nos puede indicar como están de cerca las estimaciones respecto de los puntos, pero esta varianza está influida por la varianza de la variable dependiente, la cual a su vez está influida por su unidad de medida. Por lo tanto, una medida adecuada es la proporción de la varianza explicada (VE) entre la varianza total (VT); así definimos el coeficiente de determinación R2: 13

UNIVERSIDAD NACIONAL DE INGENIERIA

Como R2 es el cociente de sumas de cuadrados es siempre positivo. Si la regresión sería perfecta, la varianza no explicada será cero, y por lo tanto:

3. APLICACION DE LA REGRESION LINEAL A LA INGENIERIA QUÍMICA.La aplicación del presente tema de estudio en la carrera de Ingeniería Química es muy basto, por ejemplo para hallar la concentración de un elemento que es uno de los parámetros de mayor importancia en los procesos químicos aplicados en la industria. Esta cuantificación se puede obtener mediante un espectrofotómetro, dispositivo que requiere se calibrado. Para ello se elabora una recta de calibración que se obtiene a partir de la correlación entre la absorbancia de un patrón y la concentración de la sustancia a controlar, también se puede utilizar en la evaluación de las constantes en un modelo de promedio de crecimiento de saturación que caracteriza a la cinética microbial, entre otros muchos ejemplos por eso a continuación se explicarán 2 ejemplos con RLS y RLM:

3.1. PROBLEMA DE REGRESION LINEAL SIMPLE:

14

UNIVERSIDAD NACIONAL DE INGENIERIA 1.- Una ecuación para la variación de la viscosidad del líquido con la temperatura es: µ=a × e

b T

donde a, b son constantes empíricas y T,

temperatura en K T (°C) µ (N.s/

m2 )

20

30 −3

40 −3

1× 10

8.08 ×10

50

6.53 ×10

−3

−3

5.33× 10

Estime la viscosidad a 25 y 35 °C utilizando la ecuación empírica. Solución: b

Sacamos ln a la ecuación:

µ=a × e T

Ln µ

T(K)

µ (N.s/ m

2

−3

)

= ln(a) + (b

×

1 T )

1/T

Ln µ

6.907755279 3.298697015×- 10−3 4.818363406 −3 3.19335781× 10 5.031348336 −3 3.0945381× 10 5.234404041 −3

293.15

1× 10

3.411122292×10

303.15

8.08 ×10−3

313.15

6.53 ×10−3

323.15

5.33× 10

−3

Estos datos con ayuda de la HP que nos facilita la solución del problema:

15

UNIVERSIDAD NACIONAL DE INGENIERIA

16

Una vez que ya hemos calculado los valores de las constantes de la ecuación podemos calcular la viscosidad a la temperatura pedida:

Reemplazando para T=25°C y luego 35°C obtenemos:

2. Se desea determinar la energía de activación del proceso de degradación de un contaminante a un producto inocuo en fase líquida. En el estudio de la cinética de la reacción a diferentes temperaturas se obtuvieron los siguientes datos:

Solución: De la ecuación de Arrenius, determinamos el modelo:

Aplicando logaritmo natural a ambos miembros de la expresión:

Obtenemos una recta de la forma: Calculando los valores de los puntos para la regresión: Ingresamos los datos a Minitab, luego vamos al menú regresión, gráfica de línea ajustada:

Introducimos las variables según nos indica Minitab:

Y luego en aceptar:

Del gráfico:

3.1. PROBLEMA DE REGRESION LINEAL MULTIPLE: 3. La ecuación de Antoine permite calcular la presión de vapor de un componente puro en función de la temperatura.

Caracterizar la ecuación de Antoine para el cálculo de la presión de vapor del propano, con la siguiente tabla de valores:

1 2 3 4 5 6 7

Solución:

70 60 50 40 30 20 10

7.3 7 9.7 2 12. 6 16. 2 20. 3 25. 4 31. 4 38. 2

11

30

66. 3

12

40

78

13

50

14

60

15

70

124

16

80

142 .8

17

90

164

8

0

18

9

10

46

19

10

20

55. 5

20

10 0 11 0 12 0

91. 8 107 .1

187 213 240

Para poder obtener los parámetros de la ecuación de Antonie lo primero que se hace es primero linealizamos la expresión de la ecuación aplicando a cada miembro la función logaritmo en base base 10:

Ahora esta última expresión tiene la forma de:

Entonces aplicamos una regresión lineal múltiple a la ecuación

con los datos de

la tabla proporcionada. Para el cálculo de los parámetros

utilizaremos el software “MiniTab 17”. Este

programa es fácil de manejar y es totalmente compatible con el Excel. Copiamos los datos a de las variables de la regresión directamente de Excel a Minitab. Ahora nos dirigimos al menú estadísticas, luego a regresión, regresión y a ajuste de modelo. Luego minitad nos pedirá que especifiquemos la variable respuesta y las explicativas, entonces las selecionamos según el modelo, luego aceptar.

De inmediato Minitab nos mostrará una tabla con la información básica del modelo y un análisis estadístico:

De la tabla:

Y la ecuación de Antonie queda caracterizada como:

4. CONCLUSIONES.

El análisis de regresión y correlación lineal constituyen métodos que se emplean para conocer las relaciones y significación entre series de datos. Lo anterior, es de suma importancia para la industria ya que es aquí en donde se presentan variables de respuesta e independientes las cuales interactúan para originar las características de un proceso en particular y por ende; analizar, predecir valores de la variable dependiente y examinar el grado de fuerza con que se relacionan dichas variables.



La regresión lineal simple y la regresión múltiple, analiza la relación de dos o más variables continuas, cuando analiza dos variables a esta se le conoce como variable bivariantes que pueden corresponder a variables cualitativas. La finalidad de una ecuación de regresión es la de estimar los valores de una variable con base en los valores conocidos de la otra. Del mismo modo, una ecuación de regresión explica los valores de una variable en términos de otra. Es decir, se puede intuir una relación de causa y efecto entre dos o más variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una.



Por otro lado, Al ajustar un modelo de regresión simple o múltiple a una nube de observaciones es importante disponer de alguna medida que permita medir la bondad del ajuste. Esto se consigue con los coeficientes de correlación. Si el modelo que se ajusta es un modelo de regresión lineal, a R se le denomina coeficiente de correlación y representa el porcentaje de variabilidad de la Y que explica el modelo de regresión.



Estas técnicas estadísticas constituyen una herramienta útil para el análisis de las variables de un proceso ya que a través de la aplicación de éstas, es posible conocer el modelo que siguen y la fuerza con que se encuentran relacionadas. Asimismo, es posible explicar la relación que guardan dos o más causas de un posible defecto.

5. BIBLIOGRAFIA.

Repositorio Institucional de la Universidad de Alicante. Artículo sobre Problemas

aplicados

a

la

ingeniería

química.

Alicante,

España.

Consultado el 15/11/2014. http://rua.ua.es/dspace/bitstream/10045/16373/9/Microsoft%20Word %20-%209.PROBLEMAS%20APLICADOS%20A%20LA%20INGENIERIA %20QUIMICA.pdf 

Universidad Politécnica de Cartagena. Departamento de ingeniería minera geológica y cartográfica. Artículo sobre “Aplicación de la difracción de rayos X”. Cartagena, Murcia, España. Consultado el 15/11/2014. http://www.upct.es/~dimgc/webjoseperez/DOCENCIA_archivos/Aplicacion es_DRX_Apuntes_y_ejercicios.pdf



Universidad de Salamanca. Proyecto Studii Salamantini. Curso de Análisis aplicado a la Ingeniería Química. 2008-09. Tema 1 “Introducción a los métodos instrumentales de análisis”. Salamanca, España. Consultado el 15/11/2014. Disponible en: http://ocw.usal.es/ciencias-experimentales/analisis-aplicado-a-laingenieria-quimica/contenidos/course_files/Tema_1.pdf



Ángeles Cea D´Ancona. Departamento de Sociología IV, Universidad Complutense Madrid. Artículo sobre “Análisis de regresión lineal”. Madrid, España. Consultado el 15/11/2014. Disponible en: http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departame nto/materiales/analisis_datosyMultivariable/18reglin_SPSS.pdf



Profesor F.J. Barón López. Universidad de Málaga. Unidad docente, Matemática aplicada y estadística. Artículo sobre “Regresión lineal”. Málaga, España. Consultado el 15/11/2014. Disponible en: http://matap.dmae.upm.es/WebpersonalBartolo/Probabilidad/15_Regresio nLineal.pdf