PASO 4

PASO 4 - DESCRIPCION DE LA INFORMACION PRESENTADO POR CARLOS ALFONSO RINCON TUTOR: MARIA JOSE CHARFUELAN ESTADÍSTICA

Views 365 Downloads 12 File size 244KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

PASO 4 - DESCRIPCION DE LA INFORMACION

PRESENTADO POR

CARLOS ALFONSO RINCON

TUTOR: MARIA JOSE CHARFUELAN

ESTADÍSTICA DESCRIPTIVA

NOVIEMBRE DEL 2019 BOGOTA

Contenido Actividad 1. Mapa Mental..................................................................................................................3

Actividad 1. Mapa Mental Descripción de la Actividad Individual: Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y correlación. Cabe aclarar que un mapa mental es una herramienta empleada para facilitar el aprendizaje mediante la visualización de ideas de forma esquematizada, todas ellas relacionadas entre sí, las cuales en conjunto ayudan a explicar un tema específico. Para su diseño inicie colocando la idea central en el centro utilizando palabras o imágenes, posteriormente desarrolle a su alrededor el resto de las ideas relacionadas con el tema, para establecer el orden jerárquico entre las ideas, desarrolle las mismas en el sentido de las manecillas del reloj. Además, utilice líneas para establecer la relación entre el concepto principal y las demás ideas; recuerde, que puede utilizar colores, imágenes, símbolos, figuras o elementos que permitan diferenciar las ideas, utilice su creatividad.

Socializar el mapa mental en el foro paso 4. Descripción de la Información.

Actividad 2. Definición de Conceptos.

Descripción de la Actividad Individual:

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

-Diagrama de dispersión. El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos pares como una nube de puntos. 

Una relación positiva entre x y y significa que los valores crecientes de x están asociados con los valores crecientes de y.



Una relación negativa significa que los valores crecientes de x están asociados con los valores decrecientes de y. -Correlación lineal simple. Bajo el concepto de correlación se recogen varios procedimientos e indicadores estadísticos utilizados para determinar el grado de asociacoón entre dos variables; el más sencillo de ellos es el de correlación lineal que está basado en la comparación de la varianza asociada de dos variables (covarianza) y las desviaciones estándar de cada uno a través del cálculo del coeficiente r de Pearson. -Coeficiente de determinación R2 El coeficiente de determinación, se define como la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar. -Correlación positiva y correlación negativa las dos variables se correlacionan en sentido inverso.A valores altos de una de ellas le suelen corresponder valor bajos de la otra y viceversa.Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta covariación extrema.Si r= -1 hablaremos de correlación negativa perfecta lo que supone una determinación absoluta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una relación lineal de pendiente negativa). - ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir? El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, la relación entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y tiempo la relación será de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson. Insistimos en este punto, que parece olvidarse con cierta frecuencia. Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal X (% de 0,99 1,02 1,15 1,29 1,46 1,36 0,87 1,23 1,55 1,4 1,19 1,15 0,98 1,01 1,11 1,2 1,26 1,32 1,43 0,95

Y (Pureza) 90,01 89,05 91,43 93,74 96,73 94,45 87,59 91,77 99,42 93,65 93,54 92,52 90,56 89,54 89,85 90,39 93,25 93,41 94,98 87,33

LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL 1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos: a.

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

El porcentaje de hidrocarburos es directamente proporcional a la pureza, esto quiere decir que entre mayor es el porcentaje de hidrocarburos mayor va a ser la pureza. La asociación de las variables es fuerte porque una variable depende de la otra, en este caso la pureza depende del porcentaje de hidrocarburos, esto se puede observar con el coeficiente de determinación R2 que es 87.74%. b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente y = 14.947x + 74.283 El modelo es confiable porque el coeficiente de determinación R2 es cercano a 1.

c.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 87.74% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variables, que es el 93.67%.

d.

¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3? y = 14.947x + 74.283 x=(y-74.283)/14.947 x=(91.3-74.283)/14.947 x=1.14 Cuando la pureza del oxigeno sea 91.3, el porcentaje de hidrocarburos será 1.14.

2.

El número de libras de vapor (y) consumidas mensualmente por una planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y consumos de vapor. Temperatura Consumo de Mes (oF) vapor (Lb) Ene. 21 185,79 Feb. 24 214,47 Mar. 32 288,03 Abr. 47 424,84 May. 50 455 Jun. 59 539 Jul. 68 621,55 Ago. 74 675,06 Sep. 62 562,03 Oct. 50 452,93 Nov. 41 369,95 Dic. 30 273,98 a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

La temperatura es directamente proporcional al consumo de vapor, esto quiere decir que entre mayor es la temperatura mayor va a ser el consumo de vapor. La asociación de las variables es fuerte porque una variable depende de la otra, en este caso el consumo de vapor depende de la temperatura, esto se puede observar con el coeficiente de determinación R2 que es 99.99%. b.

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable? El mejor modelo que describe el sistema es la función lineal y = 9.2087x - 6.3184 El modelo es muy confiable porque el coeficiente de determinación R 2 es aproximadamente 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 99.99% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variables, que es el 99.99%. d.

¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF? y = 9.2087*70 - 6.3184 y=638.29lb Cuando la temperatura sea 70 oF, el consumo de vapor será 638.29lb.

3.

Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables aleatorias x (porcentaje y (umbral de de reflejo 89 2 de 90 3 75 4 30 4,5 51 5,5 75 7 62 9 45 13 90 15 20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

La asociación de las variables no existe, esto se puede observar con el coeficiente de determinación R2 que es 11.15%. b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable? El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente y = -0.0629x + 11.642 El modelo no es muy confiable porque el coeficiente de determinación R 2 está muy lejos de 1. c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Esta ecuación no hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 11.15% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variables, que es el 33.39%. d.

¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso, de 40? y = -0.0629*40 + 11.642 y = 9.13 Cuando el porcentaje de sobrepeso sea 40, el umbral de reflejo de flexión nociceptiva será 9.13. Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El laboratorio lo puede desarrollar con el programa Infostat o Excel. De optar por el uso del programa Infostat, lo podrá descargar en el entorno de aprendizaje practico, carpeta: Laboratorios Estadística Descriptiva: Infostat tutoriales, enlace descarga del Infostat. Cada estudiante en el orden de participación escogerá un paquete de ejercicios y socializará a sus compañeros en el foro la elección; posteriormente al desarrollo, deberá subirlo al foro paso 4– Descripción de la información, en un archivo en Word utilizando el siguiente protocolo para nombrar el archivo: Nombre Apellido_lab_Regresión y Correlación Lineal. Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 4. Regresión y correlación Lineal.

Descripción de la Actividad Individual:

A partir de la base de datos suministrada: Desempleo en Colombia_2019 (16-4), cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e independiente. - Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables. - Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? - Determine el grado de correlación de las dos variables. - Relacionar la información obtenida con el problema.

Cada estudiante desarrollará el laboratorio; posteriormente, deberá subirlo al foro paso 4. Descripción de la Información, en un archivo denominado: Nombre Apellido_lab_Regresión y Correlación Lineal.