PASO 4

1 PASO 4 – DESCRIPCIÓN DE LA INFORMACIÓN Presentado por: HARRISON ANDRES GALINDO LOPEZ Codigo: 100105_288 Tutora: Mi

Views 184 Downloads 5 File size 118KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

1

PASO 4 – DESCRIPCIÓN DE LA INFORMACIÓN

Presentado por: HARRISON ANDRES GALINDO LOPEZ

Codigo: 100105_288

Tutora: Milena Díaz Silva

Estadística Descriptiva

Universidad Nacional Abierta y a Distancia – UNAD INGENIERIA EN SISTEMAS San José Del Guaviare 2020

2

INTRODUCCION

En base a un registro histórico de datos sobre la Resultados Pruebas Saber de 220 estudiantes Grado 11-Noviembre (2019), en algunos departamentos de Colombia. se presenta las soluciones de las actividades planteadas. La investigación estadística es una actividad que apela a diversas técnicas con el propósito de llegar a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple son técnicas de análisis de las variables de una investigación estadística, en este caso desde la encuesta realizada. Si bien es cierto estas técnicas mencionadas se pueden utilizar para solucionar problemas comunes en los negocios o para evaluar el comportamiento de su economía y en general se utiliza con mayor frecuencia en las ciencias económicas, también es cierto que en muchos casos se requiere conocer más que el comportamiento de una sola variable para entender una investigación cualquiera sea su especia. Entonces, sin importar la situación presentada se hace necesario que practiquemos estas técnicas de regresión por medio de ejercicios salientes de la cotidianidad, a continuación, veremos pues los resultados de dicha práctica. La realización de este trabajo es dar a conocer y poner en práctica la regresión y correlación medias de dispersión y estadísticas vicariantes sobre la unidad 2 de este curso

3

  JUSTIFICACIÓN

Partiendo de una base de datos sobre Resultados Pruebas Saber de 220 estudiantes Grado 11Noviembre (2019), en algunos departamentos de Colombia.se presenta las soluciones de las actividades planteadas dentro del periodo Para ello, en primer lugar aplicaremos el proceso de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual describiremos la relación entre dos o más variables independientes y una variable dependiente utilizando la ecuación de regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una interpretación de correlación de la investigación realizada en estas instituciones educativas. El trabajo de laboratorio constituye una de las mejores metodologías para la aplicación de modelos estadísticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro para la práctica de la unidad 4 de regresión y determinación

4

Objetivo General

identificar y aplicar las medidas bivariantes, atraves de los cálculos de los diferentes problemas que se encuentran en el laboratorio Denominado Regresión y Correlación lineal el cual va en función de la descripción de la problemática, a partir del trabajo realizado con variables cuantitativas, de la base de datos denominada: Pruebas SABER 11 - 220 estudiantes 2020 (16-1).

Objetivos Especificos

Leer las diferentes referencias Bibliograficas propuestas para el desarrollo de la actividad

Realizar un mapa mental en el cual se expliquen las medidas estadísticas Bivariantes de regresión y correlación

Definir los conceptos básicos asociados a Regresión y Correlación

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual se encuentra en el Entorno de aprendizaje práctico

Realizar un análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema estudiado

5

Diagrama de dispersión

Consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra

Correlación lineal simple

son métodos estadísticos que estudian la relación lineal se refiere al grado de variciones conjunta existente entre dos o mas variables  los valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una recta De una forma menos coloquial, la podemos definir como el número que mide el grado de intensidad y el sentido de la relación entre dos variables.

Coeficiente de determinación R2

el coeficiente de determinación, se define como la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.

6

Correlación positiva: Es la relación entre dos variables que muestra que ambas aumentan o disminuyen simultáneamente y la cual sirve para ver si existe una relación lineal perfecta. Correlación Negativa: Es aquella Relación entre dos variables que muestra que una variable disminuye conforme otra aumenta.

.

CH-Pureza.

El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos: X (% de Hidro carburos)

Y

0,95

90,04

1,03

89,06

1,16

91,39

1,27

93,73

1,44

96,71

1,3

94,44

0,82

87,57

1,21

91,78

1,56

99,39

(Pureza)

7

1,42

93,55

1,17

93,43

1,13

92,5

0,97

90,4

1

89,3

1,12

89,83

1,18

90,35

1,23

93,19

1,33

93,31

1,42

94,77

0,93

87,32

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

8

relacion entre pureza y oxigeno 105

oxigeno

100 f(x) = 14.25 x + 75.26 R² = 0.85

95 90 85 80 0.7

0.8

0.9

1

1.1

1.2

pureza

1.3

1.4

1.5

1.6

1.7

9

El porcentaje de hidrocarburos es directamente proporcional a la pureza, esto quiere decir que entre mayor es el porcentaje de hidrocarburos mayor va a ser la pureza.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente y = 14,247x + 75,263 es confiable porque el coeficiente de determinación R2 es cercano a 1.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Esta ecuación no hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 11.15% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variables, que es el 33.39%.

d.

¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 92,3?

14,247(92,3)+ 75,263= y= 1.390,2611

10

Temperatura-consumo de gaseosa. El número de gaseosas (y) consumidas mensualmente en un sector de la ciudad de barranquilla, se relaciona con la temperatura promedio (en o F). Para el año 2018, se registraron los siguientes valores de temperatura y consumo de gaseosas.

2018 registros de temperatura y consumos gaseosas.

Mes

Temperatura (F)

Consumo gaseosas (lts)

Ene.

23

188,14

Feb.

26

216,82

Mar.

34

290,38

Abr.

49

427,19

May.

52

457,35

Jun.

61

541,35

Jul.

70

623,9

Ago.

76

677,41

Sep.

64

564,38

Oct.

52

455,28

Nov.

43

372,3

Dic.

32

276,33

11

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es confiable? Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. ¿Cuál es el de consumo de gaseosas cuando la temperatura es de 70 oF?

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

numero de gaseosas consumidas 800 700

temperatura

600 500 400 300 200 100 0

0

2

4

6

8

10

consumo gaseosas Linear ()

12

14

12

Para este caso se evidencia que hay un tipo de relación directa ya que en el grafico se evidencia que, a más cantidad de la primera magnitud

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es confiable

y = 17,316x + 311,68 R² = 0,152 En este caso podemos decir que este modelo matemático no es confiable, ya que del 100% es solo confiable en un 15,28%

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. En este caso podemos ver que el grado de relación en el que se encuentra esta variable es de 0,3908 y según lo evidenciado en la tabla de grado se muestra que para este valor existe una correlación mínima

¿Cuál es el de consumo de gaseosas cuando la temperatura es de 70 oF

13

17,316(70)+311,68=y 1.523,8

Temperatura – Enfermedad respiratoria.

En una investigación realizada durante el mes de agosto en un hospital pediátrico respecto a la relación de la temperatura ambiente media y los casos de enfermedad registrados se obtuvieron los siguientes datos Temperatura Media °C

Casos de enfermedad respiratoria

9

28

11

26

14

22

15

22

17

22

18

16

20

12

21

6

22

6

14

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

INVESTIGACION del mes de agosto 30

temperatura media

25 20 15 10 5 0

8

10

12

14

16

18

casoso de enfermedad respiratoria

20

22

24

15

En la gráfica lineal vemos existe un tipo de asociación de manera lineal esto debido a que todas sus variantes se muestran en una sola dirección y de forma recta.

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es confiable? y=-1,7333x+46,089 R² = 0,8909 En este caso podemos decir que este modelo matemático no es confiable, ya que del 100% es solo confiable en un 89,09%

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

0,9438 Para esta ocasión podemos decir que este modelo matemático es confiable ya que del 100% es confiable solo en un 94,38 %

¿Cuál será el número de casos esperados de enfermedad respiratoria en el hospital, si la temperatura cae a 7 °C?

y=-1,7333(7)+46,089= y= 58,2221

16

En este caso podemos ver que el grado de relación en el que se encuentra esta variable es de 58,2221 y según lo evidenciado en la tabla de grado se muestra que para este valor existe una correlación mínima

Conclusión

Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un diagrama de dispersión y aplicar conceptos, fórmulas de relación y correlación que permita el despeje de las ecuaciones y datos para obtener un resultado. Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlación es confiable para los tipos de datos .Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado de correlación entre las variables.