Paso 4

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA Unidad 2: Paso 4 - D

Views 133 Downloads 8 File size 444KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA DESCRIPTIVA

Unidad 2: Paso 4 - Descripción de la información.

Trabajo Individual Presentado por: Diana Carolina Lara

Presentado a tutor: MILENA DIAZ

Grupo 100105_248

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

Mayo 11 de 2020

1

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Introducción

El siguiente documento tiene como finalidad identificar los fundamentos básicos de la Estadística Descriptiva aplica las medidas bivariantes, aplicando conceptos como Regresión lineal, coeficiente de determinación lineal, coeficiente de correlación, Regresión simple y Diagramas de dispersión. Estos conceptos se aplicarán para el caso de estudio de datos e información de las Pruebas SABER 11 de 220 estudiantes del año 2020.

2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Justificación

Por medio de esta investigación se tuvieron en cuenta varios aspectos de origen informativo que nos podrían llevar a determinar de una forma más clara y el rendimiento y resultado académico Pruebas SABER 11 de 220 estudiantes del año 2020, entre los cuales se tuvo en cuenta varios aspectos como: ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓

Departamento Residencia Código Del Departamento Municipio De Residencia Estrato Familiar Número De Personas En El Hogar Cuartos En El Hogar Nivel De Educación Del Padre Nivel De Educación De La Madre Ocupación Del Padre Ocupación De La Madre Tiene Internet Servicio Tv cable Tiene computador Tiene lavadora Tiene automóvil Tiene motocicleta N° De Libros de Consulta Situación Económica Horas De Dedicación A La Lectura Entre otras

3

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Objetivos

Análisis de correlación simple de las variables cuantitativas seleccionadas.

Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o situación estudiada. Aplica las medidas bivariantes, aplicando conceptos como Regresión lineal, coeficiente de determinación lineal, coeficiente de correlación, Regresión simple y Diagramas de dispersión

4

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Mapa Metal

5

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Definición de conceptos

Diagrama de dispersión. El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera que, al aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de la existencia de una correlación positiva.

Correlación lineal simple. La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una recta.

Coeficiente de determinación R2 El coeficiente de determinación se define como la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar. Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.

Correlación positiva y correlación negativa Con los diagramas de dispersión podemos ver cómo se relacionan ambas variables entre sí. Esto es lo que se conoce como correlación. Hay tres tipos de correlación: positiva, negativa y nula (sin correlación).

6

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.

Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

De una forma menos coloquial, la podemos definir como el número que mide el grado de intensidad y el sentido de la relación entre dos variables.

7

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas. 1.1. Temperatura – Consumo de gas. En una ciudad del norte de la costa colombiana fue registrada la temperatura media del día y la cantidad de gas consumida en algunas de las residencias. Los datos están representados en la siguiente tabla. Para estudiar la relación entre la temperatura y el consumo de gas X Temperatura Y Volumen de Media - oC Gas consumido – cm3

a.

3

7

6

5

3

8

1

8

5

7

7

5

9

4

13

3

Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

En conclusión, podemos determinar que existen correlación entre las variables su dirección es negativa y la fuerza o intensidad es fuerte.

8

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Respuesta El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una herramienta muy confiable ya que permite determinar el comportamiento de las variables si se halla de manera adecuada.

c.

Determine el grado de relación de las dos variables. Respuesta a= -0,467800729 b= 8,623329283 X Temperatura o

Media - C 3 6 3 1 5 7 9 13

Y Volumen de Gas consumido – cm3 grado de Relación 7 25,40218712 5 51,27217497 8 25,40218712 8 8,155528554 7 42,64884569 5 59,89550425 4 77,14216282 3 111,63548

d. Determine el Volumen de gas consumido si la temperatura media llega a ser -1 grado o C? Respuesta El volumen de gas consumido cuando la temperatura es –1 o C es de 9,091130012, ya que se aplica la formula Y=a+bx.

9

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

1.2. X-Y Montaje – Horas de trabajo. En una empresa se desea verificar si la calidad de los computadores con defectos de montaje tiene relación con las horas trabajadas por día. Los siguientes datos representan dicha situación: Computado res con defectos (Y) Horas de trabajo (X)

a.

10

9

8

5

9

8

6

7

9

10

15

13

11

7

12

11

8

10

13

13

Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables

En conclusión, podemos determinar que existen correlación entre las variables su dirección es positiva y la fuerza o intensidad es fuerte.

b.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Respuesta El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una herramienta muy confiable ya que permite determinar el comportamiento de las variables si se halla de manera adecuada. 10

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

c.

Determine el grado de correlación de las dos variables. Respuesta a= 0,659889094 b= 0,643253235

d.

¿Cuál será la cantidad de computadores con defectos producidas si un trabajador labora 6 horas? Respuesta La cantidad de computadores con defectos producidas cuando una trabajador labora durante 6 horas es 4,519408503, ya que se aplica la formula Y=a+bx.

1.3. Temperatura – Enfermedad respiratoria. En una investigación realizada durante el mes de agosto en un hospital pediátrico respecto a la relación de la temperatura ambiente media y los casos de enfermedad registrados se obtuvieron los siguientes datos

Temperatura Media °C 9 11 14 15 17 18 20 21 22

Casos de enfermedad respiratoria 28 26 22 22 22 16 12 6 6

11

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

1. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

En conclusión, podemos determinar que NO existen

correlación entre las variables su dirección es positiva y la fuerza o intensidad es fuerte.

2. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. ¿Es confiable? Respuesta El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una herramienta muy confiable ya que permite determinar el comportamiento de las variables si se halla de manera adecuada. 3. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Respuesta a= -1,733333333 b= 46,08888889 4. ¿Cuál será el número de casos esperados de enfermedad respiratoria en el hospital, si la temperatura cae a 7 °C? Respuesta El número de casos esperados de enfermedad respiratoria en el hospital a una temperatura de 7 °C es de 320,8888889, ya que se aplica la formula Y=a+bx. 12

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o situación estudiada

Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e independiente. - Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.

En conclusión, podemos determinar que NO existen correlación entre las variables su dirección es negativo y la fuerza o intensidad es suave.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Respuesta El modelo matemático que nos permite predecir el efecto es Y=a+bx, Esta es una herramienta muy confiable ya que permite determinar el comportamiento de las variables si se halla de manera adecuada.

13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

- Determine el grado de correlación de las dos variables. Respuesta a= - 0,008647979 b= 2,446574709

- Relacionar la información obtenida con el problema. las horas de dedicación a Internet no tiene correlación con las horas que trabaja por semana, ya que como se puede ver en el diagrama de dispersión no tiene una secuencia lineal.

14

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Conclusiones

✓ Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados. ✓ La estadística juega un papel muy importante en nuestras vidas, ya que actualmente ésta se ha convertido en un método muy efectivo para describir con mucha precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar y analizar dichos datos. ✓ La estadística trata en primer lugar, de acumular la masa de datos numéricos provenientes de la observación de multitud de fenómenos, procesándolos de forma razonable. Mediante la teoría de la probabilidad analiza y explora la estructura matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.

15

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESTADÍSTICA DESCRIPTIVA

Bibliografía

Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado de http://hdl.handle.net/10596/11579 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r& p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r& p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning. (pp 675–686). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r& p=GVRL&sw=w&asid=e5 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX: Instituto Politécnico Nacional, (2010). ProQuest ebrary. (pp 95-109). Recuperado de http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616&tm=147 1981556569 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. (pp 99-109) Recuperado de http://site.ebrary.com/lib/unadsp/reader.action?ppg=6&docID=11230886&tm=1471 982022168

16