Estadistica descriptiva paso 4

ESTADÍSTICA DESCRIPTIVA PASO 4. DESCRIPCION DE LA INFORMACIÓN. Tutor (a): Entregado por: LEIDER TORRES PADILLA Código:

Views 376 Downloads 3 File size 681KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADÍSTICA DESCRIPTIVA PASO 4. DESCRIPCION DE LA INFORMACIÓN.

Tutor (a):

Entregado por: LEIDER TORRES PADILLA Código: 12436989

Grupo:

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS BÁSICAS, INGENIERÍAS Y TECNOLOGÍAS JULIO 2019

INTRODUCCIÓN La Estadística es una ciencia que proporciona un conjunto de métodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica materia de estudio o investigación. Este trabajo se analiza la información de los estudiantes de instituciones educativas públicas y privadas de la ciudad de Ibagué Tolima la correlación lineal simple de dos variables cuantitativas y haciendo la correlación múltiple de las variables cuantitativas de los datos recolectados en el estudio.

JUSTIFICACIÓN La información obtenida a través de instrumentos de recolección de datos es muy tediosa para analizar, por tal razón es necesario procesar esa información para poderla interpretar claramente. La estadística es una rama de las matemáticas que permite exponer esta información mediante tablas de frecuencias, graficas, entre otras cosas, para que la persona que vaya a estudiar la información reunida lo pueda hacer de la mejor manera.

OBJETIVOS   

Realizar el laboratorio de regresión y correlación lineal. Analizar de correlación lineal simple de las dos variables cuantitativas seleccionadas. Analizar de correlación múltiple de las variables cuantitativas seleccionadas.

Paso 4 - Descripción de la información Fecha de inicio de la actividad: 19 de julio de 2019 y Fecha de cierre de la actividad: 1 de agosto de 2019

Actividad 1. Mapa Mental Actividad 2. Definición de Conceptos. Descripción de la Actividad Individual Definir brevemente los conceptos básicos asociados a Regresión y Correlación como: Diagrama de dispersión. Se emplea cuando una o varias variables está bajo el control del experimentador. Si existe un parámetro que se incrementa o disminuye de forma sistemática por el experimentador, se le denomina parámetro de control o variable independiente y habitualmente se representa a lo largo del eje horizontal (eje de las abscisas). La variable medida o dependiente usualmente se representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito. Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Además, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos.

El diagrama de dispersión es una de las herramientas básicas de control de calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de control, el diagrama de Ishikawa y el diagrama de flujo. Correlación lineal simple. La correlación lineal simple son métodos estadísticos que estudian la relación lineal existente entre dos variables.

Para estudiar la relación lineal existente entre dos variables continuas es necesario disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros es la covarianza, que indica el grado de variación conjunta de dos variables aleatorias.

𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝐶𝑜𝑣 (𝑋, 𝑌) =

∑𝑛𝑖 = 1 (𝑥𝑖 − 𝑥) (𝑦𝑖 − 𝑦) 𝑁

−1

siendo 𝑥 e 𝑦¯ la media de cada variable y 𝑥𝑖 e 𝑦𝑖 el valor de las variables para la observación i. La covarianza depende de las escalas en que se miden las variables estudiadas, por lo tanto, no es comparable entre distintos pares de variables. Para poder hacer comparaciones se estandariza la covarianza, generando lo que se conoce como coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el coeficiente de Pearson, Rho de Spearman y Tau de Kendall. Coeficiente de determinación R2 El coeficiente de determinación, se define como la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar. Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.

Correlación positiva y correlación negativa Correlación Positiva Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva perfecta, es decir, ambas variables varían al mismo tiempo. Este tipo de correlación es directamente

proporcional. Hay correlación positiva cuando las dos variables se correlacionan en sentido directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e igualmente con los valores bajos. Correlación Negativa Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos, la otra posee valores bajos y mientras este valor esté más cerca de -1, más evidente será esta covariación. Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de correlación es inversamente proporcional. Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso. Correlación Positiva

Correlación Negativa

En la correlación positiva la relación entre variables es lineal y recta.

En la correlación negativa la relación entre variables es opuesta.

En la correlación positiva el cambio de una variable predice el cambio de la otra.

En la correlación negativa cuando una variable cambia, la otra lo hace de forma contraria.

La correlación positiva es directamente proporcional.

La correlación negativa es inversamente proporcional.

- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir? El Coeficiente de correlación es una medida que permite conocer el grado de asociación lineal entre dos variables cuantitativas (X, Y). En los siguientes Diagramas de dispersión se puede observar que existe una relación lineal entre la variable X y la variable Y

Sin embargo, si trazamos una línea recta en los diagramas.

Podemos observar que en un diagrama B los puntos se acercan más a la recta, caso contrario en el diagrama A, los puntos están más alejados. Entonces podemos decir que la relación lineal del diagrama A es más débil con comparación a la relación que existe en el diagrama B. Un diagrama dispersión no nos da certeza de que tan débil o fuerte es la relación lineal, necesitamos una medida que nos de la fuerza de la asociación y la dirección que toma esta relación Para esto sirve el coeficiente de correlación que está dado por la siguiente formula.

Socializar las respuestas en el foro paso 4. Descripción de la Información.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal

Descripción de la Actividad Individual:

Desarrollar el Laboratorio denominado Regresión y Correlación lineal, el cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta.

Actividad 4. Regresión y correlación Lineal. Descripción de la Actividad Individual:

A partir de la base de datos suministrada “Encuesta_ Instituciones_ Educativas 2019 (8-3)”, cada estudiante, deberá:

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas e identificar la variable dependiente e independiente. - Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables. - Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? - Determine el grado de correlación de las dos variables. - Relacionar la información obtenida con el problema. Actividad 4. Consolidación de la Información

A partir del trabajo individual realizado, consolidar toda la información en un informe descriptivo, que permita detallar la problemática estudiada: “Encuesta_

Instituciones_ Educativas 2019 (8-3)”, utilizando las tablas, gráficos, diagramas de dispersión, coeficiente de determinación, coeficiente de correlación, modelo matemático y demás elementos procesados anteriormente, el cual deberá contener: ANÁLISIS DE CORRELACIÓN MÚLTIPLE DE LAS VARIABLES CUANTITATIVAS SELECCIONADAS 

Peso estatura. Peso-Estatura Estadística de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 Error Típico Observaciones

0,965565132 0,9323 1,551481344 100

Gráfico de dispersión

y = 0.0119x + 0.9538 R² = 0.9323

1.80

Peso (kg)-Estatura

1.60 1.40 1.20 1.00 0.80 0.60 0.40 0.20 0.00 0.0

10.0

20.0

30.0

40.0

50.0

60.0

El peso de un estudiante depende de la estatura y la edad que tenga el estudiante, entre mayor sea la estatura y el peso del estudiante mayor va a ser el peso en los niños de Instituciones Públicas y Privadas del territorio Nacional. El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente 𝑦 = 0,0119𝑥 + 0,9538 El modelo es confiable porque el coeficiente de determinación R2 es igual a 0,9323. Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 93.23% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variable, que es el 96.55%.



Estatura peso Estatura-Peso Estadística de la regresión Coeficiente de correlación múltiple 0,965565132 Coeficiente de determinación R^2 0,9323 Error Típico 0,069598313 Observaciones 100

Gráfico de dispersión

Estatura-Peso 60.0 50.0 y = 78.135x - 72.41 R² = 0.9323

40.0 30.0 20.0 10.0 0.0 0.00

0.20

0.40

0.60

0.80

1.00

1.20

1.40

1.60

El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente 𝑦 = 78,135𝑥 − 72,41 El modelo es confiable porque el coeficiente de determinación R2 es igual a 0,9323. Esta ecuación hace una buena estimación entre las variables debido a que el coeficiente de determinación R2 explica el 93.23% de la información y el valor del coeficiente de correlación R confirma el grado de relación de la variable, que es el 96.55%.

CONCLUSIONES La estadística es una excelente herramienta para interpretar información obtenida de instrumentos de recolección de datos La regresión y correlación lineal son métodos muy eficientes para observar la relación de dos o más variables. La ecuación resultante de una regresión lineal permite predecir el futuro de las variables que se están estudiando.

REFERENCIAS BIBLIOGRÁFICAS  

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158. Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning. Páginas 675 – 686