Estadistica descriptiva actividad 2

ESTADISTICAS DESCRIPTIVA Paso 4: Regresión y Correlación. . Presentado a: Entregado por: Grupo: 204040_38 UNIVERSIDA

Views 523 Downloads 91 File size 525KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADISTICAS DESCRIPTIVA Paso 4: Regresión y Correlación. .

Presentado a:

Entregado por:

Grupo: 204040_38

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA VALLEDUPAR, CESAR

INTRODUCCION.

Con base a los registros obtenidos a partir de la base de datos “Indicadores socioeconómicos 120 municipios (2019) 16-2”, la investigación estadística es una actividad que apela las diversas técnicas con el propósito de llegar a la esencia de la realidad, aplicando la regresión y correlación lineal que son técnicas de análisis de una investigación estadística en los casos de los indicadores socioeconómicos de 120,la realización de este trabajo es con el fin de dar a conocer y poner en practica la regresión y correlación y medidas de dispersión estadísticas vicariantes, así mismo obtener los resultados que se manejen en los ejemplos que se emplean en el laboratorio propuesto.

Justificación

Cuando realizamos un estudio estadístico lo hacemos para obtener conclusiones sobre una problemática que afecta a una población, en este caso la problemática es el desempleo en Colombia, y los gráficos estadísticos son herramientas que nos permiten analizar una gran cantidad de datos y hallar relaciones entre diferentes variables.

Objetivos

Objetivos generales:  



 

Determinar la relación entre 2 variables de la problemática a partir de la correlación y la regresión lineal simple. Potencializar en los estudiantes las habilidades y destrezas para caracterizar una situación mediante el análisis de medidas estadísticas bivariantes. Objetivos específicos. Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades colaborativas que permitan determinar el tipo de asociación entre las variables escogidas. Encontrar el modelo matemático que permite predecir el efecto de una variable sobre otra y comprobar su confiabilidad. Identificar variables cuantitativas que puedan estar correlacionadas y probar estadísticamente dicha relación.

Actividades a desarrollar

Actividad 1. Mapa Mental

Actividad 2. Definición de Conceptos. Descripción de la Actividad: Definir brevemente los conceptos básicos asociados a Regresión y Correlación como: 

Diagrama de dispersión: Es una herramienta que nos permite estudiar las relaciones entre dos conjuntos asociados de datos que aparecen en pares, los diagramas de dispersión se usan para descubrir y mostrar las relaciones entre dos conjuntos asociados de datos y confirmar relaciones anticipadas entre dos conjuntos asociados de datos. Ejemplo: (x,y) uno de cada conjunto Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes, una relación positiva entre x y y significa que los valores crecientes de x están asociados con valores crecientes de y, en cuanto a una relación negativa significa que los valores crecientes de x están asociados con los valores decrecientes de y.



Correlación lineal simple:

Bajo el concepto de correlación se recogen varios procedimientos e indicadores estadísticos utilizados para determinar el grado de asociación entre dos variables, el más sencillo de ellos es el de correlación lineal que está basado en la comparación de la varianza asociada de dos variables covarianza y las desviaciones estándar de cada uno a través del cálculo y tienen tres diferentes tipos de coeficientes de asociación los cuales son; la correlación Pearson, spearman y kendall Todos ellos varían entre +1 y -1 siendo +1 una correlación positiva perfecta y -1 una correlación negativa perfecta. 

Coeficiente de determinación R2: El coeficiente de determinación R2 tiene un valor comprendido entre 0 y 1, cuando su valor es 0 indica bondad del ajuste nulo y nula representatividad de la ecuación de regresión y cuando su valor es 1 indica bondad del ajuste prefecto y perfecta de la representatividad entre la ecuación estimada y la nube de puntos; los valores intermedios indican mayor o menor representatividad o ajuste de la función, recomendándose valores altos(superiores a 0,85) para dar por representativa la ecuación estimada.



Correlación positiva y correlación negativa: La correlación positiva nos indica que al modificarse el promedio de una variable en un sentido, la otra lo hace en la misma dirección y no dice que un aumento de y dependerá de un aumento de x. La correlación negativa nos muestra que al cambiar una variable en una determinada dirección (en promedio, la otra lo hace en sentido contrario u opuesto, esto sería que un aumento de x causara una disminución de y.



¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?:

El Coeficiente de correlación es una medida que permite conocer el grado de asociación lineal entre dos variables cuantitativas (X, Y), entonces el coeficiente de relación lineal, mide la fuerza y el sentido de la relación lineal entre 2 variables cuantitativas luego de haber aplicado la formula, según el resultado se puede clasificar en este rango.

Actividad 3. Realizar el laboratorio de regresión y correlación lineal a. b.

Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.

c. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? d. Determine el grado de correlación de las dos variables.

e. Relacionar la información obtenida con el problema. f. Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo matemático calculado. Desarrollo A. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación. A partir de la base de datos “Indicadores socioeconómicos 120 municipios (2019) 16-2”, desarrollar el Laboratorio denominado Regresión y correlación del peso y la estatura según su plan nutricional.  % de Población de estudiantes de 10 años según su estatura  % de Población de estudiantes según su peso B. Realizar el diagrama de dispersión de dichas variables.

C. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? y = 0,386 x - 22,751 R² = 0,8329 Es confiable porque el resultados después de haber hecho su respectivo modelo matemático aplica a que es el 83.29%. D. Determine el grado de correlación de las dos variables.

𝑅 2 = 0,8329 𝑅 = √0.8329 𝑅 = 0.9126 E. Relacionar la información obtenida con el problema. La correlación entre el % de los estudiantes con una estatura para su edad por su nutrición y los estudiantes según su peso de la misma edad para su estatura según su nutrición es muy Irregular. F. Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo matemático calculado.  Si en el municipio solo el 20% de estudiantes de 10 años mide 110 según su peso 19kg ¿ Cuál es el peso que debería tener un estudiante que mida 120 cm? 𝑥 = 0,386𝑥 − 22,751 𝑦 = 0,386(120) − 22,751 𝑌 = 23,569 Por lo tanto un estudiante que tenga un estatura de 120 cm deberá pesar 24 kg aproximadamente  Si en un municipio hay un 40% de Población de 10 que mide 120 y pesa 22kg ¿ ¿Cuál es el peso que debería tener un estudiante que mida 125 cm? y = 0,386x- 22,751 y = 0,386(125) − 22,751 y = 24.606kg Un estudiante con 125 cm de estatura debe pesar aproximadamente 24,606 kg.  Si en un municipio hay un 3% de Población de 10 años mide 100 y pesa 16kg ¿Cuál sería peso que debería tener cuando mida 105? y = 0,386x- 22,751 y = 0,386(105) − 22,751 y = 17,779kg

Actividad 4. Regresión y correlación múltiple. a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación.  Cantidad de Empresas en el municipio

 Población con empleo en el municipio %  Cantidad de personas con desempleo

b. Realizar el diagrama de dispersión de dichas variables.

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación. Estadísticas de la regresión Coeficiente de correlación múltiple

0,96272351

Coeficiente de determinación R^2

0,96980283

R^2 ajustado

0,92642681

Error típico

1,57163246

Observaciones

125

ANÁLISIS DE VARIANZA

V Grados de libertad Suma de cuadrados Regresión

Promedio de los cuadrados

3

74,9733213

32,4366606

Residuos

121

298,693345

2,58002859

Total

124

375,586667

Coeficientes

Error típico

Estadístico t

F 14,1511285

Probabilidad

Intercepción

8,92744502

0,59343533

10,325885

3,6804E-18

Variable X 1

-0,09684462

0,01269679

-5,1071671

1,2835E-06

Variable X 2

-0,05483224

0,0663028

-0,56275509

0,57467841

𝑦=

8,92744502

+ −0,09684462𝑥1 + −0,05483224𝑥2

Coeficiente de determinación R^2= 0,9698*100%= 96,98% El modelo matemático explica el 96,98% de confiabilidad de la información, lo que nos quiere decir que es muy confiable

R= 0,5483*100% = 54,83% La correlación entre las variables es mínima, ya que ofrece el 54,83%

D. Relacionar la información obtenida con el problema. Con la información analizada podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo en el municipio estudiado, una política que incentive a la creación de empresas en Colombia garantiza que la tasa de desempleo disminuya.

Conclusiones. Con la regresión lineal podemos relacionar una variable (conocida como variable dependiente) con una o más variables independientes por medio de una ecuación lineal, el coeficiente de correlación indica el nivel de asociación entre la variable dependiente e independiente en el modelo matemático de la regresión lineal, puede ser negativa o positiva y un valor cercano a 1 indica si efectivamente el modelo corresponde a una línea recta, cuando analizamos las variables de cantidad de empresas y la variable personas con empleo podemos determinar que al aumentar el número de empresas aumenta el número de personas con empleo y con esto se disminuye el desempleo.

Bibliografía.

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. Mexico City: Cengage Learning. Páginas 686 – 695. Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158. Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning. Páginas 675 – 686. Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning. Páginas 675 – 686. Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151 – 158. Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. México City: Cengage Learning. Páginas 686 – 695.