paso 4

PASO 4 - DESCRIPCIÓN DE LA INFORMACIÓN EMILENA MARIA GONZALEZ NUMERO DEL CURSO: 204040A_612 TUTOR: LEIDY JOHANA JIMEN

Views 151 Downloads 5 File size 645KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

PASO 4 - DESCRIPCIÓN DE LA INFORMACIÓN

EMILENA MARIA GONZALEZ

NUMERO DEL CURSO: 204040A_612

TUTOR: LEIDY JOHANA JIMENEZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESTADISTICA DESCRIPTIVA BARRANQUILLA JULIO 2019

Introducción

Se busca lograr identificar y por medios de este calcular e interpretar las diferentes medidas bivariantes, cuyas medidas permiten el análisis conjunto de las características con el propósito de detectar posibles relaciones entre ellas, a partir de las variables cuantitativas. Por medios de las lecturas establecidas por la guía se busca también hacer una breve definición de los conceptos básicos de regresión y correlación.

Objetivos

Generales: Se pretende desarrollar la actividad en base a las lecturas planteadas describiendo una de las bivariantes y también los conceptos de regresión y correlación desarrollando en base a ellos un laboratorio. Específicos:

Dentro de lo que se quiere evidenciar en el trabajo podemos clasificar: Regresión lineal -coeficiente de determinación lineal. -Análisis de correlación. -Regresión simple. -Diagramas de dispersión. -Análisis de correlación múltiple. -coeficiente de determinación. -coeficiente de correlación

MAPA MENTAL Actividad 1. Mapa Mental.

MEDIDAS ESTADÍSTICAS BIVARIANTES DE REGRESIÓN

Actividad 2. Definición de Conceptos. El diagrama de dispersión El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos pares como una nube de puntos. Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos asociados de datos y confirmar relaciones anticipadas entre dos conjuntos asociados de datos.

Correlación lineal simple Bajo el concepto de correlación se recogen varios procedimientos e indicadores estadísticos utilizados para determinar el grado de asociación entre dos variables; el más sencillo de ellos es el de correlación lineal que está basado en la comparación de la varianza asociada de dos variables (covarianza) y las desviaciones estándar de cada uno a través del cálculo del coeficiente r de Pearson.

Coeficiente de determinación

El coeficiente de determinación que se conoce también como r2, es un término utilizado en estadística, que tiene como función principal predecir el resultado de hipótesis. Es el cuadrado de correlación que mide que parte viene explicada en una determinada variante como parte de una variación, esto quiere decir cual se puede predecir a través de la variación de la otra.

Correlación positiva Relación entre dos variables que muestra que ambas aumentan o disminuyen simultáneamente.

Correlación negativa Relación entre dos variables que muestra que una variable disminuye conforme otra aumenta.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir? El Coeficiente de correlación es una medida que permite conocer el grado de asociación lineal entre dos variables cuantitativas (X, Y). ... Recordar entonces que el coeficiente de relación lineal, mide la fuerza y el sentido de la relación lineal entre 2 variables cuantitativas.

Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas. a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas.  % de Población de 15 años o más analfabeta  % de Población ocupada con ingreso de hasta 2 salarios mínimos b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.

Tipo de asociación: Directa porque cuando aumenta el % de Población de 15 años o más analfabeta también aumenta el % de Población ocupada con ingreso de hasta 2 salarios mínimos c. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Modelo matemático: y= 1,8647x +28,178 y= % Población ocupada con ingreso de hasta 2 salarios mínimos x= % de Población de 15 años o más analfabeta R ²= 0,3894 coeficiente de determinación 0,38*100%=38% confiabilidad del modelo matemático Esto quiere decir que este modelo matemático no es muy confiable.

d. Determine el grado de correlación de las dos variables. Grado de correlación entre dos variables= coeficiente de correlación = R R ²= 0,3894 R=

= 0,62

e. Relacionar la información obtenida con el problema. La correlación entre el % de Población de 15 años o más analfabeta y % Población ocupada con ingreso de hasta 2 salarios mínimos es REGULAR.

f. Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo matemático calculado. 1. Si en un municipio hay un 15% de Población de 15 años o más analfabeta ¿Cuánto seria el % de Población ocupada con ingreso de hasta 2 salarios mínimos en ese municipio? x= Población de 15 años o más analfabeta = 15 y= Población ocupada con ingreso de hasta 2 salarios mínimos = ? y = 1,8647x +28,178 Y= 1,8647(15) +28,178 Y= 56 2. Si en un municipio hay un 5% de Población de 15 años o más analfabeta ¿Cuánto seria el % de Población ocupada con ingreso de hasta 2 salarios mínimos en ese municipio? x= Población de 15 años o más analfabeta = 15 y= Población ocupada con ingreso de hasta 2 salarios mínimos = ? y = 1,8647x +28,178 Y= 1,8647(5) +28,178 Y= 37

3. Si en un municipio hay un 3% de Población de 15 años o más analfabeta ¿Cuánto seria el % de Población ocupada con ingreso de hasta 2 salarios mínimos en ese municipio? x= Población de 15 años o más analfabeta = 15 y= Población ocupada con ingreso de hasta 2 salarios mínimos = ? y = 1,8647x +28,178 Y= 1,8647(3) +28,178 Y= 33

Análisis de correlación múltiple de las variables cuantitativas seleccionadas. a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación.  Cantidad de servicios públicos disponibles  % Población ocupada con ingreso de hasta 2 salarios mínimos  Cantidad de resguardos indígenas

b. Realizar el diagrama de dispersión de dichas variables.

c. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

Estadísticas de la regresión Coeficiente de correlación múltiple 0,42708645 Coeficiente de determinación R^2 0,18240283 R^2 ajustado 0,16842681 Error típico 1,57163246 Observaciones 120

ANÁLISIS DE VARIANZA Grados de libertad 2 117 119

Suma de cuadrados 64,4733213 288,993345 353,466667

Promedio de los cuadrados 32,2366606 2,47002859

Intercepción

Coeficientes 6,12774502

Error típico 0,59343533

Estadístico t 10,325885

Variable X 1

-0,06484462

0,01269679

-5,1071671

1,2835E-06

-0,08998995 -0

Variable X 2

-0,03731224

0,0663028

-0,56275509

0,57467841

-0,16862146 0,0

Regresión Residuos Total

Valor crítico F de F 13,0511285 7,6481E-06

Probabilida d Inferior 95% 3,6804E-18 4,95247744

Coeficiente de determinación R^2= 0,1824*100%= 18,24% El modelo matemático explica el 18,24% de confiabilidad de la información, lo que nos quiere decir que no es muy confiable

R= 0,4270*100% = 42,70% La correlación entre las variables es mínima, ya que ofrece el 42,70%

d. Relacionar la información obtenida con el problema. Los resultados anteriores indican que las variables: Cantidad de servicios públicos disponibles, % Población ocupada con ingreso de hasta 2 salarios mínimos y Cantidad de resguardos indígenas, se encuentran relacionados a través de un modelo matemático de regresión múltiple y= 6,12774 + -0,06484x_1+-0,03731x_2, que explica el 18,24% de confiabilidad, esto debido a

S

7

que dichas variables se encuentran bajo una correlación mínima de 0,4270, que es lo mismo que decir 42,70%.

Conclusiones

Como conclusión de la actividad podemos resaltar que a través de las lecturas se hizo el desarrollo de cada uno de los puntos establecidos por la guia donde por medios del mapa mental se resumieron las medidas estadísticas bivariantes y brevemente una definición de los conceptos de regresión, correlación, el laboratorio y un análisis de Regresión y correlación lineal simple y múltiple.

Referencias bibliográficas

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE %7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929ab e203c8219 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning. (pp 675 – 686). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE %7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede11 6134cfce41

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. México City: Cengage Learning.(pp 686 – 695).Recuperado de http://go.galegroup.com/ps/i.do? id=GALE %7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae8 6bbaf74cb9