trabajo de katerine

-Diagrama de dispersión. -Correlación lineal simple. -Coeficiente de determinación R2 -Correlación positiva y correlació

Views 71 Downloads 0 File size 407KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

-Diagrama de dispersión. -Correlación lineal simple. -Coeficiente de determinación R2 -Correlación positiva y correlación negativa -¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Diagrama de dispersión. Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio. El diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.   Correlación lineal simple.    La correlación lineal simple está basada en la comparación de la varianza asociada de dos variables (covarianza) y las desviaciones estándar de cada uno a través del cálculo del coeficiente r de Pearson. Coeficiente de determinación R2 El coeficiente de determinación que se conoce también como r2, es un término utilizado en estadística, que tiene como función principal predecir el resultado de hipótesis. Esto es fundamental en cualquier estudio con fundamentos científicos. Correlación positiva y correlación negativa -          En la correlación positiva Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional. -          Correlación negativa Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

En una distribución bidimensional puede ocurrir que las dos variables guarden algún tipo de relación entre sí. El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores de las dos variables la nube de puntos se aproximaría a una recta).

Diagrama de dispersión.  Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. El diagrama de dispersión permite analizar si existe algún tipo de relación entre dos variables. Por ejemplo, puede ocurrir que dos variables estén relacionadas de manera que, al aumentar el valor de una, se incremente el de la otra. En este caso hablaríamos de la existencia de una correlación positiva.   Correlación lineal simple.    La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una recta.   Coeficiente de determinación R2. En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es predecir futuros resultados o probar una hipotesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el modelo.   Correlación positiva y correlación negativa.

Correlación Positiva:  Relación entre dos variables que muestra que ambas aumentan o disminuyen simultáneamente. Correlación Negativa:Relación entre dos variables que muestra que una variable disminuye conforme otra aumenta.   ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir? El Coeficiente de correlación es una medida que permite conocer el grado de asociación lineal entre dos variables cuantitativas (X, Y). Es un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

ACTIVIDAD 3. REALIZAR EL LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL Análisis de correlación lineal simple de las dos variables cuantitativas seleccionadas. (Laboratorio) A partir de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-1)”, desarrollar el Laboratorio denominado Regresión y correlación, el cual se encuentra en el Entorno de aprendizaje práctico, en la carpeta Guía para el uso de recursos educativos. El laboratorio lo puede desarrollar con el programa Infostat o Excel. Donde el estudiante deberá realizar lo siguiente: a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas.

(x)Población total(habitantes)

(y) Fallecidos enefeb 2019

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación entre las variables.

c. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es y =-9E-05x+ 28,913 podemos observar que no es confiable, ya que El coeficiente de determinación, el cual es: R² =0.99% nos está indicando que el modelo no es confianble.

d.

Determine el grado de correlación de las dos variables.

Apartir del coficiente de correlacion R:0,09 el grado de correlacion linel indica que no hay correlacion ya que este entre 0 < 0,30

e.

Relacionar la información obtenida con el problema.

Encontramos que el número de fallecidos de 2019 no depende de la población total de habitantes, ningún modelo lineal se ajusta a estas dos variables. f. Establezca al menos 3 nuevos valores independientes para ser hallados a través del modelo matemático calculado.

1. ¿Cuál sería el número de fallecidos en enero – febrero si el número de usuarios de moto sea 320? y=0.4385 x−9.0092 x=

y +9.0092 0,4385

x=

320+9.0092 0,4385

x=750.30 2. ¿Si el número de fallecidos en enero – febrero es de 35 entonces cuanto sería el número de usuarios de moto? y=0.4385 x−9.0092 y=0.4385 ( 35 )−9.0092 y=6.33 3. ¿al tener una cantidad de 250 de fallecidos en enero – febrero quisiéramos saber cuánto sería el número de fallecidos moto?

y=0.4385 x−9.0092 y=0.4385 ( 250 )−9.0092 y=100.62

Actividad 4. Regresión y correlación múltiple. a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas independientes del estudio de investigación. Y= Población_2019 X1= Fallecidos ene-feb 2019 X2= lesionados ene-feb 2019 b.

Realizar el diagrama de dispersión de dichas variables.

Poblacion_2019 vs Fallecidos ene-feb 2019 Linear () 400

poblacicion _2019

350 300 250 200 150 100 50 0

0

5 0 00 0 0

1 0 0 0 00 0

1 5 00 0 0 0

2 0 0 0 00 0

Fallecidos ene-feb 2019

2 5 0 0 00 0

3 0 00 0 0 0

Poblacion_2 0 1 9 vs lecionados e ne -fe b 2019 250

Poblacion_2019

200

150 Linear () 100

50

0

0

5 0 00 0 0

1 0 00 0 0 0 1 5 0 0 00 0 2 0 00 0 0 0 2 5 0 0 00 0 3 0 00 0 0 0 Lesionados ene-feb 2019

c. Cálculo de la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.

  Intercepción Variable X 1 Variable X 2

Coeficientes 1002,201151 502,7677398 11266,56299

y=1002.20+502.77 x 1+ 11266.56 x 2

Estadísticas de la regresión Coeficiente de correlación múltiple 0,96821844 Coeficiente de determinación R^2 0,937446947 R^2 ajustado 0,93681189

R2=0.937∗100=93.7 % , Siendo Este Modelo Matemático Confiable ya que es cercano a 1. R=0.968∗100=96.8 % , indica que la correlación entre las variables es excelente ya que ofrece el 96.8 % Lo anterior comprueba la relación entre las tres variables que son población_2019, fallecidos enefeb 2019, lesionados ene-feb 2019.

d.

Relación de la información obtenida con el problema.

De acuerdo a la información anterior indican que las variables población_2019, fallecidos ene-feb 2019, lesionados ene-feb 2019; se encuentran relacionadas a través del modelo matemático y=1002.20+502.77 x 1+ 11266.56 x 2 . De tal manera este modelo presenta un 93.7 % de confiabilidad. Debido a que las variables ya dichas se encuentran en una correlación excelente de 96.8%