Trabajo Colaborativo 3 Estadistica Descriptiva

ESTADISTICA DESCRIPTIVA FASE 4 TRABAJO COLABORATIVO 3 PRESENTADO POR: MALKA MARTINLEYES FORERO: 55.312.807 ELIZABETH MA

Views 117 Downloads 0 File size 490KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADISTICA DESCRIPTIVA FASE 4 TRABAJO COLABORATIVO 3

PRESENTADO POR: MALKA MARTINLEYES FORERO: 55.312.807 ELIZABETH MADIEDO: ROBERTO PADILLA:

GRUPO: 100105A

TUTOR: DANIEL FRANCISCO CHICA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD NOVIEMBRE- 2016.

INTRODUCCIÓN. Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la regresión y determinación mediante la realización de ejercicios empleando las medidas de regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.

JUSTIFICACIÓN.

En el presente informe se compararon datos cuantitativos para determinar su correlación y de ésta manera analizarla, partiendo de una realidad que conocemos y entendemos se podrán formular propuestas encaminadas a la transformación de una realidad. Mediante un proceso gradual de clasificación, organización y tabulación de datos hemos analizado variables cualitativas y cuantitativas, lo que nos permite en éste momento elaborar un laboratorio apoyados en el análisis y fórmulas del programa Microsoft Excel. Además de todo esto el trabajo permite distintas perspectivas que complementan la entrega final, adquiriendo nuevas experiencias a través de la ejercitación de nuestras habilidades interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la objetividad; todo esto a través del trabajo colaborativo en donde asumiendo distintos roles potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con responsabilidad y compromiso.

OBJETIVOS.

GENERAL Determinar la correlación entre dos variables cuantitativas a través de un laboratorio de regresión y correlación lineal ESPECÍFICOS 

Analizar datos agrupados para encontrar su relación



Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes adquiridos



Determinar la relación existente entre dos variables cuantitativas a través de las herramientas Infostat y Excel

1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos: X (% de

Y

Hidro

(Pureza)

XY





carburos) 0,99

90,01

89,11

0,98

8101,8

1,02

89,05

90,83

1,04

7929,9

1,15

91,43

105,14

1,32

8359,4

1,29

93,74

120,92

1,66

8787,2

1,46

96,73

141,23

2,13

9356,7

1,36

94,45

128,45

1,85

8920,8

0,87

87,59

76,20

0,76

7672,0

1,23

91,77

112,88

1,51

8421,7

1,55

99,42

154,10

2,40

9884,3

1,4

93,65

131,11

1,96

8770,3

1,19

93,54

111,31

1,42

8749,7

1,15

92,52

106,40

1,32

8560,0

0,98

90,56

88,75

0,96

8201,1

1,01

89,54

90,44

1,02

8017,4

1,11

89,85

99,73

1,23

8073,0

1,2

90,39

108,47

1,44

8170,4

1,26

93,25

117,50

1,59

8695,6

1,32

93,41

123,30

1,74

8725,4

1,43

94,98

135,82

2,04

9021,2

0,95

87,33

82,96

0,90

7626,5

23,92

1843,21

2214,657

29,2892

170044,5

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Pureza vs % hidrocarburos 105 100 95 Pureza

f(x) = 14.95x + 74.28 R² = 0.88

90 85 80 0.8

0.9

1

1.1

1.2

1.3

1.4

1.5

1.6

% de Hidrocarburos

El tipo de asociación entre las variables es de dispersión lineal ascendente con una correlación positiva alta. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?

Y= a + b X Y= 14,947X + 74,283 R² = 0,8774 La ecuación de la recta es confiable porque el coeficiente de la determinación (R2) está cercano a 1 y tiene una correlación excelente. c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

Se halla a y b

b=

23,92 ¿ ¿ 20∗29,28−¿ 20∗2214,657−( 23,92 ) (1843,21) ¿

a=

1843,21−(15,15∗23,92) 20

=

=

203,56 13,44

= 15,15

1480,8 = 74,04 20

Media de X X = 23,92/20 = 1,19 Media de y Y = 1843,21/20 = 92,16 La ecuación de la recta está dada por: Y = 15,15X + 74,04 Error estándar de la recta: Se =



170044,5−( 74,04 ) ( 1843,21) −(15,15)(2214,65) 20−2

=



21,29 18

=

Se halla el coeficiente de determinación y el coeficiente de correlación S²y=

R²= 1 -

170044,5 − ( 92,16 ) 2 20 1,09 8,76

= 0,87 r =

= 8.76

√ R ² = 0,93

√ 1,18 = 1.09

El grado de relación de las variables es de 0,93 d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

Y= 14,947X + 74,283 Y= 91,3 Reemplazando: 91,3 = 14,947X + 74,283 14,947 X + 74,283 = 91,3 14,947 X = 91,3 – 74,283 14,947 X = 17,017

X=

17,017 14,947

= 1,14

Cuando la pureza del oxígeno es igual a 91,3, el porcentaje de hidrocarburo es de 1,14%

2. El número de libras de vapor (y) consumidas mensualmente por una planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2015, se registraron los siguientes valores de temperatura y consumo anual.

2015 Registros de temperatura y consumos de vapor. X

Mes

Y

Consum Temperatura o de (oF) vapor (Lb)

XY





Ene. Feb. Mar.

21 24 32

185,79 214,47 288,03

Abr.

47

424,84

May. Jun. Jul.

50 59 68

455 539 621,55

Ago.

74

675,06

Sep.

62

562,03

Oct.

50

452,93

Nov.

41

369,95

Dic.

30

273,98

558

5062,63

3901,59 5147,28 9216,96 19967,4 8 22750 31801 42265,4 49954,4 4 34845,8 6 22646,5 15167,9 5 8219,4

441 34517,92 576 45997,38 1024 82961,28 2209

180489

2500 207025 3481 290521 4624 386324,4 5476

455706

3844 315877,7 2500 205145,6 1681

136863

900 75065,04

265883 292 ,86 56

241649 3,37

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

2015 Registros de temperatura y consumos de vapor. 800 700

f(x) = 9.21x - 6.32 R² = 1

600 500 Consumo de vapor (lb) 400 300 200 100 0 10

20

30

40

50

60

70

80

Temperatura (f)

El tipo de asociación entre las variables es de dispersión lineal ascendente con una correlación positiva alta.

b.

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable? y=9,2087x-6,3184 R² = 0,9999

La ecuación de la recta es confiable porque el coeficiente de la determinación (R2) está cercano a 1 y tiene una correlación excelente.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Se halla a y b

b=

558 ¿ ¿ 12∗29256−¿ 12∗265883,86− (558 ) (5062,63) ¿

a=

5062,63−( 9,21∗558) 12

=

=

365658,78 39708

= 9,21

−76,55 = -6,4 12

Media de X X = 558/12 = 46,5 Media de y Y = 5062,63/12 = 421,88 La ecuación de la recta está dada por: Y = 9,21X – 6,4 Error estándar de la recta: Se =



2416493,37−(−6,4 ) ( 5062,63 )−( 9,21)(265883,86) 12−2

R²= 0,99 r =

√ R ² = 0,99

=



103,8514 = 3,22 10

El grado de relación de las variables es de 0,99

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

Y =9,2087X - 6,3184 X = 70 Y = (9,2087) (70) – 6,3184 Y= 638,29

Si la temperatura está en 70 oF el consumo de vapor es de 638,29

3. Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables aleatorias

x y (umbral (porcentaj de reflejo e de de flexión sobrepeso nociceptiv ) a) 89 2 90 3 75 4 30 4,5 51 5,5

XY





178 270 300 135 280,5

7921 8100 5625 900 2601

4 9 16 20,25 30,25

75 62 45 90 20 627

7 9 13 15 14 77

525 558 585 1350 280 4461,5

5625 3844 2025 8100 400 45141

49 81 169 225 196 799,5

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

% de sobrepeso VS umbral de refl ejo de fl exión nociceptiva 16 14 12 10

f(x) = - 0.06x + 11.64

umbral de reflejo de flexión nociceptiva)

8R² = 0.11 6 4 2 0

0 20 40 60 80 100 % de sobrepeso

b.

Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable?

Y= -0,0629x + 11,642 R² = 0,1115

La ecuación de la recta no es muy confiable porque el coeficiente de la determinación (R2) está cercano a 0 y tiene una correlación debil

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

b=

627 ¿ ¿ 11∗45141−¿ 11∗4461,5−( 627 )( 77) ¿

=

a=

77−(0,007∗627) 11

72,611 = 6,601 11

=

797,5 103422

= 0,007

Media de X X = 627/11 = 57 Media de y Y = 77/11 = 7 La ecuación de la recta está dada por: Y = 0,007X + 6,6 Error estándar de la recta: Se =



S²y=

799,5 − (7 ) 2 11

R²= 1 -

799,5−( 6,6 ) (77 )−(0,007)(4461,5) 11−2

5,37 23,7

=



260,6 = 5,37 9

= 23,7

= 0,78 r =

√ R ² = 0,88

El grado de relación de las variables es de 0,88

VEL OCI DA D (X)

NU M ER O DE HE d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un RI porcentaje de sobrepeso, de 40? DO S (Y) Y= -0,0629x + 11,642 66 3 111 2 X = 40 66 1 Y= ¿? 80 2 75 8 66 0 45 0 Y= -0,0629 (40) + 11,642 88 4 55 2 Y= 9,126 70 6 105 4 88 1 69 2 Cuando el porcentaje de sobrepeso es de 40% el umbral de flexión 48 0 nociceptiva es de 9,126 70 2 83 2 138 3 68 4 REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE 77 2 81 5 Identificar dos variables cuantitativas de la situación estudiada que puedan estar 50 2 relacionadas. 88 4 71 2 NUMERO DE HERIDOS DEPENDIENTE Y 55 0 VELOCIDAD INDEPENDIENTE X 78 2 80 1 68 1 74 3 75 4 83 9 65 0 60 3 83 15 95 2 86 2 68 0 55 1 88 0 63 2 70 0 78 4 83 2 138 3 55 0 66 2

INDICES ACCIDENTALIDAD EN MEDELLIN 20 15

NUMERO DE HERIDOS 10 5 0 20

f(x) = 0.03x + 0.35 R² = 0.05 40

60

80

100

120

140

160

VELOCIDAD Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y= 0,033x + 0,3492

R² = 0,0453

R² = coeficiente de determinación= 4,53 % por lo tanto no es confiable. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. R= Coeficiente de correlación R= Raíz cuadrada de 0,0453 R= 0,21 % No hay correlación Relacionar la información obtenida con el problema. En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el grado de confiabilidad entre las variables Velocidad y Número de heridos es de 4,53%, lo cual significa

que no es confiable, no existe correlación entre ellas ya que su coeficiente corresponde a 0,21%, por lo tanto el número de heridos no depende de la velocidad de los conductores. REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigación. y x1 NUMERO VELOCID DE AD MUERTOS

0 1 1 0 0 2 1 2 0 1 0 3 1 2 1 0 0 1 1 1 0 2 1 3 1 0

66 111 66 80 75 66 45 88 55 70 105 88 69 48 70 83 138 68 77 81 50 88 71 55 78 80

x2 GRADOS DE ALCOHOL DEL CONDUCT OR 1,2 3,0 0,0 0,6 0,0 0,0 3,0 1,4 2,1 0,0 1,6 2,2 3,0 1,1 2,4 0,6 1,6 0,0 0,0 2,1 1,4 2,6 3,0 2,7 0,6 0,0

1 0 1 2 2 2 1 0 0 2 1 4 0 2 0 2 2 1 0 1 0 1 0 0 1 1 0 1 1 0 0 1 0 1 0 1 0 2 1 1

68 74 75 83 65 60 83 95 86 68 55 88 63 70 78 83 138 55 66 108 69 72 74 69 79 65 74 77 51 75 72 77 67 55 40 73 69 70 75 55

2,9 0,6 1,8 0,0 1,1 2,4 0,6 0,0 2,9 1,3 1,4 2,1 0,8 0,0 1,2 3,0 0,0 0,6 1,9 2,7 1,1 2,4 0,6 1,6 0,0 1,4 2,1 0,8 1,1 2,4 0,0 1,6 1,2 3,0 2,7 0,6 0,0 3,0 1,1 2,4

1 0 0 1 0 2 1 1 0 0 2 0 1 0 1 0 0 2 3 1 0 0 1 2 0 1 2 0 1 2 0 1 0 0 1 1 0 0 2 1

69 50 73 38 60 50 100 75 80 95 70 66 69 67 83 70 150 55 66 68 79 79 60 33 85 80 81 62 79 76 80 70 80 83 68 79 79 80 75 66

0,0 1,6 0,0 0,8 0,3 1,1 2,4 0,6 0,0 1,2 3,0 2,7 0,6 1,9 1,1 0,0 0,6 1,6 2,1 0,8 0,5 2,7 1,1 2,4 0,6 1,6 1,4 2,1 0,0 3,0 0,0 0,6 1,9 1,4 0,0 2,7 0,6 1,9 2,5 3,0

0 0 1 1 1 0 2 1 0 1 0 2 1 1

45 77 81 50 88 71 55 78 67 55 40 73 69 70

0,6 0,0 2,7 1,3 2,1 0,0 2,6 3,0 2,7 0,6 1,9 3,0 1,1 2,4

Realizar el diagrama de dispersión de dichas variables.

RELACIÓN: NUMERO DE MUERTOS Vs VELOCIDAD 4.5 4 3.5 3 2.5 NUEMRO DE MUERTOS

2 1.5 1 0.5 0 20

40

60

80

100

VELOCIDAD

120

140

160

RELACION: NUEMERO DE MUERTOS VS GRADOS DE ALCOHOL 4.5 4 3.5 3 2.5

NUMERO DE MUERTOS

2 1.5 1 0.5 0 0.0

0.5

1.0

1.5

2.0

2.5

3.0

GRADOS DE ALCOHOL

Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

0,264226981 0,069815897 0,053915314 0,82971621 120

ANÁLISIS DE VARIANZA Grados de libertad Regresión

2

Residuos

117

Total

119

Suma de cuadrados 6,04547491 7 80,5461917 5 86,5916666 7

Promedio de los Valor crítico cuadrados F de F 3,02273745 8 4,39077596 0,014497109 0,68842898 9

3.5

Coeficie ntes Intercep 0,69339 ción 6471 Variable 0,00187 X1 0908 Variable 0,21383 X2 7562

Error Estadísti Probabil Inferior Superior Inferior Superior típico co t idad 95% 95% 95,0% 95,0% 0,34775 1,99391 0,048487 0,00468 1,38211 0,00468 1,382110 6788 2107 59 2397 0544 2397 544 0,00432 0,43274 0,665999 0,01043 0,00669 0,01043 0,00669 3386 1376 3 3148 1332 3148 1332 0,07404 2,88774 0,004623 0,06718 0,36048 0,06718 0,36048 9969 6795 41 5483 9641 5483 9641

y= 0,69339+ (-0,00187x1)+0,21383x2 y= 0,69339-0,00187x1+0,21383x2 Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación. R^2=0,0698*100 R^2=6,98% El modelo matemático es confiable en un 6,98% R=0,26 No hay correlación entre las variables

Relacionar la información obtenida con el problema. Los resultados estadísticos obtenidos indican que no hay relación entre las variables: número de muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo matemático de regresión múltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlación es

invalida o no hay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la accidentalidad en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.

CONCLUSION Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD, entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da investigación.

REFERENCIAS BIBLIOGRÁFICAS 

Estadística descriptiva. Campus virtual UNAD http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900



Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes https://www.youtube.com/watch?v=Ktk263q-W-4



Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística. Universidad Santo Tomás, 2013