KERLY OSPINA ESTADISTICA2

CORPORACION UNIVERSITARIA IBEROAMERICANA KERLY TATIANA OSPINA PINILLA PRECENTADO A LIC: JUAN SERGIO SALAMANCA GODOY

Views 82 Downloads 4 File size 811KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

CORPORACION UNIVERSITARIA IBEROAMERICANA

KERLY TATIANA OSPINA PINILLA

PRECENTADO A LIC:

JUAN SERGIO SALAMANCA GODOY

FACULTAD DE CIENCIAS HUMANAS Y SOCIALES PROGRAMA - PSICOLOGIA 2019

Actividad 7 - Relaciones entre parejas de datos 1. Un equipo se encargó de analizar la causa de los frecuentes errores en las facturas diligenciadas por una clínica. El número de datos variaban según el tipo de factura. Un miembro del equipo propuso concentrarse en simplificar las facturas más complicadas, seguramente causa de la mayoría de errores. El equipo decidió investigar en primer lugar la teoría, aparentemente obvia, según la cual el número de errores en una factura dependía de la cantidad de datos a incluir en la misma. Los datos recogidos fueron. x

y 8 15 15 12 10 25 20 17 18 23 27 8 18 20 18 15 26 20 10 10 9 13 20 23 20 13 24 13 13 23 15 22 24 19 12 27 24 10 12 17 688

xy 3 2 5 4 7 2 3 9 3 4 1 0 6 1 0 7 1 5 2 3 5 3 9 10 12 12 8 9 0 0 1 6 6 9 8 6 12 1 2 4 191

X² 24 30 75 48 70 50 60 153 54 92 27 0 108 20 0 105 26 100 20 30 45 39 180 230 240 156 192 117 0 0 15 132 144 171 96 162 288 10 24 68 3401

Y² 64 225 225 144 100 625 400 289 324 529 729 64 324 400 324 225 676 400 100 100 81 169 400 529 400 169 576 169 169 529 225 484 576 361 144 729 576 100 144 289 13086

9 4 25 16 49 4 9 81 9 16 1 0 36 1 0 49 1 25 4 9 25 9 81 100 144 144 64 81 0 0 1 36 36 81 64 36 144 1 4 16 1415

¿El diagrama de dispersión confirma la teoría “de la existencia de la relación entre el número de datos a incluir en la factura y la cantidad de errores en la misma?.

Respuesta:

numero de errores

Datos recogidos 14 12 10 8 6 4 2 0

Columna B Lineal (Columna B)

5

10

15

20

25

30

Numero de datos

f(x) = 0,09x + 3,18

r=

n( ∑ xy)−(∑ x )(∑ y)

√ n(∑ x )−(∑ x ) ∗ √ n(∑ y )−(∑ y ) 2

r=

r=

2

2

2

4632 √50096∗ √20119 4632 31747,14

r=0,14

Según lo mostrado en la tabla el coeficiente de correlación es muy bajo, dado que se encuentra entre 0 y 0,20, gracias a esto podemos concluir que el diagrama de dispersión no confirma la teoría.

2. Teniendo en cuenta los datos arrojados anteriormente, se tomó la decisión de hacer una estratificación de los datos por empleada (una tenía mucho más experiencia que la otra) mostró que efectivamente no existía la correlación buscada pero si una clara diferencia entre el número de errores de las dos. a. ¿qué puede concluir después de realizar los respectivos diagramas de dispersión? b. ¿Qué estrategia utilizaría para minimizar los errores en la factura?

X

Y

X₂

15 25 20 18 23 27 8 20 18 2 10 10 13 13 23 15 10 12 17 299

Y₂

2 2 3 3 4 1 0 1 0 1 2 3 3 0 0 1 1 2 4 33

8 15 12 10 17 18 15 20 9 20 23 20 13 24 13 22 24 19 12 27 24 365

3 5 4 7 9 6 7 5 5 9 10 12 12 8 9 6 6 9 8 6 12 158

Respuesta:

numero de errores wen la factura

Facturas rellenadas por carmen 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0

Columna C

0

5

10

15

20

Numero de datos en la factura

25

30

Numero de los errores en la factura

Facturas rellenadas por maría 14 12 10 8

Columna F

6 4 2 0 5

10

15

20

25

30

Numero de datos en la factura

a. Podemos concluir que la empleada María tiene menos dispersión, en otras palabras están más relacionados los errores con los datos de la factura. b. Como lo muestran las tablas y el gráfico de dispersión, para disminuir los errores hay que facturar menos datos.

3. La tabla siguiente el mejoramiento (en la velocidad de la lectura) de ocho estudiantes que cursan un programa de lectura de velocidad y el número de semanas que siguieron el programa:

x

y 3 5 2 8 6 9 3 4 40

xy 86 118 49 193 164 232 73 109 1024

X² 258 590 98 1544 984 2088 219 436 6217

Y² 9 25 4 64 36 81 9 16 244

7396 13924 2401 37249 26896 53824 5329 11881 158900

a. Ilustre los ocho puntos de los datos para verificar si es razonable que la relación entre el mejoramiento de lectura promedio y el tiempo lineal. b. Encuentre la ecuación de la línea de mínimos cuadrados que nos permitirá pronosticar el

Mejoramiento de velocidad a partir del número de semanas que un estudiante ha seguido el programa. c. Use los resultados de la parte (b) para pronosticar el mejoramiento de velocidad de un estudiante después de que ha conseguido el programa durante siete semanas. Respuesta:

Me jo ra m ie n to d e la le ctu ra (p a la b ra s p o r m

a.

b. a=

n (∑ xy)−∑ x ∑ y n( ∑ x2)−(∑ x)

2

8 (6217)−(40)(1024) a= 8 (244)−(40)2 a=

49736−40960 1952−1600

b=

∑ y−a( ∑ x ) n

1024−24,9318181818 (40) b= 8 1024−997,2727273 b= 8

8776 a= 352

26,7272727 b= 8

a=24,9318181818

b=3,3409090

Ecuación desalineado minimoscuadrados f (x)=24,9318181818 x +3,3409090 C. f (7)=24,9318181818(7)+3,3409090 f (7)=177,86 El mejoramiento en 7 semanas de un estudiante es de 177,86 palabras por minutos.

4. Una sociología que estudia la relación entre el tamaño de la familia y las cuentas por alimentos selecciono al azar a seis clientas de un supermercado. A cada clienta seleccionada se le preguntaba cuántos hijos menores de 18 años de edad vivían con ella y también el número de cuartos de leche que en promedio se consumía por semana en su hogar. Estos son los datos resultantes de esta encuesta:

x

y

xy

2 2 2 2 2 2



14 20 9 25 16 14

28 40 18 50 32 28

Y² 4 4 4 4 4 4

196 400 81 625 256 196

Respuesta:

30 f(x) = - 2,57E+15x + 5,15E+15 Consumo semanal de leche

25

20 15

Columna C Lineal (Columna C) Lineal (Columna C)

10 5 0 1,5

2

2,5

3

3,5

4

Número de hijos menores de 18 años

a. La socióloga encontró el problema de no poder encontrar el valor del consumo por cada número de hijos menores de 18 años puesto que el valor del coeficiente (a) es infinito, además la recta es vertical.

5. Los siguientes son números de los minutos que 12 mecánicos requirieron para ensamblar una maquina en la mañana, x, y en la tarde, y.

x

y

xy





12 11 9 13 10 11 12 14 10 9 11 12 134

14 11 14 11 12 15 12 13 16 10 10 14 152

168 121 126 143 120 165 144 182 160 90 110 168 1697

144 121 81 169 100 121 144 196 100 81 121 144 1522

a. calcular r Respuesta: r=

n( ∑ xy)−(∑ x )(∑ y)

√ n(∑ x )−(∑ x ) ∗ √ n(∑ y )−(∑ y ) 2

r=

r=

2

2

2

12(1697)−(134)(152)

√12(1522)−(134)2∗ √12(1968)−(152)2 20364−20368 √18264−17956∗ √23616−23104

196 121 196 121 144 225 144 169 256 100 100 196 1968

r=

−4 √(308)∗ √(512)

r=

−4 √157696

r=

−4 397,1095567

r=−0.010072787

6. Si calculamos r para uno de los siguientes conjuntos de datos, ¿debería sorprendernos obtener r=1 y r=-1 Explique su respuesta.

x

a.

y

xy

12 8 20

r=

r=

60 120 180

Y² 144 64 208

25 225 250

n( ∑ xy)−(∑ x )(∑ y)

√ n(∑ x )−(∑ x ) ∗ √ n(∑ y )−(∑ y ) 2

2

r=



5 15 20

2

2

2( 180)−(20)(20)

√2(208)−(20)2∗ √2(250)−(20)2 −40 √( 416−400)∗ √(500−400)

r= −40 4∗ 10 r=−1 Si debería sorprendernos obtener 1 ya que el cálculo del coeficiente de variación es -1

b.

x

y 6 4 10

xy 9 11 20

X² 54 44 98

Y² 36 16 52

81 121 202

n( ∑ xy)−(∑ x )(∑ y)

r=

√ n(∑ x )−(∑ x ) ∗ √ n(∑ y )−(∑ y ) 2

2

2

2(98)−(10)(20)

r=

r=

2

√2(52)−(10)2∗ √2( 202)−(20)2 −4 √(4)∗ √( 4)

−4 4 r=−1 r=

No debería sorprendernos obtener -1 ya que el cálculo del coeficiente de variación es efectivamente -1 como lo muestra el cálculo anterior.

6. Respuestas: A: no hay correlación b: no hay correlación c: correlación positiva d: no hay correlación e: correlación negativa

7. Respuestas: A: no hay correlación b: correlación positiva c: no hay correlación d: no hay correlación e: correlación negativa