Taller: I. Varianza (V o

INSTITUCIÓN UNIVERSITARIA COLEGIO MAYOR DEL CAUCA Facultad de Ciencias Sociales y de la Administración Programa de Tecno

Views 60 Downloads 1 File size 203KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

INSTITUCIÓN UNIVERSITARIA COLEGIO MAYOR DEL CAUCA Facultad de Ciencias Sociales y de la Administración Programa de Tecnología en Gestión Empresarial Tecnología en Gestión Financiera Tecnología en Gestión Comercial y de Mercados Tecnología en Gestión Empresarial Estadística Descriptiva

TALLER Medidas de Dispersión

I.

Varianza (V o

s2)

Propiedades de la varianza

s2 >0.

a.

La varianza debe ser siempre un valor positivo.

b.

La varianza de una constante es igual a cero.

c.

La varianza de una variable más una constante es igual a la varianza de la variable.

V [ k ] =s2k =0.

V [ x+k ] =s 2x +k =V [ k ] =s2k . d.

La varianza de una constante por una variable, es igual al producto de la constante al 2

cuadrado por la varianza de la variable.V [ kx] =skx =k e.

2

V [ x ] =k 2 s 2x .

Para el cálculo de la varianza de una muestra, que se encuentra dividida en dos submuestras, se aplica la siguiente fórmula: 2 2 x 1 n1 + x 2 n2 s21 n1 +s 22 n 2 ( x 1−x ) n 1+ ( x 2− x ) n2 donde x= s= + n n n 2

La varianza se expresa en unidades diferentes a las originales. Por ejemplo, si la variable se refiere a peso en kilogramos, al calcular la varianza las unidades estarán dadas en kilogramos al cuadrado. II.

Desviación típica ( s) La desviación típica es la raíz cuadrada de la varianza, considerada siempre con signo positivo.

s=+ √ s 2>0 Una de las razones por la cual se utiliza la desviación típica consiste en que las unidades son las mismas que las unidades de la variable. Al igual que la varianza, permite la comparación de dos o más distribuciones, cuando están dadas en las mismas unidades de medida, con el fin de determinar cuál de ellas presenta un mayor o menor grado de variabilidad absoluta.

Profesor: Víctor Alberto Puliche

1

III. Coeficiente de variación (CV) En ocasiones nos interesa comparar la variabilidad relativa de dos series de datos. Para ello se utiliza el coeficiente de variación, que se obtiene dividiendo la desviación típica por su media aritmética, expresándose el resultado en términos porcentuales.

s CV = ∗100 % (Para datos no agrupados). x s CV = ∗100 % (Para datos agrupados). y Este coeficiente de variación se emplea cuando se desea comparar dos o más distribuciones cuyas unidades generalmente son diferentes, y por cuanto, en estos casos, no se podrán comparar las varianzas o las desviaciones típicas. IV.

Puntaje típico o estandarizado ( Zi ) Este estadígrafo de dispersión mide la desviación de una observación con respecto a la media aritmética en unidades de desviación típica, determinando la posición relativa de una observación dada dentro del conjunto. La fórmula utilizada en el cálculo es:

Zi =

x i−x . s

Este puntaje típico se emplea para comparar dos o más datos individuales, aunque pertenezcan a distribuciones diferentes, pudiendo suceder que tengan medias y varianzas que no coincidan. Considerándose como la mejor posición relativa el valor de

Zi que es

mayor. V.

Desviación media ( D a ) Esta medida de dispersión se define como la media aritmética de las desviaciones respecto a la media, tomadas en valor absoluto. n

∑|x i− x| Da =

1

(Para datos no agrupados).

n

Profesor: Víctor Alberto Puliche

2

m

∑| y i− y|ni 1

Da =

(Para datos agrupados).

n

El valor de la desviación media siempre será menor que la desviación típica o estándar.

Da < s En la distribución simétrica, desviación media corresponde al 79,79% de la desviación típica:

D a =0,7979 s Se le considera como una de las medidas de dispersión más fáciles de calcular, siendo utilizada, en la mayoría de los casos, con el fin de agilizar las operaciones, de ahí que su resultado se le considere una aproximación a la cuantificación de la dispersión. VI.

Coeficiente de desviación media (CD a) Esta medida de dispersión es muy parecida en su presentación y cálculo al coeficiente de variación, con la diferencia de considerar a la desviación media ( Da ) en lugar de la desviación típica ( s). Se expresa también en términos porcentuales.

C Da =

Da ∗100 % (Para datos no agrupados). x

C Da =

Da ∗100 % (Para datos agrupados). y

VII. Desviación mediana ( D e ) Esta medida de dispersión se define como la media aritmética de las desviaciones en valor absoluto con respecto a la mediana. n

∑ |x i−M e| De =

1

(Para datos no agrupados).

n m

∑ |y i−M e|ni De =

1

(Para datos agrupados).

n

Es una medida de dispersión poco utilizada y su mayor uso corresponde a aquellas distribuciones cuyos valores extremos no están definidos, o cuando el promedio está afectado por valores grandes que toma la variable, haciéndose necesario calcular la mediana. El valor de la desviación mediana en algunos casos puede ser menor o igual a desviación media, la que a su vez es siempre menor que la desviación típica.

Profesor: Víctor Alberto Puliche

3

De ≤ Da < s VIII.Coeficiente de desviación mediana (CD e) De igual manera, esta medida de dispersión es muy parecida en su presentación y cálculo al coeficiente de variación y al coeficiente de desviación media, con la diferencia de que se considera la desviación mediana ( D e ) y la mediana. Se expresa también en términos porcentuales.

C De =

De ∗100 % (Para datos no agrupados y datos agrupados). Me n

∑ |xi −M e| CD e =

1

(Para datos no agrupados).

n Me m

∑ | y i−M e| ni CD e =

IX.

1

(Para datos agrupados).

n Me

Ejercicios resueltos 1.

De una distribución unidimensional se sabe, que la media aritmética es igual a 10,3 y que la media cuadrática es igual a

√ 118. Se pide que calcule la varianza y la desviación

típica de dicha distribución. Solución:

x=10,3 y

M 2=

n

s2x =

∑ x 2i 1

n



2

n

n

∑x i =1

2 i

∑ x 2i

=√ 118 ⇒ i=1 =118 n n 2

−( x ) =118−( 10,3 ) =11,91 ⇒ s2x =11,91

⇒ s x =3,451 2.

En la sección financiera de un diario se publicó recientemente la distribución unidimensional de variable discreta de la tabla adjunta, y se decía en el texto del artículo, que la media aritmética era igual a 120 y la varianza igual a 25.

Profesor: Víctor Alberto Puliche

4

Desgraciadamente la publicación apareció con dos manchas de tinta caídas en la columna de la frecuencia absoluta, lo cual impidió comprobar directamente lo que en el artículo se decía. Sin embargo, se le pregunta ahora a usted, ¿pueden aceptarse dichos valores de la media y la varianza, teniendo en cuenta lo que puede verse en la tabla? Justifique su respuesta.

yi 105 110 115 120 125 130 135 140



ni 37 90 95 85 60

400

Solución: Consideremos dos submuestras: La primera contiene los siguientes datos: tamaño

y 1= {110 ,115 ,120 , 125 ,130 } con

n1 =37+90+ 95+85+60=367

La segunda contiene los siguientes datos:

y 2= {105 , 135 ,140 } con tamaño

n2 =400−367=33 La media de la primera submuestra se puede determinar de la siguiente manera: y 1=

110∗37+115∗90+ 120∗95+ 125∗85+ 130∗60 44245 = 37+90+ 95+85+60 367

La media total de total la muestra debe cumplir que:

y=

y 1 n1 + y 2 n 2 44245 =120,55 , donde y=120 , n1 =367, n2 =33, n=400 , y 1= 367 n

44245 367+ y 2 33 44245+ y 2 33 367 Por lo tanto, 120= = 400 400 120∗400=44245+33 y 2 y 2=

48000−44245 =113,79 33

Como se pudo determinar un valor para

y 2, significa que la media de 120 si

puede ser un valor posible.

Profesor: Víctor Alberto Puliche

5

Por otro lado, a partir de la varianza total igual a 25 se tiene que: m

s2y =

m

∑ z 2i ni 1

∑ z 2i ni ⇒ 25=

n

1

400

m

⇒ ∑ z 2i ni=1000 1

Pero, a partir de la siguiente tabla,

yi

ni

110 115 120 125 130

37 90 95 85 60



400

Zi = y i − y

Z2i ni

-10 -5 0 5 10

3700 2250 0 2125 6000 14075

se concluye que: 10000 s B se concluye que en el segundo periodo hubo mayor estabilidad,

debido a una menor variación absoluta.

Profesor: Víctor Alberto Puliche

13

17. Para la media y la varianza de un conjunto dado se han hallado, respectivamente, los valores 4 y 25. ¿Qué opinión le merece la media aritmética? Solución:

sx 5 CV = ∗100 %= ∗100 %=125 % x 4 Esta

media

aritmética

no

es

lo

suficientemente

representativa

de

la

distribución, debido a la variabilidad tan alta. 18. Un grupo de profesionales, que trabajan en un sector de la actividad industrial en un país, tienen un salario promedio de $968000 y varianza de $144’000000. Otro grupo de empleados profesionales que trabajan en un país diferente, en una actividad similar, tienen un salario promedio de Bls 85700 y una desviación típica de Bls 800. Determine cuál grupo de salarios presenta una menor variabilidad. Solución:

C V A=

sA 144 ' 000000 ∗100 %= √ ∗100 %=1,24 % xA 968000

C V B=

sB 800 ∗100 %= ∗100 %=0,93 % xA 85700

En conclusión, se puede decir que los salarios para el grupo de empleados profesionales del segundo país presentan una menor variabilidad relativa. 19. Un obrero realiza tres operaciones dentro del trabajo. La primera la realiza en 72 minutos, la segunda en 85 y la tercera en 52 minutos. Se sabe que el promedio de duración

para

la

realización

de

cada

operación

es:

85,

90

y

58

minutos,

respectivamente. Además, sus desviaciones estándar fueron: 7, 3 y 7 en esos promedios. Ordene las operaciones realizadas por el obrero, de acuerdo a su mayor capacidad para la ejecución. Solución: Operación A:

x 1=72 minutos, x A=85 minutos y s A =7 minutos.

Operación B:

x 2=85 minutos, x B =90 minutos y s B=3 minutos.

Operación C:

x 3=52 minutos, x C =58 minutos y sC =7 minutos.

Tomemos el puntaje típico o estandarizado para cada

Zi =

x i, mediante la fórmula:

x i−x s

Profesor: Víctor Alberto Puliche

14

Para

x 1=72 minutos, se tiene que Z1 =

72−85 =−1,86 7

Para

x 2=85 minutos, se tiene que Z2 =

85−90 =−1,67 3

Para

x 3=52 minutos, se tiene que Z3 =

52−58 =−0,86 7

Como

−1,86←1,67←0,86 se concluye que el obrero obtuvo una mejor

posición relativa en la operación C, luego en la B y por último en A. 20. Un conjunto de 15 valores tiene una media igual a 62; otro conjunto de 35 valores tiene una media igual a 84; la desviación estándar de los 50 valores considerados conjuntamente es igual a 22. Calcule el coeficiente de variación del conjunto de los 50 números. Solución:

x=

x 1 n1 + x 2 n2 62 ( 15 ) +84 ( 35 ) = =77,4 n 50

Luego,

x=77,4

sx 22 CV = ∗100 %= ∗100 %=28,424 % x 77,4 21. En un examen final de estadística la puntuación media de un grupo de 150 estudiantes fue de 3,8 y la varianza 6,4. En análisis numérico, sin embargo, la media final del grupo fue de 3,1 y la desviación típica 2,1. a.

Determine en que asignatura hubo mayor dispersión absoluta.

b.

Determine en que asignatura hubo mayor dispersión relativa.

c.

Si el estudiante consiguió 3,9 en estadística y 4,1 en análisis numérico ¿En qué asignatura fue su puntuación superior?

Solución: a.

s1= √ 6,4=2,53 y

s2=2,1 . Como s1 > s2, en estadística hubo una mayor

dispersión absoluta. b.

C V 1=

s1 2,53 ∗100 %= ∗100 %=66,579% x1 3,8

C V 2=

s2 2,1 ∗100 %= ∗100 %=67,741 % x2 3,1

Como

C V 2 >C V 1 , en análisis numérico hubo una mayor dispersión relativa.

Profesor: Víctor Alberto Puliche

15

c.

Tomemos el puntaje típico o estandarizado para cada nota, mediante la fórmula:

Zi =

x i−x . s Z1 =

Para la nota de 3,9 en estadística se tiene que:

3,9−3,8 =0,04 . 2,53

Para la nota de 4,1 en análisis numérico se tiene que:

Z2 =

4,1−3,1 =0,476 . 2,1

Su puntuación relativa fue superior en análisis numerico. 22. Reconstruya y calcule el coeficiente de variación de la siguiente distribución simétrica. (Para el cálculo de la media y la varianza hacerlo mediante

yi

ni

Hi

6

7

0,175

14

-

0,4

22

-

-

30

-

-

38

-

-

z 'i)

Solución: Recordemos que una distribución es simétrica cuando,

h1 =hm, h2 =hm−1,

h3 =hm−2, …. La tabla reconstruida es la siguiente:

yi

ni

Hi

hi

z 'i

z 'i n i

6

7

0,175

0,175

-16

-112

1792

14

9

0,4

0,225

-8

-72

576

22

8

0,6

0,2

0

0

0

30

9

0,825

0,225

8

72

576

38

7

1

0,175

16

112

1792



40

0

4736

Como

hi =

1,000

2

( z 'i )

ni

n1 n1 n1 ni 7 = ⇒n=40. se tiene que h1 = ⇒n= = n h1 H 1 0.175 n

Profesor: Víctor Alberto Puliche

16

Como ,

h2 =H 2−h1 ⇒ h2=0,4−0,175=0,225 .

Por el hecho de que la distribución es simétrica se tiene que:

h5 =h1=0,175 y

h 4=h 2=0,225. Además, h3 =1−h1 −h2−h 4−h5=0,2. Para determinar los valores de la frecuencia absoluta hacemos uso de la

ni =hi n,

expresión

de

ahí

n5 =n1=h 1 n=0,175∗40=7,

que:

n 4=n 2=h2 n=0,225∗40=9 y n3 =h3 n=0,2∗40=8 Para el cálculo de la desviación mediante

z 'i utilizamos un O t =22, como se

observa en la tabla. m

A partir de la fórmula:

es:

sy=



m

m

∑ z '2i ni 1

n

s2y =

1

n

1

n



2

( ) 1

el valor de la desviación típica

n

2

( )√ ∑ z'i ni



m

∑ z 'i2 ni ∑ z 'i n i

=

4736 0 2 4736 − = =10,881 40 40 40

( )



Para el cálculo de la mediana utilizamos la expresión:

z 'i ni ∑ y=O + t

n

es decir,

z 'i ni ∑ y=O + =22+0=22 t

n

Por lo tanto,

CV =

sy 10,881 ∗100 %= ∗100 %=49,46 % y 22

23. Halle el coeficiente de variación de dos números cuya media aritmética es 26 y la media geométrica es 24. Solución:

x=

x 1+ x 2 x1 + x 2 ⇒26= ⇒52=x 1 + x 2 ⇒ x 1=52−x2 2 2

M g =√ x 1 x2 ⇒24=√ x1 x 2 ⇒ 576=x 1 x 2 ⇒576=( 52−x2 ) x 2 Profesor: Víctor Alberto Puliche

17

⇒ 576=52 x 2−x 22 ⇒ x 22−52 x 2 +576=0 Resolvemos esta última ecuación mediante la fórmula cuadrática, así: 2

x 2=

−(−52 ) ± √ (−52 ) −4 ( 1 )( 576 ) 52± √ 400 52 ±20 = = 2 2 2 ( 1)

x 2=

52+ 20 72 = =36 ⇒ x 1=52−x2 =52−36=16, 0 2 2

x 2=

52−20 32 = =16 ⇒ x 1=52−x 2=52−16=36 2 2

Por lo tanto, los dos números son: 16 y 36. n

Luego,

∑ x 2i

162 +362 2 s= −( x ) = −( 26 ) =100 ⇒ s x =√ 100=10 n 2 2 x

1

2

De ahí que:

sx 10 CV = ∗100 %= ∗100 %=38,462 % x 26 24. Se tienen los siguientes datos correspondientes a dos submuestras:

x 1=250

n1 =60

s21=49

x 2=230

n2 =20

s2=5

Calcule el coeficiente de variación para el conjunto. Solución:

x=

x 1 n1 + x 2 n2 250 ( 60 ) +230 ( 20 ) = =245 n 60+20

Luego,

x=245

2 2 s 21 n1 + s22 n2 ( x 1−x ) n1 + ( x 2−x ) n2 s= + n n 2 x

49 ( 60 ) +52 (20 ) ( 250−245 )2 60+ ( 230−245 )2 20 s= + =118 80 80 2 x

De ahí que,

s x =√ 118=10,863

Luego,

sx 10,863 CV = ∗100 %= ∗100 %=4,434 % x 245 Profesor: Víctor Alberto Puliche

18

25. Las notas de 100 alumnos se clasifican en una tabla de frecuencias con cuatro intervalos de igual magnitud. Se pide que calcule el coeficiente de variación, sabiendo que:

y 2=30 , n1 =10,

N 2=40, n3 =35,

y=48,75.

Solución: La tabla con los datos planteados es la siguiente:

yi

ni

Ni

10 30

40 35

∑ Los valores restantes los determinamos de la siguiente manera:

N i=n1=10, n2 =N 2−n1=40−10=30, N 3=N 2+ n3=40+ 35=75 , N 4 =n=10, n 4=N 4−N 3=100−75=25 Con los datos encontrados la tabla quedaría de la siguiente forma,

yi 30



ni

Ni

10

10

30

40

35

75

25

100

100

Para determinar los valores de

y i calculamos los valores de z ''i , con un Ot =30,

aplicando el principio de que las marcas de clase se encuentran ubicadas en los puntos medio de cuatro intervalos de igual amplitud, por lo que la diferencia entre cada

' z ''i es de 1, es decir: z 'i' −z 'i−1 =1. En seguida ubicamos los datos

ponderados de la media para

yi

z ''i . Los resultados obtenidos los reemplazamos en la fórmula de

z ''i y despejamos C . Es decir,

ni

Profesor: Víctor Alberto Puliche

Ni

z ''i

z 'i' ni 19

30



10

10

-1

-10

30

40

0

0

35

75

1

35

25

100

2

50 75

100

z'i ' ni ∑ y=O +C ⇒ 48,75=30+C t

n

Luego,

( 48,75−30 )∗100 75 ⇒C= =25 100 75

y 1= y 2−C=30−25=5, y 3= y 2 +C=30+25=55 y y 4 = y 3 +C=55+25=80

. Por lo tanto, la tabla completa queda de la siguiente manera:

yi

ni

Ni

z ''i

z 'i' ni

2

( z 'i ' )

ni

5

10

10

-1

-10

10

30

30

40

0

0

0

55

35

75

1

35

35

80

25

100

2

50

100



100

75

145

El valor de la desviación típica la determinamos mediante la fórmula:

m

2 y

s =C

2

m

2

{ ( )} ∑z

' '2 i

ni

1



n

Por lo tanto,

∑z

CV =

1

n

'' i

ni



145 75 ⇒ s y = 25 − 100 100 2

2

( ( ))

=

5 √ 355=23,552 4

sy 23,552 ∗100 %= ∗100 %=48,311 % y 48,75

26. En una muestra de 45 estudiantes que terminaron un diplomado de Seguridad de la Información en el año pasado se obtuvieron las siguientes respuestas. Para facilitar el procesamiento de las respuestas del cuestionario en computadora se usó una escala numérica en la que 1=mala, 2=regular, 3=buena, 4= muy buena y 5= excelente. 5, 3, 4, 4, 5, 2, 1, 5, 4, 4, 5, 4, 3, 3, 4, 5, 2, 1, 2, 3, 3, 4, 5, 5, 4, 5, 3, 3, 4, 4, 5, 5, 2, 5, 3, 4, 5, 4, 5, 3, 4, 4, 4, 3, 2. Con los datos anteriores elabore una tabla de frecuencias y determine: a.

La varianza y desviación típica en función de

x i.

b.

La varianza y desviación típica en función de

z i (Datos no agrupados).

Profesor: Víctor Alberto Puliche

20

c.

La varianza y desviación típica en función de

y i.

d.

La varianza y desviación típica en función de

z i (Datos agrupados).

e.

La varianza y desviación típica en función de

z 'i (Datos agrupados).

f.

El coeficiente de variación para datos agrupados y no agrupados.

g.

La desviación media para datos agrupados y no agrupados.

h.

El coeficiente de desviación media para datos agrupados y no agrupados.

i.

La desviación mediana para datos agrupados y no agrupados.

j.

El coeficiente de desviación mediana para datos agrupados y no agrupados.

Solución: n

a.

∑ xi 1

x=

=

n

5+3+ 4+ 4+ …+4 +3+2 167 = =3,711 45 45

n

∑ xi2 1

52 +32 +4 2 +4 2+ …+ 42 +32 +22 677 = = =15,044 n 45 45 n

Por lo tanto,

s2x =

∑ x 2i 1

n

2

−( x ) =

y s x =√ 1,272=1,128 677 167 2 − =1,272 45 45

( )

n

b.

∑ z 2i

y s x =√ 1,272=1,128 ( 5−3,711 )2+ …+ ( 2−3,711 )2 57,244 s= = = =1,272 n 45 45 2 x

1

c.

yi

ni

y i ni

y 2i ni

1 2 3 4 5

2 5 10 15 13 45

2 10 30 60 65 167

2 20 90 240 325 677

∑ m

∑ y i ni y=

1

n

=

167 =3,711 45

m 2 y

s=

∑ y i ni 1

n

2

−( y ) =

y s y = √ 1,272=1,128 677 167 2 − =1,272 45 45

( )

d.

Profesor: Víctor Alberto Puliche

21

yi

ni

z i = y i− y

z 2i n i

1 2 3 4 5

2 5 10 15 13 45

-2,71111111 -1,71111111 -0,71111111 0,28888889 1,28888889

14,7002469 14,6395062 5,05679012 1,25185185 21,5960494 57,2444444



m

Por lo tanto,

s2y =

∑ z 2i ni 1

=

n

y s y = √ 1,272=1,128 57,244 =1,272 45

e.

yi

ni

y i ni

1 2 3 4 5

2 5 10 15 13 45

2 10 30 60 65 167

∑ m

s2y = f.

1



n

-2 -1 0 1 2

1

n

z 'i n i -4 -5 0 15 26 32

2

( z 'i )

ni

8 5 0 15 52 80

2

( )

∑ z 'i2 ni ∑ z 'i n i

=

y s y = √ 1,272=1,128 80 32 2 − =1,272 45 45

( )

sx 1,128 CV x = ∗100 %= ∗100 %=34,278 % x 3,711 CV y =

g.

m

O t =3 z = y i−Ot ' i

sy 1,128 ∗100 %= ∗100 %=34,278 % y 3,711

Para datos no agrupados la desviación media es la siguiente: n

∑ |x i−x| Dax =

1

n

=

|5−3,711|+|3−3,711|+…+|2−3,711| 42,178 45

=

45

=0,937

Para la desviación media de datos agrupados utilizamos la siguiente tabla:

yi

ni

|z i|=| y i− y|

|z i|ni

1 2 3 4 5

2 5 10 15 13 45

2,71111111 1,71111111 0,71111111 0,28888889 1,28888889

5,42222222 8,55555556 7,11111111 4,33333333 16,7555556 42,1777778



Profesor: Víctor Alberto Puliche

22

m

Luego,

h.

i.

∑ |y i− y|n i D ax =

1

=

n

. 42,178 =0,937 45

C D ax =

D ax 0,937 ∗100 %= ∗100 %=25,256 % x 3,711

C D ay =

D ay 0,937 ∗100 %= ∗100 %=25,256 % y 3,711

Para determinar el valor de la mediana para datos no agrupados, ordenamos los datos de menor a mayor de la siguiente manera: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5. Como el número de datos es impar la mediana se ubica en la posición:

n+1 45+1 = =23. Es decir, la mediana se encuentra ubicada en la posición 2 2 23, y su valor es

M ex =4. n

De ahí que,

∑|x i−M e| D ex =

1

=

n

. |5−4|+|3−4|+…+|2−4| 39 = =0,867

45

45

Para el cálculo de la desviación mediana para datos agrupados utilizamos la siguiente tabla:

yi

ni

Ni

| y i−M e|

| y i−M e|ni

1 2 3 4 5

2 5 10 15 13 45

2 7 17 32 45

3 2 1 0 1

6 10 10 0 13 39



Para determinar la mediana primero dividimos

n entre 2. En este caso,

n 45 = =22,5. Como este valor no se encuentra en la frecuencia absoluta 2 2 acumulada y el valor inmediatamente inferior a éste es 17, asignamos a

N i−1=17 . De lo cual se deduce que y i=4 y M ey = y i =4 . m

Por lo tanto,

Profesor: Víctor Alberto Puliche

∑| y i−M e|n i D ey =

1

n

=

. 39 =0,867 45

23

j.

C De =

De 0,867 ∗100 %= ∗100 %=21,675 % Me 4

27. En una aerolínea en particular se aceptan reservaciones telefónicas para vuelos. Los valores que aparecen a continuación indican las duraciones de las llamadas, en minutos, de una muestra de 25 reservaciones telefónicas: 2.3, 4.8, 5.5, 10.1, 3.2, 3.4, 5.3, 3.3, 2.4, 4.8, 2.6, 4.5, 3.9, 6.6, 7.5, 5.9, 8.1, 9.3, 5.6, 6.0, 10.1, 7.2, 4.8, 5.1, 5.7. Con los datos anteriores elabore una tabla de frecuencias y determine: a.

La varianza y desviación típica en función de

x i.

b.

La varianza y desviación típica en función de

z i (Datos no agrupados).

c.

La varianza y desviación típica en función de

y i.

d.

La varianza y desviación típica en función de

z i (Datos agrupados).

e.

La varianza y desviación típica en función de

z 'i (Datos agrupados).

f.

La varianza y desviación típica en función de

z ''i (Datos agrupados).

g.

El coeficiente de variación para datos agrupados y no agrupados.

h.

La desviación media para datos agrupados y no agrupados.

i.

El coeficiente de desviación media para datos agrupados y no agrupados.

j.

La desviación mediana para datos agrupados y no agrupados.

k.

El coeficiente de desviación mediana para datos agrupados y no agrupados.

Solución: n

a.

∑ xi x=

1

n

=

2.3+ 4.8+5.5+…+5,1+5,7 138 = =5,52 25 25

n

∑ xi2 1

n

=

2,32 +4,8 2+5,5 2+10,12 +…+ 4,82 +5,12+ 5,72 881,86 = =35,2744 25 25 n

Luego,

s2x =

∑ x 2i 1

n

2

−( x ) =

y s x =√ 4,804=2,192 881,86 138 2 − =4,804 25 25

( )

n

b. c.

s2x =

∑ z 2i 1

n

=

y s x =√ 4,804=2,192 ( 2,3−5,532 )2 +…+ ( 5,7−5,532 )2 =4,804 25

Para construir la tabla de distribución de frecuencias, se deben de seguir los siguientes pasos:

Profesor: Víctor Alberto Puliche

24

c.1. Rango(R):

x máx =10,1, x mín =2,3 ⇒ R=x máx −x mín =10,1−2,3=7,8 c.2. Número de intervalos(m): Aplicamos la regla de Sturges:

m=1+3,3 log ( n ) =1+ 3,3 log ( 25 )=5,613 ⇒m=6 c.3. Amplitud (C):

R 7,8 C= = =1,3 m 6 Con los resultados anteriores, la tabla queda de la siguiente forma:

y 'i−1− y 'i

yi

ni

y i ni

y 2i ni

2,3 - 3,6 3,6 - 4,9 4,9 - 6,2 6,2 - 7,5 7,5 - 8,8 8,8 - 10,1

2,95 4,25 5,55 6,85 8,15 9,45

6 5 7 2 2 3 25

17,7 21,25 38,85 13,7 16,3 28,35 136,15

52,215 90,3125 215,6175 93,845 132,845 267,9075 852,7425

∑ m

∑ y i ni 1

y=

n

=

136,15 =5,446 25

m 2 y

∑ y i ni

s=

1

n

2

−( y ) =

y s y = √ 4,451=2,11 852,7425 136,15 2 − =4,451 25 25

(

)

d.

y 'i−1− y 'i

yi

ni

2,3 - 3,6

2,9

6

3,6 - 4,9

5 4,2

5

4,9 - 6,2

5 5,5

7

6,2 - 7,5

5 6,8

2

7,5 - 8,8

5 8,1

2

8,8 - 10,1

5 9,4

3

5

∑ Profesor: Víctor Alberto Puliche

25

y i ni

z i= y i− y

z 2i n i

17,7

-2,496

37,380096

21,25

-1,196

7,15208

38,85

0,104

0,075712

13,7

1,404

3,942432

16,3

2,704

14,623232

28,35 136,15

4,004

48,096048 111,2696

25

m

Por lo tanto,

s2y =

∑ z 2i ni 1

=

n

y s y = √ 4,451=2,11 111,2696 =4,451 25

e.

y

' i−1

−y

yi

ni

2,95 4,25 5,55 6,85 8,15 9,45

6 5 7 2 2 3 25

' i

2,3 - 3,6 3,6 - 4,9 4,9 - 6,2 6,2 - 7,5 7,5 - 8,8 8,8 - 10,1

∑ m

2 y

m

∑ z 'i2 ni

s=

1



n

-3,9 -2,6 -1,3 0 1,3 2,6

z 'i n i

2

( z 'i )

-23,4 -13 -9,1 0 2,6 7,8 -35,1

ni

91,26 33,8 11,83 0 3,38 20,28 160,55

2

( ) ∑ z 'i n i

Ot =6,85 z 'i= y i−O t

1

n

y s y = √ 4,451=2,11 160,55 −35,1 2 = − =4,451 25 25

(

)

f.

y

' i−1

−y

' i

2,3 - 3,6 3,6 - 4,9 4,9 - 6,2 6,2 - 7,5 7,5 - 8,8 8,8 - 10,1

yi

ni

2,95 4,25 5,55 6,85 8,15 9,45

6 5 7 2 2 3 25

∑ m

s2y =C 2 y g.

-3 -2 -1 0 1 2

[ ( )] n



2

( z 'i ' )

-18 -10 -7 0 2 6 -27

ni

54 20 7 0 2 12 95

2

∑ z 'i '2 ni ∑ z'i ' n i 1

z 'i' ni

1

n

=( 1,3 )2

95 −27 − 25 25

2

[ ( )]

= 4,451

s y = √ 4,451=2,11

sx 2,192 CV x = ∗100 %= ∗100 %=39,710 % x 5,52 CV y =

h.

m

Ot =6,85 y i−O t '' zi = C

sy 2,11 ∗100 %= ∗100 %=38,738 % y 5,446

Para datos no agrupados la desviación media es la siguiente:

Profesor: Víctor Alberto Puliche

26

n

∑ |x i−x| D ax =

1

n

=

|2,3−5,532|+|4,8−5,532|+…+|5,7−5,532| 42,76 =

25

25

=1,7104

Para el cálculo de la desviación media para datos agrupados utilizamos la siguiente tabla:

y 'i−1− y 'i

yi

ni

|z i|=| y i− y|

|z i|ni

2,3 - 3,6 3,6 - 4,9 4,9 - 6,2 6,2 - 7,5 7,5 - 8,8 8,8 - 10,1

2,95 4,25 5,55 6,85 8,15 9,45

6 5 7 2 2 3 25

2,496 1,196 0,104 1,404 2,704 4,004

14,976 5,98 0,728 2,808 5,408 12,012 41,912

∑ m

Luego,

i.

j.

∑ |y i− y|n i D ay =

1

=

n

. 41,912 =1,676 25

C D ax =

D ax 1,7104 ∗100 %= ∗100 %=30,986 % x 5,52

C D ay =

D ay 1,676 ∗100 %= ∗100 %=30,775% y 5,446

Para determinar el valor de la mediana para datos no agrupados, ordenamos los datos de menor a mayor de la siguiente manera: 2.3, 2.4, 2.6, 3.2, 3.3, 3.4, 3.9, 4.5, 4.8, 4.8, 4.8, 5.1, 5.3, 5.5, 5.6, 5.7, 5.9, 6.0, 6.6, 7.2, 7.5, 8.1, 9.3, 10.1, 10.1. Como el número de datos es impar la mediana se ubica en la posición:

n+1 25+1 = =13. Es decir, la mediana se encuentra ubicada en la posición 2 2 13, y su valor es

M ex =5,3 .

De

ahí

que,

n

∑|x i−M e| D ex =

1

=

n

. |2,3−5,3|+|4,8−5,3|+ …+|5,7−5,3| 42,5 = =1,7

45

25

Para el cálculo de la desviación mediana para datos agrupados utilizamos la siguiente tabla:

y 'i−1− y 'i

yi

ni

Ni

| y i−M e|

| y i−M e|ni

2,3 - 3,6

2,95

6

6

2,229

13,374

Profesor: Víctor Alberto Puliche

27

3,6 4,9 6,2 7,5 8,8

-

4,9 6,2 7,5 8,8 10,1

4,25 5,55 6,85 8,15 9,45



5 7 2 2 3 25

11 18 20 22 25

0,929 0,371 1,671 2,971 4,271

4,645 2,597 3,342 5,942 12,813 42,7130

Para determinar la mediana primero dividimos

n entre 2. En este caso,

n 25 = =12,5. Como este valor no se encuentra en la frecuencia absoluta 2 2 acumulada y el valor inmediatamente inferior a éste es 11, asignamos a

N i−1=11. De lo cual se deduce que y 'i=4,9, ni =7 y n −N i−1 2 12,5−11 ' M ey = y i−1 +C =4,9+ ( 1,3 ) =5,179 . ni 7

(

)

m

Por lo tanto,

k.

∑| y i−M e|n i D ey =

1

n

=

. 42,7130 =1,709 25

C D ex =

D ex 1,7 ∗100 %= ∗100 %=32,075 % M ex 5,3

C D ey =

D ey 1,709 ∗100 %= ∗100 %=32,999 % M ey 5,179

Profesor: Víctor Alberto Puliche

28