Elorza Estadistica para Las Ciencias Sociales

Parte 5 • Asociación Cuadro 14.1 1 2 3 4 5 6 7 8 9 Total FRAo (observada) 0.04 0.12 0.28 0.44 0.56 0.6

Views 122 Downloads 6 File size 340KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Parte 5 • Asociación

Cuadro 14.1

1

2

3

4

5

6

7

8

9

Total

FRAo (observada)

0.04

0.12

0.28

0.44

0.56

0.68

0.84

0.92

0.96

1.0

FRAe (esperada)

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.0

D

0.06

0.08

0.02

0.04

0.06

0.08

0.14

0.12

0.06

0.00

Deciles

PRUEBA DE LA U DE MANN-WHITNEY Es posible emplear esta prueba como una alternativa de la paramétrica t de Student, para comprobar la diferencia entre dos medias en dos muestras independientes. Las puntuaciones que representan mediciones, observaciones o datos en general, deben ser mutuamente independientes dentro de la misma muestra a la que pertenecen respecto de otra; no es necesario que sean del mismo tamaño, pero sí se requiere que las variables que representan a dichas puntuaciones sean continuas. El uso de esta prueba se considera cuando las muestras son pequeñas y los requisitos de uso para la t resultan dudosos. La hipótesis nula establece la analogía (homogeneidad) de distribuciones poblacionales y, en cierta manera, la igualdad de las dos medias o medianas. No obstante, si el par de distribuciones poblacionales son más o menos similares, tanto en forma como en variabilidad, la U es una prueba excelente de la tendencia central. Pero debido a que la prueba se basa en categorías o clases, la medida de tendencia central más adecuada es la mediana (Me). Entonces, cuando se consideran los resultados de dicha prueba, lo primero en que se piensa es la comparación de ambas medianas. Suponga que hay dos grupos cuyas distribuciones se sobreponen, como se muestra en la siguiente figura: Me1

Me2

Una vez jerarquizadas las puntuaciones combinadas de las distribuciones anteriores, asignando el rango 1 (uno) a la puntuación más baja y el rango más alto a la puntuación nx + ny, se obtienen a continuación la suma de las puntuaciones tanto de la distribución x como de la y. En este caso particular, la diferencia entre ambas sumas es pequeña. Por consiguiente, la prueba de la U de Mann-Whitney se basa en esta diferencia. Se deduce de la probabilidad de obtener una suma de categorías de una distribución que difiere de la suma de rangos esperada conforme la hipótesis de igualdad de las dos distribuciones.

Ejemplo 6 En dos grupos de estudiantes, cada profesor aplica una prueba de comprensión de lectura, después de haber entrenado a los alumnos en dos técnicas diferentes. El tamaño de los grupos es distinto, n1 = 14 y n2 = 13, y los resultados obtenidos son los siguientes:

511

••••••

Capítulo 14 • Estadística no paramétrica

Grupo I

Grupo II

54

512

••••••

50

45

48

40

47

32

46

30

45

30

43

30

42

29

38

28

26

28

25

38

22

31

21

28

26

27

n1 = 14

n2 = 13

Paso 1. Se etiquetan los dos grupos x y y; si uno contiene menos casos que el otro, debe llamarse x. Paso 2. Se ordenan en forma creciente o decreciente las puntuaciones en una sola distribución de nx + ny casos, jerarquizándolos a continuación. Se asigna el intervalo 1 a la puntuación menor, 2 al que sigue en forma creciente, y así sucesivamente hasta el caso nx + ny. Si hay empate se obtiene el promedio de los rangos que tocan a los valores empatados y a todos se les asigna dicho promedio. y Grupo I

x Grupo II

54

Ry

Rx

27

50

45

26

21.5

48

40

25

18

47

38

24

16.5

46

32

23

15

45

31

21.5

14

43

30

20

12

(continúa)

Parte 5 • Asociación

(continuación)

42

30

19

12

38

30

16.5

12

26

29

4.5

10

26

28

4.5

8

25

28

3

8

22

28

2

8

21

27

1

6

ny = 14

nx = 13

Y Ry = 217

Y Rx = 161

Paso 3. Se comprueba si no se cometió algún error. Aplicando: n(n + 1) 2

=

- Rx

+

- Ry

donde n = nx + ny = 13 + 14 = 27; al sustituir los valores, se tiene: 27(28) 2

= 161 + 217

‘ 378 = 378 Paso 4. Se calcula la suma de los rangos de la distribución x, o sea Y Rx. Paso 5. Localice en la tabla el apéndice de la U de Mann-Whitney el renglón y la columna que corresponden tanto a nx = 13, como a ny = 14. Ése es el valor crítico de Rx para probabilidades de 0.005, 0.01, 0.025 y 0.05 unidireccionales (una cola), para valores tanto de nx como ny , que van desde tres a 15. Paso 6. Aplique uno de los tres siguientes criterios, según la hipótesis alternativa que haya establecido: _ a) H1: x & y. Encuentre un par de números correspondientes a la columna de (si 2 _ = 0.05, utilice la columna de 0.025). Rechace H0 si Y Rx es igual o menor que el número más pequeño o también si es igual o mayor que el número más grande. b) H1: x < y. Encuentre un par de números correspondiente a la columna de _ (si _ = 0.05, entonces use esa misma columna). Rechace H0 si Y Rx igual o menor que el número más pequeño. c) H1: x * y. Encuentre el par de números correspondiente a la columna de _ (si _ = 0.05), utilice esa misma columna). Rechace H0 si Y Rx es igual o superior al número más grande.

513

••••••

Capítulo 14 • Estadística no paramétrica

Paso 7. En este problema, para ejemplificar los tres criterios anteriores, se establecerán tanto la hipótesis nula como la alterna para a), b) y c), con _ = 0.05. a) 141 y 213 H0: x = y H1: x & y Como Y Rx = 161 no es menor o igual que 141, ni mayor o igual que 213; entonces no se rechaza H0. b) H0: x * y H1: x < y _ = 0.05, (147, 217) Y Rx = 161 Como Rx no es igual ni menor que 147, entonces no rechazar H0. c) H0: x ” y H1: x > y _ = 0.05, (147, 217) Y Rx no es igual ni menor que 217, entonces no se rechaza H0.

514

••••••

Conclusión Las dos distribuciones poblacionales son análogas. Requisitos de uso de la U de Mann-Whitney Los requisitos básicos para esta prueba son que la obtención de las muestras que representan a cada una de las poblaciones haya sido aleatoria y que no existan empates en los intervalos jerarquizados, aunque un número moderado de ellos no altera el resultado. Prueba U de Mann-Whitney para muestras grandes Dado el teorema central del límite, una muestra grande tiende a distribuirse en forma normal, por lo que podrá utilizar el estadístico Z, definido por Y Rx y nx, ny, y un factor de corrección (0.5): Z =

YRx < 0.5[n x (n x + n y + 1)] n x n y (n x + n y + 1) 12

• Valores positivos de Z implican que x > y. • Valores negativos de Z implican que x < y. Para propósitos de demostración, se aplicará esta fórmula con los datos del ejemplo anterior: Datos: nx = 13. ny = 14. Y Rx = 161.

Parte 5 • Asociación

Al sustituir, resulta: Zc =

Zc =

161 < 0.5 [13 (13 + 14 + 1)] 13 × 14 (13 + 14 + 1) 12

161 < 0.5 [ 364 ] 182 (28) 12

=

161 < 182 424.6

=