Prueba Wilcoxon

Prueba de Wilcoxon Prueba No Paramétrica Prueba para 1 muestra, prueba para datos apareados y prueba para dos muestras r

Views 52 Downloads 0 File size 756KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Prueba de Wilcoxon Prueba No Paramétrica Prueba para 1 muestra, prueba para datos apareados y prueba para dos muestras relacionadas

2011



ARGOMEDO GARCÍA, ALONDRA



PONCE CHANCÁN, MIGUEL.



QUIPUZCO SOTO,YADIRA



SEMINARIO ROJAS, ALEXANDRA

A nuestros padres por su cariño, apoyo, amor, paciencia y confianza

2|Página

ÍNDICE

INTRODUCCIÓN

PÁGINA 3

BIOGRAFÍA FRANK WILCOXON

PÁGINA 4

TEST DE RANGOS CON SIGNO-1 MUESTRA

PÁGINA 5-8

Ejemplos de Aplicación.

PÁGINA 9-10

TEST DE RANGOS CON SIGNOS DE WILCONXON – Datos PÁGINA 11apareados 12

Ejemplos de Aplicación. PRUEBA DE SUMA DE RANGOS DE WILCOXON- 2 muestras Ejemplos de Aplicación.

EJERCICIOS PROPUESTOS

BIBLIOGRAFÍA ANEXOS- TABLAS ESTADÍSTICAS .

3|Página

PÁGINA 1320 PÁGINA 2123 PÁGINA 2430

PÁGINA 3132 PÁGINA 33

4|Página

INTRODUCCIÓN

Los métodos de estadística inferencial presentados a través del curso, son llamados métodos paramétricos porque ellos son basados en muestreo de una población con parámetros específicos, como la media (µ), la desviación estándar (σ) o la proporción (p). Estos métodos paramétricos usualmente tienen que ajustarse a algunas condiciones completamente estrictas, así como el requisito de que los datos de la muestra provengan de una población normalmente distribuidos. Esta sección presenta los métodos no paramétricos, los cuales no tienen tales estrictos requisitos. Las pruebas paramétricas requieren supuestos acerca de la naturaleza o forma de las poblaciones involucradas. Las pruebas no paramétricas no requieren estos supuestos. Consecuentemente, las pruebas no paramétricas de hipótesis son frecuentemente llamadas pruebas de libre distribución. Aunque el término no paramétrico sugiere que la prueba no está basada en un parámetro, hay algunas pruebas no paramétricas que dependen de un parámetro tal como la media. Las pruebas no paramétricas, sin embargo, no requieren una distribución particular, de manera que algunas veces son referidas como pruebas de libre distribución. Aunque libre distribución es una descripción más exacta, el término no paramétrico es más comúnmente usado.

5|Página

Frank Wilcoxon (1892–1965) Fue un químico y estadístico estadounidense conocido por el desarrollo de diversas pruebas estadísticas no paramétricas. Nació el 2 de septiembre de 1892 en Cork, Irlanda, aunque sus padres eran estadounidenses. Creció en Catskill, Nueva York, pero se educó también en Inglaterra. En 1917 se graduó en el Pennsylvania Military College y tras la guerra realizó sus postgrados en Rutgers University, donde consiguió su maestría en química en 1921, y en la Universidad de Cornell, donde obtuvo su doctorado en química física en 1924. Wilcoxon fue un investigador del “Boyce Thompson Institute for Plant Research” de 1925 a 1941. Después se incorporó a la Atlas Powder Company, donde diseñó y dirigió el Control Laboratorio. Luego, en 1943, se incorporó a la American Cyanamid Company. En este periodo se interesó en la estadística a través del estudio del libro Statistical Methods for Research Workers de R.A. Fisher. Se jubiló en 1957. Publicó más de 70 artículos,2 pero se lo conoce fundamentalmente por uno de 1945 en el que se describen dos nuevas pruebas estadísticas: la prueba de la suma de los rangos de Wilcoxon y la prueba de los signos de Wilcoxon. Se trata de alternativas no paramétricas a la prueba t de Student. Murió el 18 de noviembre de 1965 tras una breve enfermedad.

TEST DE WILCOXON 6|Página

1. TEST DE SIGNOS DE RANGOS DE WILCONXON - Una muestra

Para la aplicación de este test, se deben cumplir ciertas condiciones: 1. La población es continua y simétrica con mediana M desconocida (las poblaciones pueden ser distintas aunque simétricas). 2. Las observaciones deben expresarse al menos en escala intervalos.

de

Las hipótesis a contrastar son: 1. Hipótesis nula M= M0 , para todo valor de x Hipótesis alternativa M≠ M0, para algún valor de x.

2. Hipótesis nula M≤M0 , para todo valor de x Hipótesis alternativa M> M0, para algún valor de x.

 FUNDAMENTO ESTADÍSTICO: •

De la población se toma una muestra aleatoria simple de tamaño n (x 1, x2,….. xn), y se calculan las diferencias entre cada observación y el valor de la mediana establecido en la hipótesis nula.

Di = xi – M0 7|Página

Si Di = 0 se elimina la observación y se disminuye el tamaño muestral cuantas veces suceda. •

Se hallan los valores absolutos de las diferencias, | D i |, formándose la secuencia de menor a mayor y asignando a cada diferencia absoluta su rango.



Luego se da a cada rango el signo que corresponde a su diferencia, por último se suman los rangos con signo + , suma denominada S * y los rangos con signo - , S- , existiendo entre S* y S- la relación:

n(n+1) 2 S ¿+ S ¿

−¿=



Si es cierta la hipótesis nula M= M0 se espera que el número de valores muestrales xi , mayores que M0 sea sensiblemente igual al de los menores, sucede lo mismo a las diferencias Di y a sus rangos con signo. Es decir las sumas S* y S- son muy parecidas por lo que, si sucede en una muestra concreta, se acepta que el valor de la mediana de la población es M0.



En éstas condiciones la hipótesis alternativa se conocerá por la presencia de valores reducidos de S* o S-, siendo indiferente cual de ellos tenga lugar.



Para las otras dos hipótesis el razonamiento es similar. Si la hipótesis nula es M≤M0 se espera que el número de signos + sea bajo y el de signos – alto, por lo que S* < S-, pues los rangos incluidos en S* (positivos) tenderán a ser inferiores a los correspondientes S-(negativos). Si la hipótesis nula es M≥M0 sucederá lo contrario y S* > S-.

 OBSERVACIONES CON VALORES REPETIDOS:

Si varias diferencias |Di| son iguales entre sí se les atribuye el rango medio.

8|Página

 TABLA ESTADÍSTICA:

Adjuntamos la tabla N° 1 que proporciona los valores críticos para tamaños muestrales de 5 a 50; w(n,

a

), para diversos niveles de significación.

 APROXIMACIÓN ASINTÓTICA DEL ESTADÍSTICO DE CONTRASTE :

Para valores superiores a 50 se utiliza la aproximación normal de la variable S* tipificada, S+*

+¿ S¿ ¿ +¿ S¿ ¿ V¿ √¿ +¿−E ¿ S¿ +¿ S =¿

Que sigue aproximadamente la distribución N (0,1) y sabiendo que:

+¿ S¿ ¿ E¿

9|Página

+¿ n(n+1)( 2n+ 1) S ¿= 24 ;V ¿

La varianza corregida de encontrarse observaciones repetidas es:

+¿ S¿ ¿ Vc¿

g= # de rangos diferentes cuando aparecen observaciones repetidas en la muestra conjunta. t h = tamaño del grupo h-ésimo. t h = 1 cuando una observación no se repite, pues aparece un solo valor igual a sí mismo.

 PROCEDIMIENTO DE CÁLCULO:



Se fija el nivel de significación de la población estudiada, con el supuesto valor mediano M0.



Se toma una muestra aleatoria simple de tamaño n (x1, x2,….. xn),.



Se calculan las diferencias |Di |= |xi – M 0 |, ordenándolas de menor a mayor y asignando a los rangos Ri , el signo que corresponda a Di.



Si aparecen valores repetidos xi=M0, se sustituyen sus rangos por el rango medio, si Di=0 se eliminan.



Por último se suman los n+ que presenten signo +, siendo la suma S+.

Para facilitar el cálculo en la determinación de S + se define una variable ci que toma dos valores 1 y 0. n

Ci= 1, si Di>0 y; Ci = 0 Di< 0, por lo que

10 | P á g i n a

+¿=∑ Ri c i i=1 ¿

S

a) Tamaño muestral n menor o igual que 50:

1. Hipótesis nula M= M0. Se rechaza, al nivel de significación α, si se cumple una de las dos desigualdades. S+ ≥ w (n; α/2);

S+ ≥

n( n+1) 2

– w (n; α/2)

Siendo w (n; α/2) el valor crítico proporcionado por la tabla #1, correspondiente al tamaño muestral n.

2. Hipótesis nula M≤ M0. Se rechaza, si se cumple la desigualdad

S+ ≥ w (n; α/2);

w (n; α/2) el valor crítico proporcionado por la tabla #1 , correspondiente al tamaño muestral n.

3. Hipótesis nula M≥ M0. Se rechaza, si se cumple la desigualdad

+

S ≤

n( n+1) 2

– w (n; α/2)

w (n; α/2) el valor crítico, correspondiente al tamaño muestral n.

b) Tamaño muestral n mayor que 50: Se calcula el valor tipificado, S+*, de S*, 11 | P á g i n a

S



+¿−

n ( n+1 ) 4

n ( n+1 )( 2n+1 ) 24 S +¿ =¿

1. Hipótesis nula M= M0. Se rechaza si se cumple la desigualdad

|S+*| ≥ Zα/2

Siendo Zα/2 el valor que verifica P [|N (0; 1)| ≥ Zα/2] = α/2

2. Hipótesis nula M≤ M0. Se rechaza si se cumple la desigualdad S+* ≥ Zα/2 Zα verifica P [N (0; 1) ≥ Zα] = α

3. Hipótesis nula M≥ M0. Se rechaza si se cumple la desigualdad S+* ≤ - Zα/2 Zα verifica P [N (0; 1) ≥ -Zα] = α

12 | P á g i n a

EJEMPLO 1 Se toma una muestra aleatoria simple de tamaño 12 (n=12) para contrastar, con un nivel de significación igual a 0,01, la hipótesis nula que la mediana de la población de la que se ha obtenido es M o = 75, siendo la alternativa Mo ≠ 75. Los resultados muestrales aparecen a continuación. xi

69

67

77

76

78

73

69

77

77

75

79

70

Entre las observaciones la # 10 es igual a la mediana, 75, por lo que se elimina, pasando a una muestra de tamaño 11 (n=11) xi

69

67

77

76

78

73

69

77

77

79

70

En el cuadro siguiente figuran los cálculos necesarios. xi

Di = xi – 75

Ri

ci

Rici

76

1

1

1

1

1

1

77

2

2

2

3.5

1

3.5

77

2

2

3

3.5

1

3.5

73

-2

2

4

3.5

0

0

77

2

2

5

3.5

1

3.5

78

3

3

6

6

1

6

79

4

4

7

7

1

7

70

-5

5

8

8

0

0

69

-6

6

9

9.5

0

0

69

-6

6

10

9.5

0

0

13 | P á g i n a

|Di |= |xi – 75|

'

Ri

67

-8

8

11

11

0

0

En la columna encabezada por |Di| = | xi - 75|, resultan dos grupos de valores absolutos entre sí (2 y 6), el primero con cuatro elementos y el segundo con dos. Al ordenar |Di| de menor a mayor (columna R’i ¿

se sustituyen

los rangos correspondientes a los |Di| repetidos por los rangos medios

(columna Ri); asignando al primer grupo el rango 3.5 = (2+3+4+5)/4, y al segundo 9.5 = (9+10)/2. Los valores que aparecen en la columna ci, toman el valor 1 cuando Di, es positivo y 0 cuando es negativo.

Hallamos el estadístico de contraste: n

+¿=∑ Ri c i=24.5 i=1

S¿ El valor tabular de w(n; α/2), w(11; 0.005), es 5.1 que al ser menor que el obtenido (24.5) conduce a rechazar la hipótesis nula, es decir, la mediana de la población de la que se ha obtenido la muestra no es igual a 75, con un nivel de significación igual 0.01.

EJEMPLO 2 Para contrastar la hipótesis nula que la mediana de una población es menor igual que 15, M0≤ 15 , con un nivel de significación del 1%, se toma una muestra aleatoria simple de tamaño 72. Entre esas observaciones han aparecido dos valores que coincidían con el valor Mo=15 por lo que fueron eliminados del análisis quedando 70 elementos. Dado el número elevado de observaciones se ha conseguido la aproximación normal N(0,1) Efectuados los cálculos para la contrastación como el ejemplo anterior, se llegó a que S+ = 782.5 , y teniendo en cuenta que los valores de la diferencia absoluta |Di| presentan repeticiones, se hace necesario corregir la varianza. Para calcular el factor de corrección g

∑ (t 3h−t h ) h=1

48 Se precisan los tamaños, th de los grupos repetidos de |Di| que son h

1

14 | P á g i n a

2

3

4

5

6

7

8

9

10

th

13

15

7

6

10

8

5

3

1

2

El valor del factor de corrección es 161.125 y el estadístico S+ corregido

70 (71) 4 S +¿ =−2.7 c = 70(71)(141) −161.125 24 782.5−



La hipótesis nula M≤ 15, se rechaza si se cumple la desigualdad S+*≥Z0.01 P [N (0; 1) ≥Z0.01] = 0.01 por lo que Z0.01 = 2.3263 y como -2.7 < 2.3263; se acepta la hipótesis nula, es decir , la mediana puede ser < 15 a nivel de significación del 1 %.

2. TEST DE RANGOS CON SIGNOS DE WILCONXON – Datos apareados.

Esta prueba se utiliza para comparar (contrastar) dos muestras dependientes o relacionadas



PROCESO DE CÁLCULO:

15 | P á g i n a

1. Se obtienen las diferencias absolutas, restando el valor correspondiente del grupo 1 con la del grupo 2 para cada uno de los sujetos. 2. Se ordenan dichas diferencias: a la mínima se le asigna el primer lugar y a la máxima al último. 3. Si se obtienen dos diferencias iguales, se promedian sus rangos. 4. Si ya se jerarquizaron las diferencias, se les adjudica su signo algebraico (+ ó -).

5. Se obtienen sus sumas

R+¿ ∑¿

o

R−¿ ∑¿

y además es igual a

n(n+1) , la 2

jerarquización se ha realizado correctamente.

6. El valor menor de

R+¿ ∑¿

o

R−¿ ∑¿

se compara con el valor crítico de la tabla

adjuntada y se compara con la siguiente regla de decisión: Si

∑ R min ≤ valor tablas

7. Si n > 15 , se utiliza la aproximación normal.

Z=

∑ R i − μw σw

Dónde:

∑ Ri μw

= Suma del rango +ó - .

= Media aritmética de los rangos.

σ w = Desviación estándar de los rangos

16 | P á g i n a

. Ho se rechaza



PRUEBA DE HIPÓTESIS: Los pasos que se deben seguir son los siguientes:

1. Se proponen las hipótesis nulas y sus correspondientes alternativas:

Al emplear los rangos:

 Ho: X1 = X2

 Ho:

 H1: X1 < X2 X1 > X2 X1 ≠ X2

R+¿ ∑¿ =

R−¿ ∑¿

R+¿ ∑¿




R−¿ ∑¿

R+¿ ∑¿



R−¿ ∑¿

 H1:

2. Se establece el nivel de significancia α: 5%, 1% 17 | P á g i n a

3. Si se cumplen los requisitos, se utiliza la prueba no paramétrica de rangos de signos en pares de Wilcoxon.

a) Si n>15, se empleará :

b) Si n 15 ( n= 25 pares), se utilizará:



(I)

Z=

∑ R i − μw δw

Y para (I) |Z 0.025| = 1.96. 

Regla de decisión: Si |Z| ≥1.96. Ho se rechaza



PROCESO DE CÁLCULO

a) Se obtienen las diferencias de las puntuaciones del método A y del método B. b) Se jerarquizan dichas diferencias, para lo cual se considera su valor absoluto, pero se conserva su signo original en los rangos obtenidos. 24 | P á g i n a

R+¿ c) Se obtienen: ∑ ¿ y

Sujeto

Antes

Después

1

29

32

2

34

19

3

32

22

4

19

21

5

31

20

6

22

24

7

28

25

8

31

31

9

32

18

10

44

22

11

41

24

12

23

26

13

34

41

14

25

34

25 | P á g i n a

Diferencia

-3 15 10 -2 11 -2 3 0 14 22 17 -3 -7 -9

R−¿ ∑¿

|Di|

Orden ado

Rango

Rango -

3

0

1.5a

-1.5

15

0

1.5a

10

2

4.5

2

2

4.5

11

2

4.5

2

2

4.5

3

3

8

0

3

8

14

3

8

22

6

10

17

7

11

3

9

12.5

7

9

12.5

9

10

14

Rango +

1.5 4.5 -4.5 4.5 -4.5 8 8 8 10 11 -12.5 -12.5 -14

15

42

27

16

20

26

17

25

25

15 -6 0

18

33

31

2

19

34

19

20

20

22

21

21

32

22

22

31

23

45

30

24

43

29

25

31

20

15 -2 -11 -9 15 14 11

15

11

16

6

11

16

0

11

16

2

14

18.5

15

14

18.5

2

15

21.5

11

15

21.5

9

15

21.5

15

15

21.5

14

17

24

11

22

25

Tota l

16 -16 16 18. 5 18. 5 -21.5 -21.5 -21.5 21. 5 24 25 -130 195

Y se obtienen:

R+¿ ∑¿

= 195

R−¿ ∑¿

= 130

Como n=25 (n> 15), se puede aplicar la aproximación a Z por lo que:

σ w=

26 | P á g i n a



n ( n+1 ) ( 2n +1 ) =37.2 24

μ w=

n ( n+1 ) =162.5 4

∑ Ri+¿− μ =¿ w

σw Z +¿ ¿

∑ Ri−¿− μ =−0.874474632 w

σw

y Z −¿ ¿



27 | P á g i n a

Como 0.8744< 1.96. Ho se acepta

0.874474632

Gráfica de distribución Normal, Media= 162.5, Desv.Est.= 37.2 0.012 0.010

Densidad

0.008 0.006 0.004 0.002 0.025

0.025

0.000

89.59

162.5 X

235.4

Hallamos los puntos críticos: 1

Z=

a− μ w σw

= 89.59

b + μw σw

= 235.4

Z2=

 Conclusión: Se acepta la hipótesis nula; por lo tanto no existe diferencia en la productividad después del nuevo plan, al 95 % de confianza

28 | P á g i n a

3. PRUEBA DE SUMA DE RANGOS DE WILCOXON- 2 muestras relacionados, no pareadas

La prueba de la suma de rango de Wilcoxon es una prueba no paramétrica basada en dos muestras aleatorias simples independientes, está diseñada para determinar si las distribuciones de frecuencias relativas de dos poblaciones estadísticas de valores continuos son idénticos entre sí o diferentes. Si la respuesta es afirmativa se puede decir que las dos medias son iguales. Sin embargo si la respuesta es negativa, esta prueba no puede indicar como difieren las dos poblaciones. 

PASOS PARA REALIZAR LA PRUEBA DE SUMA DE RANGOS

 Agrupar los datos contenidos en dos muestras independientes, cuyos tamaños se pueden denominar nA y nB

 Clasificar los datos combinados del menor valor, que se llamará uno, al mayor valor que es igual a nA+ nB

 Volver a crear las dos muestras originales con los datos de rango.

 Sumar los rangos en cada muestra

 Designar cualquiera de estas sumas de rango, por lo general la de la muestra A al estadístico de prueba.

Estadístico de Prueba para la suma de Rango de Wilcoxon: W= Suma de rango de la muestra A o B 29 | P á g i n a



PRUEBA DE HIPÓTESIS:

Ho: Las distribuciones de frecuencia relativa de las dos poblaciones muestreadas son idénticas. H1: Las distribuciones de frecuencia relativa de las dos poblaciones muestreadas difieren

Valor Esperado y desviación estándar de la distribución muestral W:

μ w=

n A .( n A +n B +1) 2

σ w=



n A . n B (n A+ n B +1) 12

Nota: Si W se definiera como la suma de rango de la muestra B tendrían que intercambiarse los subíndices en la fórmula de µ

30 | P á g i n a

Desviación normal para la prueba de rango de Wilcoxon- Estadístico de Prueba:

Z=

W − μw σw

Supuesto: nA y nB ≥10



PASOS PARA REALIZAR LA PRUEBA DE HIPÓTESIS: 1. Formular las hipótesis opuestas: Ho: Las distribuciones de frecuencia relativa de las dos poblaciones muestreadas son idénticas. H1: Las distribuciones de frecuencia relativa de las dos poblaciones muestreadas difieren

2. Seleccionar el estadístico de prueba : 

Si se tiene la referencia de que las poblaciones tienen varianza idénticas se utiliza la desviación Normal de la prueba W.



De lo contrario se usará la Prueba U Mann Whitney- Wilcoxon.

3. Derivar una regla de decisión : 

Dado un nivel de significancia α . Si la hipótesis es bilateral los valores críticos de la normal serían ± Zα/2

y si

simplemente se tomará en cuenta el valor de Zα.

31 | P á g i n a

la hipótesis es unilateral

EJEMPLO 5

32 | P á g i n a

En la siguiente tabla se muestran los promedios de saldos mensuales en cuentas de cheques en dos bancos: Datos Muestrales. •

Paso 1: Agrupamos los datos de acuerdo a la muestra que pertenecen y obtenemos los valores Banco A

Banco A

Número de cuentas

Saldo Promedio

Número de cuentas

Saldo Promedio

muestreadas

mes anterior

muestreadas

mes anterior

(dólares)

(dólares)

33552

201

5107

3362

38174

950

12985

129

24041

1209

97616

201

30547

367

64241

1579

22651

792

08592

485

34492

804

81036

2639

30631

42

98059

79

88602

950

44951

92

16510

505

23078

3010

29278

4099

92793

3159

80756

3412

52799

2910

nA = 10 y nB= 12

 Paso 2: Ahora Clasificamos los datos combinados del menor valor, que se llamará uno, al mayor valor que es igual a nA+ nB ,  Paso 3, 4, 5 : Se encuentran desarrollados en la tabla

33 | P á g i n a

Saldo Promedio mes anterior

34 | P á g i n a

Muestra de

Rango

Rangos de la

Rangos de la

muestra A

muestra B

(4)

(5)

(dólares)

Origen

(1)

(2)

42

A

1

79

B

2

2

92

B

3

3

129

B

4

4

201

A

5.5

201

B

5.5

367

A

7

485

B

8

505

A

9

9

792

A

10

10

804

A

11

11

950

A

12.5

12.5

950

A

12.5

12.5

1209

A

14

14

1579

B

15

15

2639

B

16

16

(3)

1

5.5 5.5 7 8

2910

B

17

17

3010

B

18

18

3159

B

19

19

3362

B

20

20

342

B

21

21

4099

A

22

Sumas de rango:

22 W=104.5

 Formulamos la hipótesis:

Ho: El saldo promedio es idéntico en los dos bancos. H1: El saldo promedio difiere en los dos bancos.

 Seleccionar un estadístico de prueba: W: La suma de rango escogida arbitrariamente de la muestra A Z: Desviación normal de W

Z=

W − μw σw

Supuesto: nA y nB ≥10

Hallamos: W= 104.5

35 | P á g i n a

148.5

μ w=

σ w=

Z=

W − μ w 104.5−115 = =−0.69 σw 15.16575

36 | P á g i n a



n A .(n A +n B +1) = 115 2

n A . n B (n A+ n B +1) = 15.16575 12

Se acepta la hipótesis nula, es decir, el saldo promedio es idéntico en los dos bancos. EJEMPLO 5 Un gerente de una granja desea probar el dicho de un fabricante de que el fertilizante A, más barato, es al menos tan eficaz como el fertilizante B, más caro. Se seleccionan al azar 20 terrenos idénticos de fresas tales que la mitad de ellos están fertilizados con A y la mitad con B, han de registrarse las producciones de ambos y llevarse a cabo una prueba estadística al nivel de significancia 5%. Fertilizante A

Fertilizante B

Terreno #

Quarts de fresas

Terreno #

Quarts de fresas

3

91

1

79

4

97

2

90

7

85

5

80

9

88

6

95

1

86

8

83

12

93

10

93

13

80

14

85

15

81

16

80

18

81

17

82

20

90

19

84



SOLUCIÓN

 Paso 1:

37 | P á g i n a

Agrupamos los datos de acuerdo a la muestra que pertenecen y obtenemos los valores.  Paso 2: Ahora Clasificamos los datos combinados del menor valor, que se llamará uno, al mayor valor que es igual a nA+ nB ,  Paso 3, 4, 5 : Se encuentran desarrollados en la tabla. Fertilizante A Terreno #

Fertilizante B

Quarts de fresas

Terreno #

I

Orden Datos originales

Muestras de origen

Rangos

Quarts de fresas

Rangos de muestra A

3

91

1

79

1

79

B

1

4

97

2

90

2

80

A

3

7

85

5

80

3

80

B

3

9

88

6

95

4

80

B

3

1

86

8

83

5

81

A

5.5

5.5

12

93

10

93

6

81

A

5.5

5.5

13

80

14

85

7

82

B

7

15

81

16

80

8

83

B

8

18

81

17

82

9

84

B

9

20

90

19

84

10

85

A

10.5

11

85

B

10.5

12

86

A

12

12

13

88

A

13

13

14

90

A

14.5

14.5

15

90

B

14.5

16

91

A

16

16

17

93

A

17.5

17.5

18

93

B

17.5

19

95

B

19

20

97

A

20

38 | P á g i n a

3

10.5

20

W

117.5

 Formulamos la hipótesis:

Ho: El fertilizante A es al menos tan eficaz como el B. (La producción en los terrenos A es mayor o igual que la de los terrenos B) H1: El fertilizante A es al menos eficaz que el B.

 Seleccionar un estadístico de prueba: W: La suma de rango escogida arbitrariamente de la muestra A Z: Desviación normal de W

Z=

W − μw σw

Supuesto: nA y nB ≥10

 Establecemos la regla de decisión: Dado un nivel de significancia α= 0.05, siendo una prueba de Cola inferior Aceptar Ho si Z≥ -1.645 Hallamos: 39 | P á g i n a

W= 117.5

μ w=

σ w=

Z=

W − μ w 117 .5−115 = =0.94 σw 13.228

40 | P á g i n a



n A .( n A +n B +1) = 105 2

n A . n B (n A+ n B +1) = 13.228 12

Como podemos observar el valor 105 se encuentra en la zona de aceptación de la hipótesis nula, por lo tanto se concluye que: El fertilizante A es al menos tan eficaz como el fertilizante B.

EJERCICIOS PROPUESTOS 41 | P á g i n a

Test de Wilcoxon 1. El presidente ejecutivo de CEO Airlines, notó un aumento en el número de pasajeros no registrados en vuelos que salen de Atlanta. Está particularmente interesado en determinar si hay más pasajeros no registrados en vuelos que salen de Atlanta que en los vuelos que parten de Chicago. La tabla presenta una muestra de 9 vuelos de Atlanta y ocho de chicago. Al nivel de significancia del 5% ¿Se puede concluir que hay más pasajeros no registrados en los vuelos que salen de Atlanta?

Número de pasajeros no registrados para vuelos programados ATLANTA

CHICAGO

ATLANTA

CHICAGO

11

13

20

9

15

14

24

17

10

10

22

21

18

8

25

11

16

2. Los siguientes datos muestran los índices de trabajo defectuoso de los empleados antes y después de un cambio en el plan de incentivos de sueldos. Compare los siguientes dos conjuntos de datos para ver si el cambio disminuyó las unidades defectuosas producidas. Utilice un nivel de significancia de 0.10.

SUJETO

1

2

3

4

5

6

7

8

9

10

11

12

ANTES

8

7

6

9

7

10

8

6

5

8

10

8

DESPU

6

5

8

6

9

8

10

7

5

6

9

5

ÉS

42 | P á g i n a

3. Suponga que se desea determinar si el número de unidades de cierto producto vendidas por vendedores que tienen grado académico difiere del número de unidades vendidas por vendedores que no han obtenido grado. Sean G y F los dos grupos de vendedores respectivamente. Suponga además que se ha obtenido una muestra aleatoria de 10 vendedores y 21 vendedores respectivamente:

UNIDADES VENDIDAS POR

43 | P á g i n a

UNIDADES VENDIDAS POR

VENDEDORES G

VENDEDORES F

1

82

1

92

2

75

2

90

3

70

3

90

4

65

4

89

5

60

5

86

6

58

6

85

7

50

7

83

8

50

8

81

9

46

9

81

10

42

10

78

11

76

12

73

13

72

14

7

15

68

16

67

7

66

18

64

19

63

20

52

21

40

BIBLIOGRAFÍA



Estadística para las ciencias administrativas Chao Lincoln.

44 | P á g i n a



Estadística para negocios y economía Heinz Kohler



Bibliografía facilitada por el docente



http://en.wikipedia.org/wiki/Frank_Wilcoxon



http://www.bioestadistica.uma.es/libro/node155.htm



http://www.dm.uba.ar/materias/optativas/metodos_no _parametricos_1/2011/2/NoparI05.pdf

45 | P á g i n a