La paradoja de Simpson.pdf

“Quien se atreva a enseñar nunca debe dejar de aprender” LA PARADOJA DE SIMPSON Manuel Antonio MASÍAS CORREA manuelmas

Views 88 Downloads 0 File size 785KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

“Quien se atreva a enseñar nunca debe dejar de aprender”

LA PARADOJA DE SIMPSON

Manuel Antonio MASÍAS CORREA [email protected]

Cualquier relación estadística entre dos variables, puede ser revertida incluyendo factores adicionales en el análisis. Karl Pearson 1899

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

2

La paradoja de Simpson1/ Es una paradoja estadística en la que dos conjuntos de datos, considerados por separado, cada una apoya una conclusión cierta, pero en conjunto apoyan la conclusión opuesta. Supongamos que un ensayo se ejecuta, y que el medicamento A es eficaz

en 10 de 100 pacientes (10 por ciento), mientras que el fármaco B es eficaz en 200 de 1000 (20 por ciento). A continuación, un repite la ejecución del ensayo, y en este caso el medicamento A es eficaz en el 400 de cada 1.000 pacientes (40 por ciento), mientras que el fármaco B es eficaz en 60 de los 100 pacientes (60 por ciento). 1/ Llamada así, por el matemático británico Edward Hugh Simpson (nacido en 1927), que la publicó en 1951. En A Dictionary of Psychology 2001, originalmente publicado por Oxford University Press . LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

3

La paradoja de Simpson Es evidente que el fármaco B es superior en cada uno de los dos ensayos, sin embargo, si se combinan los datos, entonces el fármaco A es superior: el medicamento A es eficaz en el 410 de 1100 (37 por ciento), mientras que el fármaco B es eficaz en 260 de los 1100 (24 por ciento). Primer ensayo

Fármaco

Eficaz

Segundo ensayo

TOTAL

Fármaco

SI

NO

A

10

90

100

B

200

800

1000

Eficaz

TOTAL

SI

NO

A

400

600

1000

B

60

40

100

Ensayos combinados Fármaco

LA PARADOJA DE SIMPSON

Eficaz

TOTAL

SI

NO

A

410

690

1100

B

260

840

1100

miércoles, 04 de diciembre de 2013

4

Uno de los ejemplos de la vida real más conocidos de la paradoja de Simpson se produjo cuando la Universidad de California, Berkeley, fue demandada por el sesgo contra las mujeres que postulan a la escuela de posgrado. Las cifras de admisión para el otoño de 1973 mostraron que los hombres que solicitan eran más propensos que las mujeres a ser admitidos, y la diferencia era tan grande que era poco probable que sea debido al azar. Postulantes

% de admitidos

Hombres

8442

44

Mujeres

4321

35

¡¡ DISCRIMINACIÓN PARA LAS MUJERES…!!

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

5

Sin embargo cuando se examinaron los distintos departamentos, se encontró que en ningún departamento fue significativamente sesgado hacia las mujeres, de hecho, la mayoría de los Programas Académicos tenían un pequeño sesgo en contra de los hombres. Programa Académico

Hombres

Mujeres

Postulantes

% admitido

Postulantes

% admitido

A

825

62

108

82

B

560

63

25

68

C

325

37

593

34

D

417

33

375

35

E

191

28

393

24

F

272

6

341

7

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

6

La explicación resultó ser que las mujeres tendían a postular a los departamentos con bajos índices de ingreso, mientras que los hombres tienden a aplicarse a los departamentos con altos índices de admisión.

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

7

Otros ejemplos con datos ficticios:

1. Castigo y calificación según edad. 2. Efectos estimuladores. 3. Efectos supresores.

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

8

Castigo y calificación 10

y = 0.4453x + 2.1132 n = 16, p = 0.0163

Calificación

8

6

4

2

0 0

2.5

5

7.5

10

Castigos LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

9

Castigo y calificación según edad. 10

y = -x + 13 8

y = -x + 17

y = -0.98x + 8 p = 3.209 E-32

Calificación

6

4

2

y = -1.06x + 5.2 p = 1.755 E-32 0

0

-2

LA PARADOJA DE SIMPSON

2.5

5

7.5

10

Castigos miércoles, 04 de diciembre de 2013

10

Castigo

Calificación

Correlaciones sin condicionar edad Castigo Calificación Correlación de Pearson 1 .589 Sig. (bilateral) .016 N 16 16 Correlación de Pearson .589 1 Sig. (bilateral) .016 N 16 16 Correlaciones condicionando edad

Variables de control Castigo Edad

Correlación Significación (bilateral) gl Calificación Correlación Significación (bilateral) gl

Castigo Calificación 1.000 -.941 . .000 0 13 -.941 1.000 .000 13 0

Nótese que la correlación entre castigos y calificación es de 0.589. Sin embargo si se condiciona en edad, ahora la correlación parcial, entre castigos y calificación (dada una edad) es ahora negativa y grande( -0.941) LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

11

Efecto - Estimulador

Tabla de contingencia TRATAMIENTO * RESPUESTA Recuento RESPUESTA Total SI NO A 74 26 100 TRATAMIENTO B 26 74 100 Total 100 100 200

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

12

Efecto - Estimulador

Chi-cuadrado de Pearson

Pruebas de chi-cuadrado Sig. asintótica Valor gl (bilateral) 46,080a 1 ,000

Corrección por continuidad b 44,180

1

,000

Razón de verosimilitudes

1

,000

48,036

Sig. exacta (bilateral)

Estadístico exacto de Fisher Asociación lineal por lineal

,000 45,850

1

Sig. exacta (unilateral)

,000

,000

N de casos válidos 200 a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 50.00. b. Calculado sólo para una tabla de 2x2.

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

13

Efecto - Estimulador

Correlaciones TRATAMIENTO

Correlación de Pearson TRATAMIENTO Sig. (bilateral) N Correlación de Pearson RESPUESTA Sig. (bilateral) N **. La correlación es significativa al nivel 0,01 (bilateral).

LA PARADOJA DE SIMPSON

RESPUESTA 1 ,480** ,000 200 200 ,480** 1 ,000 200 200

miércoles, 04 de diciembre de 2013

14

Efecto – Estimulador - Pronóstico Tabla de contingencia TRATAMIENTO * RESPUESTA * PRONÓSTICO RESPUESTA

PRONÓSTICO

SI A

BUENO TRATAMIENTO B

A MALO

TRATAMIENTO B

Recuento

NO

72

% dentro de TRATAMIENTO

18 2

2

20

18

20

10,0% 90,0% 100,0%

Recuento

8

% dentro de TRATAMIENTO

80

90,0% 10,0% 100,0%

Recuento % dentro de TRATAMIENTO

8

90,0% 10,0% 100,0%

Recuento

% dentro de TRATAMIENTO

Total

72

80

10,0% 90,0% 100,0%

Si el pronóstico es bueno, ambos tratamientos producen 90% de respuestas. Si el pronóstico es malo, ambos tratamientos producen 10% de respuestas. LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

15

Efecto – Estimulador - Pronóstico

Correlaciones Variables de control

TRATAMIENTO Correlación

1,000

TRATAMIENTO Significación (bilateral) . Correlación RESPUESTA

Significación (bilateral)

LA PARADOJA DE SIMPSON

0

197

,000

1,000

1,000 .

gl

197

Tratamiento y respuesta son independientes pronóstico. La correlación parcial es cero.

,000 1,000

gl

PRONÓSTICO

RESPUESTA

0

al condicionar con

miércoles, 04 de diciembre de 2013

16

Efecto – Supresor Tabla de contingencia TRATAMIENTO * RESPUESTA RESPUESTA NO SI Recuento 40 60 A % dentro de TRATAMIENTO 40,0% 60,0% TRATAMIENTO Recuento 40 60 B % dentro de TRATAMIENTO 40,0% 60,0% Recuento 80 120 Total % dentro de TRATAMIENTO 40,0% 60,0%

Ambos tratamientos, A y B, pacientes.

Total 100 100,0% 100 100,0% 200 100,0%

producen la respuesta en 60% de los

Parecen ser iguales el tratamiento A y el B. LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

17

Efecto – Supresor – Pronóstico Tabla de contingencia TRATAMIENTO * RESPUESTA * PRONÓSTICO RESPUESTA PRONÓSTICO NO SI Recuento 6 54 A % dentro de TRATAMIENTO 10,0% 90,0% BUENO TRATAMIENTO Recuento 24 36 B % dentro de TRATAMIENTO 40,0% 60,0% Recuento 34 6 A % dentro de TRATAMIENTO 85,0% 15,0% MALO TRATAMIENTO Recuento 16 24 B % dentro de TRATAMIENTO 40,0% 60,0%

Total 60 100,0 % 60 100,0 % 40 100,0 % 40 100,0 %

Si el pronóstico es bueno, el tratamiento A produce 90% de respuesta, y el B solo 60%. Si el pronóstico es malo, el tratamiento A produce 15% de respuestas. En cambio el B produce 60%. LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

18

Correlaciones TRATAMIENTO

Correlación de Pearson 1 TRATAMIENTO Sig. (bilateral) N 200 Correlación de Pearson ,000 Sig. (bilateral) 1,000 RESPUESTA N 200 Correlación de Pearson ,000 Sig. (bilateral) 1,000 PRONÓSTICO N 200 **. La correlación es significativa al nivel 0,01 (bilateral).

RESPUESTA

,000 1,000 200 1 200 -,375** ,000 200

PRONÓSTICO

,000 1,000 200 -,375** ,000 200 1 200

Tratamiento y respuesta son independientes marginalmente y también al condicionar con pronóstico. Pronóstico y respuesta tienen la misma correlación, -0.375, y también al condicionar con tratamiento. LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

19

Conclusión

Todo lo expuesto conduce lógicamente a estudiar los requerimientos

para fijar las condiciones fijar las condiciones bajo las cuales es lícito colapsar variables en una tabla contingencia multidimensional que permitan realizar un análisis pormenorizado de alguna (sub)tabla. El teorema de la colapsabilidad de Bishop-Fienberg-Holland establece tales condiciones.

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

20

LA PARADOJA DE SIMPSON

miércoles, 04 de diciembre de 2013

21