Tall

Universidad Nacional de Colombia Facultad de Ciencias Departamento de Estad´ıstica Carrera de Estad´ıstica Dise˜ no de e

Views 109 Downloads 5 File size 294KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Universidad Nacional de Colombia Facultad de Ciencias Departamento de Estad´ıstica Carrera de Estad´ıstica Dise˜ no de experimentos Bogot´ a, febrero de 2018

Conceptos b´ asicos del dise˜ no experimental Taller 1 Valeria Bejaranoa , Andrey Duvan Rinconb 1. ¿Qu´e debe contener el cap´ıtulo de materiales y m´etodos de un proyecto o experimento respecto al dise˜ no experimental? ˆ Especificar claramente el material experimental a ser usado. ˆ Definir detalladamente las unidades experimentales, muestras y submuestrales si llegan a haber. ˆ Descripci´ on de los factores y sus niveles en cada una de las variables respuesta asociadas, as´ı como los tratamientos que ser´ an aplicados a cada UE. ˆ Descripci´ on detallada de la metodolog´ıa a ser usada en el experimento (paso a paso).

2. Explique el significado y proponga al menos dos ejemplos de: a) Factor fijo Es un factor conocido por el experimentador y considerado en un experimento, y sobre el cual se realizan conclusiones. Cuando tenemos modelos de efectos fijos solo concluimos sobre los factores considerados en el experimento. Ejemplos ˆ Determinar la influencia de 3 tipos de prueba en el nivel de estr´es de un grupo de estudiantes. El factor fijo es la prueba. ˆ Quiero determinar la cantidad de aceite y agua en la consistencia del arroz. Los factores fijos ser´ıan el aceite y el agua.

b) Factor aleatorio Los factores aleatorios constituyen una muestra aleatoria de una poblaci´on de factres sobre la cual quiero dar conclusiones, es por ello que no son conocidos por el experimentador previamente a ser seleccionados. ˆ Determinar el efecto que tiene en la salud las diferentes marcas de un tipo de bebida, para ello tomo una muestra aleatoria de todas las marcas en el mercado. ˆ Determinar el efecto de la marca de la comida seca de perro sobre los niveles de azucar del cachorro. Para ello tomo una muestra de las marcas de comida seca de perro en el mercado.

c) Error experimental Variabilidad inherente en el material experimental y que se calcula comparando unidades id´enticamente tratadas. ˆ En el estudio con animales o en el de personas considerada como unidades experimentales puede existir factores fisiol´ ogicos que influyan en los efectos de un mismo tratamiento aplicado a diferentes personas. ˆ Se tienes 4 plantaciones de cacao consideradas como las unidades experimentales, se les aplica dos tratamiento habiendo dos replicaciones, la diferencia de las dos plantaciones con igual tratamiento ser´ a el error experimental. a C´ odigo: b C´ odigo:

1014297995. E-mail: [email protected] 1116553091. E-mail: [email protected]

1

2

Conceptos b´ asicos del dise˜ no experimental

d) Unidad experimental Son los elementos a los cuales les puedo asignar un tratamiento aleatoria e idependientemente. ˆ En los casos anteriores como las plantaciones de cacao. ˆ En el ejemplo de las bebidas las unidades experimentales ser´ıan los individuos que tomaran las bebidas.

e) Aleatorizaci´ on de tratamientos Proceso f´ısico donde cada tratamiento tiene igual probabilidad de ser asignado a cualquier unidad experimental. ˆ Con una lista de nuestras UE realizamos el procedimiento coordenado negativo para asignar los tratamiento aleatoriamente. ˆ Con ayuda de un dado con la cantidad de caras de los tratamientos ir asignandolos.

3. Se investiga la morfometr´ıa de J.Lamprotaenia (sardina azul) en las islas del Rosario (Bolivar). Entre otras caracter´ısticas, midieron la longitud est´andar de sardinas hembras en tres estaciones de muestreo: fondo arenoso, manglar y pasto marino. a) Describa los factores, niveles, unidades experimentales, unidades observacionales, tratamientos y la variable respuesta. ˆ Factores:Tipo de ecosistema ˆ Niveles: Fondo arenoso, Manglar y Pasto marino (Para experimento tendr´ıan que recrear ecosistemas artificiales o estaciones de muestreo dentro del ecosistema natural que aisl´e a las sardinas). ˆ Unidades experimentales: Sardinas azules hembras seleccionadas desde alevines para el estudio. ˆ Unidades observacionales: Sardinas azules hembras pasada la etapa de crecimiento en los ambientes controlados. ˆ Tratamiento: Tipo de estaci´ on (Ecosistema) a la que fue asignado los alevines. ˆ Variable respuesta: Longitud de las Sardinas

b) Dise˜ ne una aleatorizaci´ on correcta para este experimento y proponga el modelo lineal asociado. Tenemos un grupo de n alevines de sardinas azules para usar en le experimento, nacieron en ambientes neutros controlados desde el huevo. Para asignar a que ecosistema ser´an introducidos lo hacemos de la siguiente forma: tenemos numerados los alevines de 1:n luego generamos n n´ umeros aleatorios de una distribuci´on U (0, 2), si numero esta en intervalo (0,0.5] asignamos Fondo arenoso,en (0.5,1] asignamos Manglar, en (1,1.5] Pasto marino y los dem´as (1.5,2] pertenecen a un grupo control. yij = µ + τi + εij + ηij

i : 1..4

j : 1..ni

εij : Error experimental del individuo j dentro de tratamiento i. τi : Efecto de tratamiento i. ηij : Error de las observaciones. 4. Un experimentador est´ a estudiando el efecto de diluentes de semen en la tasa de concepci´on en vacas lecheras, usando las variables: Reducido (Citrato o Fosfato), Sulfanilamina (Si o No) y la cantidad de Penicilina (para la cual se seleccionaron tres niveles entre 0 y 500 miligramos). a) Defina los factores, los niveles asociados a ´estos y la variable respuesta en este experimento. b) Defina la UE, los tratamientos y la clase de experimento. ˆ Factores: Diluentes de semen (Reducido, Sulfanilamina, Penicilina). ˆ Niveles: Reducido (Citrato o Fosfato), Sulfanilamina (Si o No), Penicilina (N1,N2,N3). ˆ Unidades experimentales: Vacas lecheras seleccionadas para el estudio. Dise˜ no de experimentos (2018)

3

Conceptos b´ asicos del dise˜ no experimental

ˆ ˆ ˆ ˆ

Unidades observacionales: Vacas lecheras inseminadas. Tratamiento: 12 Muestras de semen diluidas con combinaciones de los niveles descritos. Variable respuesta: Tasa de concepci´on. Tipo de experimento:?.

c) Escriba el modelo lineal para el dise˜ no propuesto en b., realizando los supuestos apropiados sobre el mismo. 5. Suponga que se planea investigar el efecto del salario y el tiempo de la jornada de trabajo sobre la producci´ on de los trabajadores en una empresa manufacturera. Tanto el salario como el tiempo de la jornada de trabajo se establecer´an en tres niveles y se observa la productividad en todas las combinaciones de estos factores. a) Lleve a cabo una descripci´ on completa del experimento especificando: objetivos, poblaci´on, factores, unidades experimentales, unidades observacionales y variables respuesta. b) Identifique los tratamientos y el tipo de experimento que se trata. ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ

Objetivos: Factores: Niveles: Unidades experimentales: Unidades observacionales: Tratamiento: Variable respuesta: Tipo de experimento:

c) Indique un m´etodo de aleatorizaci´on apropiado para el experimento. Aqu´ı podemos aplicar f´ acilmente (Ya tenemos una lista) el m´etodo de coordenado negativo para asignar los tratamiento aleatoriamente. 6. Un grupo de investigadores trabaja para producir huevos de gallina con alto contenido de omega 3. Para ello se consideraron: cuatro razas de gallina en cinco fincas seleccionadas aleatoriamente, tres tipos de alimentos (uno de ellos es un placebo). Como parte del estudio se toman tres huevos de cada gallina y cada uno de estos es evaluado por dos expertos que miden el contenido de omega 3 en el huevo. a) Defina la unidad experimental, la unidad muestral (si la hay), los factores, los niveles, los tratamientos y la variable respuesta en este estudio. b) Proponga y haga los supuestos necesarios sobre el modelo para llevar a cabo el an´alisis de ´esta informaci´ on. Enm´ arquelo dentro de los tres principios b´asicos del dise˜ no de experimentos propuestos por Fisher. 7. Una salida de una muestra aleatoria se muestra a continuaci´on. Algunas cantidades est´an faltando. Calcule los valores de las cantidades faltantes. Variable Y

N 16

Mean (24.99069)

SE Mean 0.159

La media se encuentra como x ¯=

Std. Dev. (0.636)

PN

i=1

N

xi

=

Sum 399.851

399.851 16

[1] 24.99069 La desviaci´ on est´ andar la podemos en contrar en el error est´andar de la media SEMean = √ s = 0.159 · 16

√s N

as´ı

Dise˜ no de experimentos (2018)

4

Conceptos b´ asicos del dise˜ no experimental

[1] 0.636 8. Suponga que estamos probando H0 : µ1 = µ2 versus H1 : µ1 6= µ2 , donde los dos tama˜ nos de muestra son n1 = n2 = 12. Ambos varianzas muestrales son desconocidas pero asumidas iguales. Encuentre los limites del p-valor para los siguientes valores observados de la estad´ıstica de prueba. El p-valor para una prueba de dos colas se encuentra como 2 · P (|T (X)| > t0 ) en este caso el T(X) es una estad´ıstico que tiene distribuci´on t-student con 12 + 12 − 2 = 22 grados de libertad. As´ı los p-valores son a) t0 = 2.30 [1] 0.03130869 b) t0 = 3.41 [1] 0.002510658 c) t0 = 1.95 [1] 0.06403353 d) t0 = −2.45 [1] 0.02270774 9. Un programa de computador a producido la siguiente salida por un problema de prueba de hip´otesis Difference in sample means: 11.5 Degrees of freedom: 24 Standard error of the difference in sample means: ? Test statistic: t0 = -1.88 P-value: 0.0723 a) ¿Cu´ al es el valor faltante para el error est´andar? Tenemos el estad´ıstico de prueba para la diferencia de medias de una poblaci´on con varianzas iguales como ¯1 − X ¯2 X |T (X)| = q 2 s1 s22 n1 + n2 | − 1.88| = q s

11.5 s21 n1

+

s22 n2

s21 s2 + 2 = 6.1170 n1 n2

Luego el error est´ andar de la diferencia de medias en la muestra es de 6.1170. b) ¿Es una prueba de dos colas o una cola? Es una prueba de dos colas ya que el pvalor se calcul´o 2 · P (|T (X)| > t0 ) [1] 0.07230071 c) Si α = 0.05 ¿Cu´ ales son sus conclusiones? Como p-valor= 0.0723 rechazamos para α > 0.0723, luego en este caso se acepta H0 con un 95 % de confianza. d) Encuentre un intervalo de confianza de dos lados del 95 % para la diferencia de medias. s ¯1 − X ¯ 2 ± t22;0.025 X

s21 s2 + 2 n1 n2

11.5 ± 2.064 · 6.117 Dise˜ no de experimentos (2018)

5

Conceptos b´ asicos del dise˜ no experimental

LI LS 1 24.12487 -1.124868 10. Considere la salida de computador mostrada a continuaci´on One-Sample T: Y Test of mu=25 vs >25 Variable N Mean Std. Dev. SE Mean Y 12 25.6818 ? 0.3360

95% Lower Bound T P ? ? 0.034

a) ¿Cu´ antos grados de liberta hay en la estad´ıstica t? N − 1 = 11 b) Complete la informaci´ on faltante √ La desviaci´ on est´ andar sera s = 0.3360 · 12 [1] 0.09699485 El l´ımite inferior del intervalo confianza del 95 % ser´a 25.6818 − t11;0.025 ·

0.097 √ 12

[1] 24.94227 El estad´ıstico T(X) para la prueba se calcula t0 =

x ¯−µ √S N

[1] 2.029167 11. El di´ ametro de los ejes de acero producidos por cierto proceso manufacturero deber´ıan tener di´ametro de 0.255 pulgadas. Se sabe que el di´ ametro tiene una desviaci´on est´andar de σ = 0.0001 pulgadas. Una muestra aleatoria de 10 ejes tiene un di´ametro medio de 0.2545 pulgadas. a) Haga una hip´ otesis apropiada de la media µ H0 : µ = 0.255

H1 : µ 6= 0.255

b) Pruebe la hip´ otesis usando α = 0.05. ¿Cu´ales son sus conclusiones? Para probar la hip´ otesis se establece una regi´on de rechazo RR como RR = {t0 : |t0 | > z1− α2 }. As´ı para el α dado se tiene RR = {t0 : |t0 | > 1.96} y t0 = 0.2545−0.255 0.0001 10

[1] -15.81139 Como el estad´ıstico pertence a RR se rechaza H0 , es decir hay evidencia estad´ıstica para decir que la media del di´ ametro de los ejes de acero no es 0.255. c) Encuentre el p-valor para este test Se calcula como 2 · P (|T (X)| > t0 ) [1] 2.596807e-56 d) Construya un intervalo de confianza del 95 % para la media del di´ametro del eje. √ 0.2545 ± z α2 · 0.0001 10 LI LS 1 0.254438 0.254562 Se esperaria con un 95 % de confianza la media de los di´ametros del eje este ente 0.25444 y 0.25456 pulgadas. 12. El tiempo para reparar un instrumentos electr´onico tiene una distribuci´on normal medida en horas. Los tiempos de reparaci´ on para 16 de esos instrumentos escogidos aleatoriamente son como siguen a) Se desea saber si el tiempo medio de reparacipon excede 225 horas. Desarrolle una hip´ otesis apropiada para investigar este problema. H0 : µ = 225

H1 : µ > 225 Dise˜ no de experimentos (2018)

6

Conceptos b´ asicos del dise˜ no experimental

159 224 222 149

Horas 280 101 379 179 362 168 260 485

212 264 250 170

b) Pruebe la hip´ otesis que se formul´o en la parte (a). ¿Cu´ales son sus conclusiones? Use α = 0.05 RR = {t0 : t0 > tn−1;1− α2 } donde t0 = x¯√−µ ı t0 es s . En este caso RR = {t0 : t0 > 1.7530}, as´ n

0.6685. Como t0 no est´ a en RR se acepta H0 , es decir hay evidencia estad´ıstica que indique que el tiempo medio de reparaci´ on no excede las 225 horas. c) Encuentre el p-valor de la prueba. p-valor= P (T (X) > t0 ) [1] 0.2569801 d) Construya un intervalo de confianza del 95 % para la media del tiempo de reparaci´on. Se calcula x ¯ ± tn−1;1− α2 · √sn LI LS 1 188.8927 294.1073 Se espera con un 95 % que el tiempo medio de reparaci´on de los instrumentos este entre 188.89 y 294.11 horas. 13. Los siguientes datos corresponde al tiempo (en minutos) en que unas bengalas qu´ımicas demoran en quemarse con dos diferentes formulas. Los ingenieros de dise˜ no est´an interesados en ambas la media y la varianza de los tiempos de quemarse. Tipo 1 65 82 81 67 57 59 66 75 82 70

Tipo 2 64 56 71 69 83 74 59 82 65 79

a) Pruebe la hip´ otesis que las dos varianzas son iguales. Use α = 0.05 RR = {t0 : t0 < Fnn21; α o t0 > Fnn21;1− α }, para este caso RR = {t0 : t0 < 0.248 o t0 > 4.026} y t0 =

s21 s22

2

2

[1] 0.9782168 Como t0 ∈ / RR se acepta H0 , es decir hay evidencia estad´ıstica que soporte que las varianzas son iguales. b) Usando el resultado de (a). pruebe la hip´otesis que la media de los tiempos de quemado son iguales. Use α = 0.05. ¿Cu´ al es el p-valor para esta prueba? Con el resultado de la parte (a) podemos realizar una prueba t para la diferencia de medias, donde x ¯1 − x ¯2 y la regi´on de rechazo est´a dada por RR = {t0 : |t0 | > 2.1}. As´ı el estad´ıstico es t0 = q 1 S n1 + n12 el estad´ıstico es [1] 0.04800768 Por lo tanto se acepta H0 es decir hay evidencia estad´ıstica para decir que la media de los dos tiempo de quemado son iguales. Y adem´as el p-valor es de [1] 0.9622388 Dise˜ no de experimentos (2018)

7

Conceptos b´ asicos del dise˜ no experimental

75 70

Fórmula 2

65

70

55

60

60

65

Fórmula 1

75

80

80

c) Discuta el papel de la suposici´ on de normalidad en este problema. Revise el supuesto e normalidad en ambos tipos de bengala. Para que las pruebas anteriores sean concluyentes nuestras variables tienen que provenir de una distribuci´ on normal, esto ya que las estad´ısticos de prueba T (x) est´an construidos en base a esta suposici´ on. Luego antes de realizar cualquie prueba de hipotesis en base a alguno de estos estadisticos primero hay que probar normalidad.

−1.5

−1.0

−0.5

0.0

0.5

1.0

1.5

−1.5

−1.0

norm quantiles

−0.5

0.0

0.5

1.0

1.5

norm quantiles

Figura 1: Gr´ aficos de normalidad

Una forma de probar normalidad es mediante Q-Qplot que compara los datos con los cuantiles de una distribucion normal, luego si exite normalidad esperar´ıamos encontrar una superposiciones de los puntos sobre la recta y=x. En este caso para los datos de la bengala Tipo 2 se podr´ıa asegurar que es posible que provengan de una distribuci´on normal, lo que no sucede con los datos de las bengalas Tipo 2, luego nuestras estad´ısticas de prueba podr´ıan estar afect´andose por este hecho. 14. Las carcasas para celulares son manufacturadas en un proceso de moldeado por inyecci´on. El tiempo que la parte se enfr´ıa en el molde antes de ser removido est´a influenciado por la ocurrencia de algunos problemas cosm´eticos, lineas de flujo en la carcasa finalizada. Despu´es de su manufactura, las carcasas se inspeccionan visualmente y reciben un puntaje de 1 a 10 basado en su apariencia, donde 10 corresponte a una parte perfecta y 1 a completamente defectuosa. Un experimento se llev´o a cabo usando dos tiempo de enfriado, 10 y 20 segundo, 20 carcasas fueron evaluadas en cada nivel de tiempo de enfriado. Todas las 40 observaciones en el experimentos fueron obtenidas en un orden aleatorio. Los datos son los siguiente. 10 segundos 1 3 2 6 1 5 3 3 5 2 1 1 5 6 2 8 3 2 5 3

20 segundos 7 6 8 9 5 5 9 7 5 4 8 6 6 8 4 5 6 8 7 7

a) ¿Hay evidencia que soporte la afirmaci´on que el tiempo de enfriado m´as largo resulta en menor defectos de apariencia? Use α = 0.05 Para poder realizar la prueba diferencia de medias primero probamos la hip´otesis: Dise˜ no de experimentos (2018)

8

Conceptos b´ asicos del dise˜ no experimental

H0 : σ2 = σ1 vs H1 : σ2 6= σ1 F test to compare two variances data: dtip1 and dtip2 F = 1.7011, num df = 19, denom df = 19, p-value = 0.2559 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.6733205 4.2977738 sample estimates: ratio of variances 1.701111 En base a ello no podemos usar el estad´ıstico de prueba para poblaciones con varianzas iguales, para este caso tenemos que considerar una prueba con varianzas desconocidas y diferentes. H0 : µ2 = µ1 vs H1 : µ2 > µ1 ¯1 − X ¯2 X ∼ tν T (X) = q 2 S22 S1 + n1 n2 S12 n1

ν=

22 S1 n1

n1 −1

+ +

S22 n2

2

22 S2 n2

n2 −1

As´ı RR = {t0 : t0 > 1.689} y el estad´ıstico es [1] 5.569611 Por lo tanto se rechaza H0 con un 95 % de confianza, evidencia de que la media del tiempo de enfriado m´ as largo resulta mayor es decir en menores defectos de apariencia. b) ¿Cu´ al es el p-valor de la prueba en la parte (a)? [1] 2.705576e-06 c) Encuentre un intervalo de confianza del 95 % para la diferencia de media. D´e una interpretaci´ on pr´ actica de este intervalo. De igual forma como no se cumple la hip´otesis H0 : σ2 = σ1 tenemos que calcular nuestro intervalo de confianza con un estad´ıstico que no dependa de este supuesto usando. s 2 2 ¯1 − X ¯ 2 ± tν;0.025 S1 + S2 X n1 n2 LI LS 1 2.002527 4.297473 Con un 95 % de confianza podemos afirmar que la diferencia entre los puntajes obtenidos entre los tiempos de enfriado de 20 y 10 segundos esta entre 2 y 4 puntos de calificaci´on. d) Dibuje los diagramas de puntos para ayudar a la interpretaci´on de los resultados de este experimento.

Dise˜ no de experimentos (2018)

9

10s

20s

Conceptos b´ asicos del dise˜ no experimental

2

4

6

8

Figura 2: Gr´ aficos de puntos

El grafico 2 muestra que los dos tiempos de enfriamiento pueden diferir en el puntaje medio, ademas el tiempo de enfriamiento de 10 segundos precenta mayor variabilidad que el de 20 segundos.

9 20s 4

1

2

5

3

6

4

10s

5

7

6

8

7

8

e) Verifique los supuestos de normalidad de los datos de este experimento.

−2

−1

0

1

2

norm quantiles

−2

−1

0

1

2

norm quantiles

Figura 3: Gr´ aficos de normalidad

Como se hizo en un punto anterior, evaluaremos la normalidad de los datos por medio de los qqplot. En la figura 3 para los datos que tienen un tiempo de enfriado de 10 segundos existen problemas en la parte central de la distribuci´on luego podr´ıa afectar el supuesto de normalidad y por lo tanto la prueba de hip´ otesis, por el contrario para el tiempo de enfriado de 20 segundos los datos parecen seguir una tendencia lineal con presencia de algunos valores at´ıpicos. 15. Un art´ıculo en Journal of Strain Analysis (vol. 18,no. 2, 1983) compara varios procedimientos para predecir la resistencia al corte para vigas de chapa de acero. Los datos de nueve vigas en la forma del radio y de la carga observada y de la pronosticada para dos de estos procedimientos, los metodos Karlsruhe y Lehigh son como siguen: a) ¿Hay evidencia que soporte la afirmaci´on que existe una diferencia en la media del procedimiento entre los dos m´etodos? Use α = 0.05 De igual manera probamos primero la hipotesis H0 : σ2 = σ1 vs H1 : σ2 6= σ1 F test to compare two variances data: dK and dL F = 8.7454, num df = 8, denom df = 8, p-value = 0.006008 alternative hypothesis: true ratio of variances is not equal to 1 Dise˜ no de experimentos (2018)

10

Conceptos b´ asicos del dise˜ no experimental

Girder S1/1 S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4

Karlsruhe Method 1.186 1.151 1.322 1.339 1.200 1.402 1.365 1.537 1.559

Lehigh Method 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052

95 percent confidence interval: 1.972674 38.770520 sample estimates: ratio of variances 8.745375 Con ello rechazamos la hipotesis nula, es decir no podemos suponer que las varianzas son iguales, luego usamos el mismo estadistico prueba del ejercicio anterior. Donde RR = {t0 : |t0 | > 2.2341} y el estad´ıstico es [1] 5.330156 Por lo tanto se rechaza H0 : µK = µL , es decir existe evidencia que hay una diferencia en la medida del procedimiento de los dos m´etodos. b) ¿Cu´ al es el p-valor para la prueba de la parte (a)? [1] 0.0003556658 c) Construya un intervalo de 95 % de confianza para diferencia de media para la carga pronosticada de la observada. Del mismo modo usamos el estadistico para intervalo de confianza del ejercicio anterior. LI LS 1 0.1590886 0.3886892 d) Investigue los supuesto de normalidad de ambas muestras. Figura 4: Gr´ aficos de normalidad

Para investigar los supuestos de normalidad contamos con los qqplot, en la figura 4 vemos que los datos del m´etodo de Karlsruhe tienden a seguir la tendecia a pesar de algunos datos, por el contrario para los datos del m´etodo de Lehigh se ve que viola este supuesto. e) Investigue el supuesto de normalidad para la diferencia de radios de los dos m´etodos. Figura 5: Gr´ aficos de normalidad

En el caso de la diferencia de los radios de los dos m´etodos la gr´afica 5 muestra valores at´ıpicos que pueden resultar en colas pesadas, por su parte en la parte central se encuentra los datos cercanos a la recta. f) Discuta el papel que tiene el supuesto de normalidad en la prueba t. Solo si los datos provienen de una distribuci´ on normal podemos crear el estad´ıstico T(X) con distribuci´on t, as´ı cuando no se tiene el supuesto las conclusiones que demos no tendran el nivel de confianza establecido y llevan a conclusiones erradas.

Dise˜ no de experimentos (2018)

11

Conceptos b´ asicos del dise˜ no experimental

16. Dos populares medicamentos para el dolor est´an siendo comparados en base a la velocidad de absorci´ on por el cuerpo. Especificamente, se afirma que la tableta 1 se absorbe el doble de rapido que la tableta 2. Asuma que σ12 y σ22 son conocidos. Desarrolle la estad´ıstica de prueba para: H0 : 2µ1 = µ2 H1 : 2µ1 6= µ2 2

2

σ 4σ Suponiendo que son independiente se demostrar que si t˜1 ∼ N (µ1 , n11 ) entonces 2t˜1 ∼ N (2µ1 , n11 ). Usando esta tenemos que: σ2 4σ 2 2t˜1 − t˜2 ∼ N (2µ1 − µ2 , n11 + n22 ) Luego bajo la hip´ otesis H0 tenemos nuestro estad´ıstico de prueba como:

17. Considere el experimento de los tiempos en que se quema la bengala para dos diferentes f´ormulas qu´ımicas (ejercicio 13). Si el tiempo medio en que se queman dos bengalas difiere como mucho en 2 minutos, encuentre la potencia de la prueba. ¿Qu´e tama˜ no de muestra podr´ıa requerise para detectar una diferencia de un minuto en el tiempo medio de quemarse con una potencia al menos de 0.90? Tenemos la prueba H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 = µk ; µk > 0. consideremos la funci´on potencia β(µk ) = Pµk [Rechazar H]   x ¯ − x ¯ 1 2 > t2n−2;α  β(µk ) = Pµk  q 2 s n   µk x ¯1 − x ¯ − µk q2 > t2n−2;α − q  β(µk ) = Pµk  2 s n s n2 x ¯1 − x ¯ − µk H1 q2 ∼ t2n−2 s n2   µ k β(µk ) = Pµk T > t2n−2;α − q  s n2 T =

Ahora para el valor dado α = 0.05 y de 2 minutos se tiene µk = 2 entonces la  que difieren como mucho  2√ potencia de la prueba es de β(2) = Pµk T > t18;α − 2 0.315

10

[1] 0.1129443 Si se desea una potencia de al menos 0.9 cuando µk = 1 se desarrolla

As´ı se requiere una muestra de al menos 1629.84 bengalas por cada tipo de f´ormula.

Dise˜ no de experimentos (2018)