Exposiciones Total

DISEÑO FACTORIAL 𝟐𝟐 El primer diseño que se piensa abordar es el diseño que tiene dos factores, A y B; y cada uno tiene

Views 118 Downloads 2 File size 531KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

DISEÑO FACTORIAL 𝟐𝟐 El primer diseño que se piensa abordar es el diseño que tiene dos factores, A y B; y cada uno tiene dos niveles, alto (+) y bajo (-). Para los diseños de tipo factorial se acostumbra a realizar n repeticiones por tratamiento, abarcando un mayor margen de información con respecto a los diseños en bloque. Cabe mencionar que el orden para realizar cada corrida experimental es completamente aleatorio, lo que supone un trabajo más arduo a la hora de preparar la experimentación, ya que a diferencia del diseño de bloque se podía elegir un orden en particular. Es importante aclarar que para el análisis de estos diseños se suponen que 1. Los factores en todo tiempo son fijos. 2. Los diseños son completamente aleatorizados. 3. Se satisfacen los supuestos de normalidad usuales. Una forma para ordenar la información en un diseño factorial 22 con 𝑛 replicas es la siguiente: Factor A B + +

+ +

Combinación de tratamientos A bajo, B bajo A alto, B bajo A bajo, B alto A alto, B alto

1 (1)1 𝑎1 𝑏1 𝑎𝑏1

Replica 2 (1)2 𝑎2 𝑏2 𝑎𝑏2

Total ... ... ... ... ...

n (1)𝑛 𝑎𝑛 𝑏𝑛 𝑎𝑏𝑛

𝑛

∑(1)𝑘 = (1) 𝑘=1 𝑛

∑ 𝑎𝑘 = 𝑎 𝑘=1 𝑛

∑ 𝑏𝑘 = 𝑏 𝑘=1 𝑛

∑ 𝑎𝑏𝑘 = 𝑎𝑏 𝑘=1

de manera gráfica se puede observar de la siguiente manera:

Ejemplo 2.1 de diseño 𝟐𝟐 Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes sobre el crecimiento de un virus particular. Se realizan seis réplicas de un diseño 2^2, haciendo las corridas de manera aleatoria. Se requiere analizar los datos del crecimiento viral que se presentan enseguida y sacar conclusiones apropiadas. Tiempo (hrs)

Medio de cultivo 2

1

12

21 22 23 28 20 26 37 39 38 38 35 36

18

25 26 24 25 29 27 31 34 29 33 30 35

Ejemplo 2.2 de diseño 𝟐𝟐 Un ingeniero industrial empleado por una compañía refresquera está interesado en los efectos de dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto. Los dos tipos de botellas son de vidrio y de plástico. Se usan dos empleados para realizar una tarea que consiste en mover 40 cajas de producto 50 pies en una plataforma de carga estándar y acomodarlas en un estante de venta. Se hacen cuatro réplicas de un diseño factorial 22 y los tiempos observados se enlistan en la siguiente tabla. Tipo de botella Vidrio Plástico

Empleado 2

1 5.12 4.98 4.95 4.27

4.89 5.00 4.95 4.25

6.65 5.49 5.28 4.75

6.24 5.55 4.91 4.71

Como observamos los experimentos del tipo factorial tienen características muy sencillas en cuanto a la concepción, pero exigen una mayor demanda al momento de experimentar por la cantidad de corridas experimentales que se pueden llegar a realizar y lo costoso que puede resultar eso. Efectos principales y de interacción. Definimos el efecto de A en el nivel bajo de B como 𝐴− = [𝑎 − (1)]/𝑛. Definimos el efecto de A en el nivel alto de B como 𝐴+ = [𝑎𝑏 − 𝑏]/𝑛.

Definimos el efecto de B en el nivel bajo de A como 𝐵 − = [𝑏 − (1)]/𝑛. Definimos el efecto de B en el nivel alto de A como 𝐵 + = [𝑎𝑏 − 𝑎]/𝑛. Donde observamos que una de estas definiciones es el promedio de las diferencias entre los niveles al dejar fijo un nivel en el otro factor. Podemos asumir que mientras más grande este número mayor es la diferencia entre los niveles. El efecto principal de A se obtiene de la siguiente manera 𝐴 = [𝐴− + 𝐴+ ]/2 y el efecto principal de B se obtiene como 𝐵 = [𝐵 − + 𝐵 + ]/2 donde observamos que cada uno es el promedio entre las dos variaciones y nos da una manera de medir que tanto varía en general pasar de un nivel a otro independientemente del nivel de factor de el otro factor. El efecto de la interacción AB se obtiene de la siguiente manera 𝐴𝐵 = [𝐴+ − 𝐴− ]/2 = [𝐵 + − 𝐵 − ]/2 Ejemplo 2.3 Un experimento es realizado para investigar la distorsión de los engranajes de transmisión en automóviles. Se incluyeron dos factores para determinar los efectos, es decir, el tamaño del engranaje (Y1) y la posición de la pieza (Y2). En la siguiente tabla se muestra un estudio de ocho engranajes para cada combinación de tamaño de diente y posicionamiento de la pieza. Tamaño del engranaje

Posición Y2 (-)

Y1(-)

Y1(+)

18.0 16.5 26.0 22.5 21.5 21.0 30.0 24.5 27.5 19.5 31.0 27.0 17.0 14.0 18.0 17.5

Y2 (+) 13.5 8.5 11.5 16.0 -4.5 4.0 1.0 9.0 17.5 11.5 10.0 1.0 14.5 3.5 7.5 6.5

Para dicho ejemplo calcularemos los efectos principales y de interacción, primero llevaremos la información a otra forma de analizarlo: Factor Y1 Y2 + + + +

Combinación de tratamientos Y1 bajo, Y2 bajo Y1 alto, Y2 bajo Y1 bajo, Y2 alto Y1 alto, Y2 alto

1 18 27.5 13.5 17.5

2 16.5 19.5 8.5 11.5

3 26 31 11.5 10

Replica 4 5 22.5 21.5 27 17 16 -4.5 1 14.5

Total 6 21 14 4 3.5

7 30 18 1 7.5

8 24.5 17.5 9 6.5

(1) =180 𝑎 =171.5 𝑏 = 59 𝑎𝑏= 72

luego 𝐴− = −1.0625 𝐴+ = 1.625 𝐵− = −15.125 𝐵+ = −12.4375 𝐴 = 0.281 𝐵 = −13.781 𝐴𝐵 = 1.3437

Representación gráfica de los efectos principales e interacción. Para hacer una representación gráfica de los efectos principales de un diseño 22 se empieza por establecer en el eje horizontal los dos niveles de factor y en el eje vertical la media de la respuesta observada en los correspondientes niveles como se observa en el siguiente gráfico: COMO LO EXPLICO PORQUE PULIDO NO EXPLICA BIEN Representación gráfica del ejemplo NECESITO PREGUNTARTE COMO HACER ESTO

ANOVA E HIPÓTESIS EN EL DISEÑO FACTORIAL 22 Representación geométrica de la notación de Yates. La notación de Yates [(1), a, b, ab] tiene un significado diferente a las demás: con ella se representa el total o la suma de las observaciones en cada tratamiento. La lógica de la notación de Yates es la siguiente: si una letra minúscula está presente, entonces el factor

correspondiente se encuentra en su nivel alto; si está ausente, el factor está en su nivel bajo. De esta forma los datos se verían gráficamente como se muestra en la figura. El área limitada por este cuadrado se conoce como región experimental y las conclusiones que se obtengan del experimento sólo tienen validez sobre esta región. En el ejemplo2.3 la representación geométrica de la notación Yates se ve como:

Experimentación factorial vs mover un factor a la vez _ Factor B +

Supongamos que se tienen dos factores digamos, A y B, con dos niveles cada uno; a-, a+ y b-, b+. Si hiciéramos variar un factor a la vez obtendríamos la información que se muestra en la figura.

a- b +

a- b -

Factor A

a+ b +

El efecto de variar el factor A es: a+ b- - a- b- y el efecto de variar el factor B es: a- b+ - a- b-. Para reducir el error experimental es deseable realizar dos repeticiones, y los efectos de los factores se estimarían con las respuestas promedio. Pero para esto se necesita un total de seis observaciones. En cambio, si se hace mediante la experimentación factorial, se tendría adicionalmente el registro a+ b+. Con estas cuatro observaciones se obtienen dos estimaciones del efecto del factor A: a+ b- - a- b- y a+ b+ - a- b+. Y dos estimaciones del efecto del factor B: a- b+ - a- b- y a+b+ - a+ b-. Y así obtener las estimaciones promedio de los efectos con la misma precisión que las estimaciones del experimento de un solo factor, con menos observaciones en total. Ahora supongamos que está presente una interacción. Si en el diseño de un factor a la vez indicara que a- b+ y a+ b- dieron mejores respuestas que a- b-, esto nos podría llevar a concluir que a+ b+ sería todavía mejor. Lo cual no necesariamente es cierto si hay interacción entre los factores.

Así, el diseño factorial reduce el error sin tener que hacer más observaciones esto resulta económico en el material experimental al obtener información sobre varios factores sin aumentar el tamaño del experimento. Se obtiene más información que en un experimento de un solo factor pues permite el estudio de la interacción y esto ayuda a dar mejores conclusiones del experimento. Ventajas de realizar un diseño factorial Permiten estudiar el efecto individual y de interacción de los distintos factores. Se pueden aumentar para formar diseños compuestos. Se pueden correr fracciones de diseños factoriales, las cuales son de gran utilidad en las primeras etapas de una investigación que involucra a muchos factores. Pueden utilizarse en combinación con diseños de bloques. La interpretación y el cálculo de los efectos en los experimentos factoriales se puede hacer con aritmética elemental, en particular cuando cada factor se prueba en dos niveles. Modelo matemático Supongamos que se tienen los factores A y B, con dos niveles cada uno. Supongamos también que se hicieron n repeticiones. El orden en que se hacen las 2*2*n observaciones se selecciona al azar, por lo que es un diseño completamente aleatorizado El modelo estadístico de efectos está dado por: 𝑌𝑖𝑗𝑘 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽)𝑖𝑗 + 𝜖𝑖𝑗𝑘

𝑖 = 1, 2 { 𝑗 = 1, 2 𝑘 = 1, … , 𝑛

donde μ es la media global, αi es el efecto debido al i-ésimo nivel del factor A, βi es el efecto debido al j-ésimo nivel del factor B, (αβ)ij representa al efecto de interacción de A y B en la combinación ij y εijk es el error aleatorio. Condiciones del modelo 𝜖𝑖𝑗𝑘 ~ 𝑁(0, 𝜎 2 ) independientes entre sí y con varianza constante. ❖ ∑2𝑖=1 𝛼𝑖 = 0 ❖ ∑2𝑗=1 𝛽𝑗 = 0 ❖



∑2𝑗=1 ∑2𝑖=1 𝛼𝑖 𝛽𝑗 = 0

Hipótesis 𝐻0 ∶ 𝛼1 = 𝛼2 = 0 𝐻𝐴 ∶ 𝛼𝑖 ≠ 0 para algún 𝑖

𝐻0 ∶ 𝛽1 = 𝛽2 = 0 𝐻𝐴 ∶ 𝛽𝑗 ≠ 0 para algún 𝑗

𝐻0 ∶ (𝛼𝛽)𝑖𝑗 = 0 para todo 𝑖𝑗 𝐻𝐴 ∶ (𝛼𝛽)𝑖𝑗 ≠ 0 para algún 𝑖𝑗

Análisis de varianza NOTACIÓN: 2

𝑛

2

𝑌 … = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘

𝑌̅ … =

𝑌… 4𝑛

𝑌̅𝑖 . . =

𝑌𝑖 . . 2𝑛

𝑖 = 1, 2

𝑌̅.𝑗 . =

𝑌.𝑗 . 2𝑛

𝑗 = 1, 2

𝑌̅𝑖𝑗 . =

𝑌𝑖𝑗 . 𝑛

𝑖=1 𝑗=1 𝑘=1 𝑛

2

𝑌𝑖 . . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑗=1 𝑘=1 𝑛

2

𝑌.𝑗 . = ∑ ∑ 𝑌𝑖𝑗𝑘 𝑖=1 𝑘=1 𝑛

𝑌𝑖𝑗 . = ∑ 𝑌𝑖𝑗𝑘 𝑘=1

Tabla ANOVA Fuente de Suma de Cuadrados Variación 2 Efecto A 𝑌2𝑖 . . 𝑌2 … 𝑆𝐶𝐴 = ∑ − 2𝑛 4𝑛

G.L.

CM

F0

1

𝐶𝑀𝐴

𝐶𝑀𝐴 𝐶𝑀𝐸

1

𝐶𝑀𝐵

𝐶𝑀𝐵 𝐶𝑀𝐸

1

𝐶𝑀𝐴𝐵

𝐶𝑀𝐴𝐵 𝐶𝑀𝐸

4(n-1)

𝐶𝑀𝐸

𝑖=1

Efecto B

2

𝑆𝐶𝐵 = ∑ 𝑗=1

𝑌 2 .𝑗 . 𝑌 2 … − 2𝑛 4𝑛

2

Efecto AB

2

𝑆𝐶𝐴𝐵 = ∑ ∑ 𝑖=1 𝑗=1

Error Total

𝑌 2 𝑖𝑗 . 𝑌 2 … − − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 𝑛 4𝑛

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵 2

2

𝑛

𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑌 2 𝑖𝑗𝑘 − 𝑖=1 𝑗=1 𝑘=1

𝑌2 … 4𝑛

4n-1

Valor p

Los Cuadrados Medios es la división de su Suma de Cuadrados entre sus respectivos grados de libertad. Recordemos que F0 ~ 𝐹(1 − 𝛼, 𝑔. 𝑙., 4(𝑛 − 1) ). Notemos que los grados de libertad de la suma de cuadrados del error son 4(n-1), por lo cual se necesitan al menos dos repeticiones para poder construir la tabla ANOVA. Si el valor-p es menor al nivel de significancia α prefijado, se rechaza la hipótesis nula y se concluye que el correspondiente efecto influye en la variable respuesta.

MODELO DE REGRESIÓN Y VERIFICACIÓN DE SUPUESTO DE DISEÑOS FACTORIALES 𝟐𝟐 Supuestos del diseño 𝟐𝟐 Los supuestos del modelo de un diseño 22 son los siguientes: • • •

Los errores siguen una distribución normal. La varianza de cada tratamiento es constante. Los datos son independientes entre sí.

La verificación de los supuestos se puede hacer mediante el software estadístico de R mediante las pruebas de hipótesis convencionales. Supuesto Normalidad Homocedasticidad Independencia

Prueba Kolmogorov o Shapiro-Wilk Levene o Barlett Durbin-Watson

Verificación de los supuestos para el ejemplo 1 El primer paso para verificar los supuestos del ejemplo 1 es establecer una forma de como introducir los datos a R. A continuación, se muestra el formato que se le puede dar al ejemplo 1: Tamaño Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo

Posición Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo

Distorsión 18 16.5 26 22.5 21.5 21 30

Y1bajo Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1bajo Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto Y1alto

Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2bajo Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto Y2alto

24.5 27.5 19.5 31 27 17 14 18 17.5 13.5 8.5 11.5 16 -4.5 4 1 9 17.5 11.5 10 1 14.5 3.5 7.5 6.5

La anterior tabla se puede convertir desde Excel a un documento de texto delimitado por tabulaciones y ser leído así en R. Una vez leído en el formato correcto en R la forma de ingresar los datos para considerar la interacción es con la siguiente línea de código resultados