Trabajo - Prueba de Hipotesis

UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DEPARTAMENTO DE INVESTIGACIÓN DE OPERACIONES ESTOCAS

Views 95 Downloads 0 File size 562KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD DE LOS ANDES FACULTAD DE INGENIERÍA ESCUELA DE SISTEMAS DEPARTAMENTO DE INVESTIGACIÓN DE OPERACIONES ESTOCASTICA II

Prueba de Hipótesis Prof.: Daniela de la Rosa José Romero 23782765 Keiswuer Chirinos 24139094 Nathaly Briceño 20766037

Mérida, 2015 1

Prueba de Hipótesis

Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para toda la población. Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero.

Con base en los datos de la muestra, la prueba determina si se debe rechazar la hipótesis nula. Para tomar la decisión se utiliza un valor p. Si el valor p es menor que o igual al nivel de significancia, que es un punto de corte que usted define, entonces puede rechazar la hipótesis nula. Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas para seleccionar la más probable de dos hipótesis. En realidad, una prueba mantendrá la validez de la hipótesis nula hasta que haya suficiente evidencia (datos) en favor de la hipótesis alternativa.

Introducción a la Prueba de Hipótesis

Error Tipo I Si rechaza la hipótesis nula cuando ésta es verdadera, usted comete un error de tipo I. La probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que usted establece para su prueba de hipótesis. Un α de 0.05 indica que usted está dispuesto a aceptar una probabilidad de 5% de que está equivocado cuando rechaza la hipótesis nula. Para reducir este riesgo, debe utilizar un valor más bajo para α. Sin embargo, si utiliza un valor más bajo para alfa, significa que tendrá menos probabilidades de detectar una diferencia verdadera, si es que realmente existe.

2

Error de tipo II Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba. Puede reducir su riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica cuando ésta realmente exista.

La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β. Este valor es la potencia de la prueba.

Ejemplo de error de tipo I y tipo II

Para entender la interrelación entre los errores de tipo I y tipo II, y para determinar cuál error tiene consecuencias más severas según sea su caso, considere el siguiente ejemplo. Un investigador médico desea comparar la eficacia de dos medicamentos. Las hipótesis nula y alterna son: Hipótesis nula (H0): μ1= μ2 Los dos medicamentos tienen la misma eficacia. Hipótesis alternativa (H1): μ1≠ μ2 Los dos medicamentos no tienen la misma eficacia.

3

Un error de tipo I se produce si el investigador rechaza la hipótesis nula y concluye que los dos medicamentos son diferentes cuando, en realidad, no lo son. Si los medicamentos tienen la misma eficacia, el investigador podría considerar que este error no es muy grave, porque de todos modos los pacientes se beneficiarían con el mismo nivel de eficacia independientemente del medicamento que tomen. Sin embargo, si se produce un error de tipo II, el investigador no rechaza la hipótesis nula cuando debe rechazarla. Es decir, el investigador concluye que los medicamentos son iguales cuando en realidad son diferentes. Este error puede poner en riesgo la vida de los pacientes si se pone en venta el medicamento menos efectivo en lugar del medicamento más efectivo.

Cuando realice las pruebas de hipótesis, considere los riesgos de cometer errores de tipo I y tipo II. Si las consecuencias de cometer un tipo de error son más graves o costosas que cometer el otro tipo de error, entonces elija un nivel de significancia y una potencia para la prueba que reflejen la gravedad relativa de esas consecuencias.

Valores Críticos y Zona de Rechazo

En las pruebas de hipótesis, un valor crítico es un punto en la distribución de la prueba que se compara con el estadístico de prueba para determinar si puede rechazarse la hipótesis nula. Si el valor absoluto del estadístico de prueba es mayor que el valor crítico, usted puede declarar significancia estadística y rechazar la hipótesis nula. Los valores críticos están asociados con el nivel de significancia (α), así que sus valores se fijan cuando se elige el α de la prueba.

Valores críticos en la distribución normal estándar para α = 0.05 4

La Figura A muestra que los resultados de una prueba Z de una cola son significativos si el estadístico de prueba es igual a o mayor que 1.64, el valor crítico en este caso. El área sombreada representa el 5% (α) del área por debajo de la curva. La Figura B muestra que los resultados de una prueba Z de dos colas son significativos si el valor absoluto del estadístico de prueba es igual a o mayor que 1.96, el valor crítico en este caso. Las dos áreas sombreadas suman el 5% (α) del área por debajo de la curva.

Ejemplos del cálculo de valores críticos

En las pruebas de hipótesis, hay dos maneras de determinar si existe suficiente evidencia con base en la muestra para rechazar H0 o para no rechazar H0. La forma más común es comparando el valor p con un valor pre-especificado de α, donde α es la probabilidad de rechazar H0 cuando H0 es verdadera. Sin embargo, también puede comparar el valor calculado del estadístico de prueba con el valor crítico. Los siguientes son ejemplos de cómo calcular el valor crítico para una prueba t de 1 muestra y un ANOVA de un solo factor.

Uso de una prueba t de 1 muestra para calcular un valor crítico

Supongamos que usted está realizando una prueba t de 1 muestra con diez observaciones, tiene una hipótesis alternativa bilateral (es decir, H1 no es igual a) y está utilizando un nivel de significancia de 0.10:

   

Seleccione Calc > Distribuciones de probabilidad > t. Seleccione Probabilidad acumulada inversa. En Grados de libertad, ingrese 9 (el número de observaciones menos uno). En Constante de entrada, ingrese 0.95 (uno menos la mitad del nivel de significancia).

Esto da un valor crítico de 1.83311. Si el valor absoluto del estadístico t es mayor que este valor crítico, entonces usted puede rechazar la hipótesis nula, H0, en el nivel de significancia de 0.10.

5

Uso de un análisis de varianza (ANOVA) para calcular un valor crítico

Supongamos que usted está realizando un ANOVA de un solo factor con doce observaciones, el factor tiene tres niveles y usted está usando un nivel de significancia de 0.05:

    

Elija Calc > Distribuciones de probabilidad > F. Seleccione Probabilidad acumulada inversa. En Grados de libertad del numerador, ingrese 2 (el número de niveles del factor menor uno). En Grados de libertad del denominador, ingrese 9 (los grados de libertad para el error). En Constante de entrada, ingrese 0.95 (uno menos el nivel de significancia).

Esto da un valor crítico de 4.25649. Si el estadístico F es mayor que este valor crítico, entonces usted puede rechazar la hipótesis nula, H0, en el nivel de significancia de 0.05.

Prueba de Hipótesis de Una Cola

Una prueba de cualquier hipótesis estadística, donde la alternativa es unilateral como

Se denomina prueba de una sola cola. Por lo general, la región crítica para la hipótesis alternativa θ >θ0 yace en la cola derecha de la distribución del estadístico de prueba; en tanto que la región crítica para la hipótesis alternativa θ < θ0 yace en la cola izquierda.

6

Ejemplo de Prueba de Hipótesis de Una Cola

Ejemplo. Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de grasa saturada no excede de 1.5 gramos. Establezca las hipótesis nulas y alternativa a utilizar para probar esta afirmación y determinar dónde se localiza la región crítica. Solución. La afirmación del fabricante se debe rechazar sólo si μ es mayor que 1.5mg y no se debe rechazar si es menor o igual que 1.5mg. La prueba es de una sola cola, el símbolo mayor indica que la región crítica yace en la cola derecha de la distribución de nuestro estadístico de prueba

.

Prueba de Hipótesis de Dos Colas

Una prueba de cualquier hipótesis estadística, donde la alternativa es bilateral como

Se denomina prueba de dos colas. La región crítica se divide en dos partes, que a menudo tienen probabilidades iguales que se colocan en cada cola de la distribución del estadístico de prueba. La hipótesis alternativa θ ≠ θ0 establece que ya sea θ < θ0 o que θ > θ0.

7

Ejemplo de Prueba de Hipótesis de Dos Colas

Ejemplo. Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de grasa saturada no excede ni disminuye de 1.5 gramos. Establezca la hipótesis nula y alternativa a utilizar para probar esta afirmación y determinar dónde se localiza la región crítica. Solución. La afirmación del fabricante se debe rechazar sólo si μ es mayor o menor que 1.5mg y no se debe rechazar si es igual que 1.5mg. La prueba es de dos colas, con la región crítica dividida por igual en ambas colas de la distribución de nuestro estadístico de prueba

Valor P

Se define como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido (valor del estadístico calculado), suponiendo que la hipótesis nula es cierta, en términos de probabilidad condicional:

Es fundamental tener en cuenta que el valor p está basado en la asunción de la hipótesis de partida (o hipótesis nula). El valor p es por tanto una medida de significación estadística.

8

Interpretación Se rechaza la hipótesis nula si el valor p asociado al resultado observado es igual o menor que el nivel de significación establecido, convencionalmente 0,05 ó 0,01. Es decir, el valor p nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que la hipótesis nula es cierta. Si el valor p es inferior al nivel de significación nos indica que lo más probable es que la hipótesis de partida sea falsa. Sin embargo, también es posible que estemos ante una observación atípica, por lo que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. Este tipo de errores se puede subsanar rebajando el valor p; un valor p de 0,05 es usado en investigaciones habituales sociológicas mientras que valores p de 0,01 se utilizan en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, lo que reduce la posibilidad de que el dato obtenido sea casualmente raro. El valor p es un valor de probabilidad, por lo que oscila entre 0 y 1. Así, se suele decir que valores altos de p NO RECHAZAN la hipótesis nula o, dicho de forma correcta, no permiten rechazar la H0. De igual manera, valores bajos de p rechazan la H0. Es importante recalcar que un contraste de hipótesis nula no permite aceptar una hipótesis; simplemente la rechaza o no la rechaza, es decir que la tacha de verosímil (lo que no significa obligatoriamente que sea cierta, simplemente que es más probable de serlo) o inverosímil.

9

Ejercicios 1) Un fabricante de pintura de secado rápido afirma que el tiempo de secado dela misma es de 20 min. El comprador diseña el siguiente experimento: pinta 36 tableros y decide rechazar el producto si el promedio de tiempo de secado de los mismos supera los 20.75 min. Si por experiencia δ=2.4 min, se pregunta cuál es la probabilidad de rechazar la partida aun perteneciendo a una población con media de 20 min.

La probabilidad de que el promedio de las muestras exceda 20.75 min a causa del azar se calcula del siguiente modo:

Con esta abscisa, se calcula la probabilidad (área hacia la derecha), resultando 0.0304. Gráficamente:

Este gráfico está hecho sobre valores reales, no normalizados. Para los cálculo se usan estos últimos cuando se trabaja con tablas. Entonces, la probabilidad de rechazar erróneamente la hipótesis µ=20 min es de aproximadamente 0.03, o bien 3%.

10

Supóngase ahora que la media real del tiempo de secado es µ=21 min. Luego, la probabilidad de obtener una media muestral menor o igual que 20.75 (y por lo tanto equivocarse en la aceptación) está dada por:

lo que lleva a un área (hacia la izquierda) de 0.2660. Es decir: la probabilidad de equivocarse al aceptar µ=20 (a pesar de ser µ=21) es del 26.6%. Gráficamente:

Como resumen se da la siguiente tabla:

11

2) La duración media de una muestra de 100 tubos fluorescentes producidos por una compañía resulta ser de 1570 horas, con una desviación típica de 120 horas. Si µ es la duración media de todos los tubos producidos por la compañía, comprobar la hipótesis µ= 1600 contra la hipótesis alternativa µ1600 horas con un nivel de significación de 0.05.

Hipótesis Nula µ = 1600 hr. Hipótesis Alternativa µ 1600 hr. (bilateral) Nivel de significancia: α =0.05. Para trabajar con tablas normalizadas, se usa z en lugar de

Por otro lado, Zα/2 será tal que el área bajo la normal a su derecha sea α/2 y será tal que el área bajo la normal a su izquierda sea α /2. Estos dos valores definen las zonas de aceptación y rechazo de la Hipótesis Nula. Según donde caiga el valor de z calculado por la expresión anterior, se producirá la aceptación o rechazo.

Calculamos:

12

Dado que –2.5 < -Z0.025 se Rechaza la Hipótesis Nula, luego la duración media de los tubos es significativamente menor que 1600 horas. Como se puede apreciar en el siguiente gráfico, la media muestral cae fuera de la zona de aceptación:

En general, el siguiente cuadro resume las distintas pruebas de hipótesis nulas µ=µ0 que se pueden realizar sobre una media:

13

3) Una empresa de transportes desconfía de la afirmación de que la vida útil promedio de ciertos neumáticos es al menos de 28000. Para verificar se colocan 40 neumáticos en camiones y se obtiene una vida útil promedio de 27463 con una S=1348. ¿Qué se puede concluir con ese dato si la probabilidad de Error Tipo I es a lo sumo 0.01? Hipótesis Nula µ ≤ 28000 Hipótesis Alternativa µ > 28000 (unilateral) Nivel de significancia: α = 0.01. Para trabajar con tablas normalizadas:

Calculamos:

Dado que –2.52 < -Z0.01 se Rechaza la Hipótesis Nula, luego la vida útil de los neumáticos es significativamente menor que 28000. Como se puede apreciar en el siguiente gráfico, la media muestral cae fuera de la zona de aceptación:

Si el tamaño de la muestra es pequeño, se desconoce α y proviene de una población normal, se debe utilizar el estadístico t-Student con µ=n-1 grados de libertad. 14

4) La duración media de las bombillas producidas por una compañía han sido en el pasado de 1120 horas con una desviación típica de 125 horas. Una muestra de 8 bombillas de la producción actual dio una duración media de 1070 horas. Ensayar la hipótesis µ=1120 horas contra la hipótesis alternativa µ -t0.05 se Acepta la Hipótesis Nula, luego la vida útil de los neumáticos es significativamente igual a 1120 horas. Como se puede apreciar en el siguiente gráfico, la media muestral cae dentro de la zona de aceptación:

15