Hipotesis

145 (𝑝̂ − 𝑝̂ ) − 𝑍 ⁄ ∗ 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) + < 𝑃 − 𝑃 < (𝑝̂ − 𝑝̂ ) + 𝑍 𝑛 𝑛 ⁄ ∗ 𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) + 𝑛

Views 291 Downloads 2 File size 704KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

145

(𝑝̂ − 𝑝̂ ) − 𝑍





𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) + < 𝑃 − 𝑃 < (𝑝̂ − 𝑝̂ ) + 𝑍 𝑛 𝑛





𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) + 𝑛 𝑛

La interpretación del intervalo se hace igual que el realizado para la diferencia de medias. Ejercicio 12: Se requiere comparar la acogida de una nueva disposición de tránsito en dos ciudades de Colombia por parte de los automovilistas. En la ciudad A se tomó una muestra de 550 automovilistas de los cuales 350 estuvieron de acuerdo con la nueva disposición, en la ciudad B se tomó una muestra de 700 automovilistas de los cuales 400 estuvieron de acuerdo con la nueva disposición. Obtenga un intervalo de confianza para la diferencia de proporciones y determine si hay diferencias significativas entre las dos ciudades en cuanto a la acogida de la nueva disposición (use 𝛼 = 0.05). Respuesta.0.0156 < 𝑃 − 𝑃 < 0.1244 El intervalo en la diferencia de proporciones es 0.0156; 0.1244, como el intervalo no contiene al cero, se concluye que las dos poblaciones acogen diferente la nueva disposición de transito con un nivel de confianza de 95%. 18.6

Intervalos de tolerancia

En ingeniería, además de los intervalos de confianza, se utilizan otros intervalos denominados intervalos de tolerancia. El propósito de estos intervalos es determinar si una unidad producida cumple con las especificaciones de calidad. El manejo de los intervalos de tolerancia se sale de los propósitos del presente curso 18.7

TALLER

1. Se quiere estimar los consumos en el servicio telefónico en dos departamentos de una empresa pública para lo cual se hizo un seguimiento durante un año con los siguientes consumos en miles de pesos: Unidad 1 Unidad 2

$350 $280

300 300

350 250

280 260

300 250

320 280

300 310

280 295

320 290

310 350

380 250

320 240

a.

Pruebe que la variación en los consumos es la misma. Use 𝛼 = 0.10

b.

Determine si hay diferencias significativas en los consumos en los dos departamentos. Use 𝛼 = 0.10

2. Responda Falso (F) o verdadero (V) para cada una de las siguientes afirmaciones. Debe justificar cada una de sus respuestas a. En la gobernación del Valle del Cauca, el sindicato de empleados oficiales sostiene que sus ingresos son diferentes a los salarios de los empleados públicos. El gerente de datos obtuvo el siguiente intervalo de diferencia de medias: −3.41 < 𝜇 −𝜇 ú < −0.19 Con base en el intervalo se puede concluir que hay diferencias significativas en los salarios ( ) Justificación: _________________________________________________________________ b. Para un n fijo, un intervalo de confianza del 95% es mas preciso que un intervalo de confianza del 99% de confianza ( ) Justificación: _________________________________________________________________ c.

El tamaño de muestra aumenta linealmente con la variación de la población ( ) Justificación: _________________________________________________________________

d. Tomar muestras dependientes en lugar de muestras independientes aumenta la precisión del estudio ( ) Justificación: _________________________________________________________________

146

3. Los precios de los repuestos para maquinaria pesada usada en construcciones civiles varían mucho debido a la variabilidad del dólar. Un constructor hace un seguimiento a dos proveedores con los siguientes resultados: Proveedor 1 15 4,070 dólares 270 dólares

Numero de repuestos cotizados Costo promedio Desviación estándar

Proveedor 2 12 3,890 dólares 450 dólares

a. Determine si hay diferencia significativa en las cotizaciones promedio entre los dos proveedores b. ¿Qué proveedor recomendaría usted? Justifique su respuesta Nota: asuma que los precios de las cotizaciones siguen una distribución normal y son independientes entre los proveedores. 4. Suponga que acaba de ser contratado para realizar un estudio estadístico que estime el consumo promedio de gaseosa en el concierto de Shakira el próximo 22 abril en la ciudad de Cali. La estadística se requiere con un 96% de confianza, una precisión de 1,000 litros y una estimación del total de personas de 50,000. ¿Cuáles deben ser los tamaños de muestra en cada uno de los siguientes casos: a.

En un concierto similar en la ciudad de Bogotá el consumo promedio fue de 25,000 litros y una desviación estándar de 5,000 litros

b.

Un muestra piloto en 10 conciertos similares dio los siguientes datos de consumo en litros: 18,610

18,960

13,570

10,000

11,000

9,990

4,560

12,590

14,000

12,000

5. Se investiga la resistencia a la tensión de ruptura del hilo proporcionado por dos fabricantes. De la experiencia con los procesos de los fabricantes, se sabe que 𝜎 = 5 𝑝𝑠𝑖 y 𝜎 = 4 𝑝𝑠𝑖. Una muestra aleatoria de 20 especímenes de prueba proveniente de cada fabricante arroja como resultados 𝑥̅ = 88 𝑝𝑠𝑖 y 𝑥̅ = 98 𝑝𝑠𝑖 respectivamente. Encuentre un intervalo de confianza del 90% para la diferencia entre las medias de la tensión de ruptura. ¿Existe alguna evidencia que apoye la afirmación de que el hilo del fabricante 2 tiene una mayor resistencia media? 6.

Se quiere comparar el rendimiento académico de los estudiantes de dos facultades en una institución universitaria para lo cual se han seleccionado los promedios acumulados de siete estudiantes de cada facultad. Determine si los rendimientos son estadísticamente diferentes. Use 𝛼 = 0.01 No. de estudiantes 1 2 3 4 5 6 7

Notas promedio Facultad 1 Facultad 2 4.5 4.2 3.8 3.5 3.2 4.4 2.5

3.9 4.1 4.4 3.9 4.0 3.8 4.0

7. La pintura para autopista se surte de dos colores: blanco y amarillo. El interés se centra en el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca más rápidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura. Los tiempos de secado (en minutos) son los siguientes: Blanca: 120, 132, 123, 122, 140, 110, 120, 107 Amarilla: 126, 124, 116, 125, 109, 130, 125, 117, 129, 120

147 a. Pruebe que las varianzas de los tiempos de secado son iguales estimando un intervalo de razón de varianzas al 95% de confianza b. Encuentre un intervalo de confianza del 95% para la diferencia entre en los tiempos de secado promedio. c. 8.

¿Existe alguna evidencia que indique que la pintura amarilla se seca más rápidamente que la blanca? En un estudio realizado por el Departamento de Nutrición Humana de un instituto de investigación local se registraron los siguientes datos acerca de la comparación de residuos de ácido sórbico, en partes por millón, en jamón inmediatamente después de sumergirlo en una solución de ácido y después de 60 días de almacenamiento: Residuos de ácido sórbico en jamón Rebanada Antes del Después del almacenamiento almacenamiento 1 224 116 2 270 196 3 400 239 4 444 329 5 590 437 6 660 597 7 1,400 689 8 680 576

Si se supone que las poblaciones se distribuyen normalmente, obtenga: a. Un intervalo de confianza de diferencia de medias con un nivel de confianza del 95% b. ¿Hay suficiente evidencia para decidir que la duración del almacenamiento influye en las concentraciones residuales de ácido sórbico? 9. Director de deportes de una universidad local quiere determinar si los entrenamientos rigurosos del último mes han mejorado el rendimiento de los integrantes de la selección de fútbol. Selecciona una muestra de 10 estudiantes y registra los tiempos gastados por cada uno en recorrer un circuito de seis kilómetros con los siguientes resultados (en minutos): Estudiante Peña Suárez Caicedo López Ramírez Gutiérrez Hernández Vásquez Londoño Zuluaga

Tiempo antes del Tiempo después del entrenamiento entrenamiento 20.5 19.3 21.4 22.0 20.3 19.4 22.5 21.4 20.3 20.3 25.3 24.2 21.9 22.0 24.0 24.3 23.3 20.1 19.4 19.5

Con un nivel de confianza del 95% determine si el entrenamiento fue efectivo. 10. La conformabilidad es una propiedad del material que determina su moldeabilidad y capacidad para lograr el estado final del material deseado. En un laboratorio industrial se sometieron dos tipos de materiales a pruebas de impacto de conformabilidad encontrándose en 30 especímenes del material 1 una conformabilidad promedio de 5.43 y una desviación estándar de 1.09 y en 35 especímenes del material 2 una conformabilidad promedio de 6.08 y una desviación estándar de 1.19. Usando un nivel de confianza del 95%, ¿los dos tipos de materiales

148 presentan diferencias significativas en cuanto a la conformabilidad promedio? (asuma que las dos distribuciones de conformabilidad son normales) 11. El gerente de mercadeo de una compañía comercial desea determinar si hay diferencias de apreciación en su intención de compra de los clientes sobre las promociones tales como ofrecer un 20% de descuento en frutas y verduras. Se hizo una encuesta a clientes de dos sucursales encontrándose los siguientes resultados: Sucursal A: de 200 clientes, 30 respondieron afirmativamente Sucursal B: de 250 clientes, 35 respondieron afirmativamente Obtenga un intervalo de confianza para la diferencia de proporciones y determine si hay diferencias significativas entre las dos sucursales en cuanto a la intención de compra de los clientes (use 𝛼 = 0.10).

149 Capítulo 19: HIPÓTESIS ESTADÍSTICA 19.1 Introducción Con frecuencia, las decisiones de un profesional dependen de la evaluación y/o comparación de procesos, por ejemplo: 1) en producción, comparar dos líneas de trabajo para determinar cuál es más eficiente; 2) en logística, una compañía transportadora quiere determinar si una nueva ruta es mejor que otra ya existente en cuanto al menor consumo de combustible. Es evidente que en la evaluación de cada una de estas conjeturas se deba recurrir a un procedimiento estadístico en el cual esté implicado el muestreo y la inferencia estadística. A continuación se presentan algunas situaciones que conducen a un planteamiento de investigación que se denomina prueba de hipótesis: 1. El costo diario de mantenimiento de una planta procesadora de alimentos es de $ 500,000. 2. El tiempo de entrega de suministros del proveedor A es más rápido que el tiempo del proveedor B para una compañía grande. 3. La proporción de empleados de una organización que en un día normal de trabajo llega tarde es más del 2%. 4. El tiempo de duración de una determinada marca de baterías utilizadas en los automotores de distribución de una compañía transportadora sigue una distribución normal. En cada una de estas situaciones se plantea una conjetura o aseveración que hay que validar a través de un procedimiento de investigación. Por lo general, están implicados uno o más parámetros estadísticos por lo que el procedimiento de investigación se convierte en una metodología estadística que se denomina Prueba de Hipótesis. 19.2 Conceptos Básicos A continuación se formalizaran las definiciones de hipótesis, los tipos de errores y la metodología de prueba de hipótesis. Definición 19.1: Hipótesis estadística Hipótesis estadística es una aseveración o afirmación sobre el valor de un parámetro de una población, los valores de varios parámetros o sobre la forma de la distribución de probabilidad de una variable. Ejercicio 1: Formalice las hipótesis planteadas en la introducción como hipótesis estadísticas. Ayuda: la primera seria 𝐻: 𝜇 = 500,000 En la práctica siempre se formulan simultáneamente dos hipótesis, las cuales determinaran el procedimiento formal de validación del problema de investigación. Estas hipótesis son la Nula y la Alternativa que se definen a continuación. Definición 19.2: Hipótesis nula: 𝑯𝟎 La hipótesis nula, que se representa 𝐻 , indica el comportamiento natural o esperado del parámetro (o situación en cuestión) analizado, se especifica de tal forma que se mantiene como cierta a no ser que los datos indiquen su falsedad. Nunca podrá ser probada a no ser que se estudia a toda la población completa. Por ejemplo, en la situación 1 presentada en la introducción, la hipótesis nula es: 𝐻 : 𝜇 = 500,000

150 Como ya se mencionó, a la par del planteamiento de la hipótesis nula se debe plantear la hipótesis alternativa, ésta, dada su mayor importancia, también es denominada la hipótesis de investigación. Definición 19.3: Hipótesis alternativa: 𝑯𝟏 La hipótesis alternativa, que se representa 𝐻 , indica un cambio deseado en el parámetro ( o situación planteada) es contradictoria a la hipótesis nula y solo se aceptara si la evidencia muestral determina que la hipótesis nula es falsa. Por norma general a la hipótesis nula siempre se le asigna el signo igual (=). Si a la hipótesis alternativa se le asigna el signo “menor que” () se dice que la prueba de hipótesis es de una sola cola, por el contrario, si se le asigna el signo “diferente de” (≠) se dice que la prueba es de dos colas. Ejercicio 2: Plantee la hipótesis nula y alternativa para cada una de las cuatro situaciones planteadas en la introducción. El procedimiento de prueba de hipótesis requiere de la selección de una muestra de la población de interés. La información de la muestra determina la veracidad o la falsedad de una hipótesis, pero ¿qué tan seguro se está de tomar una decisión correcta?, nunca se sabrá a menos que se examine a la población completa y esto en la mayoría de las veces es imposible de hacer. Aquí se plantean varios interrogantes, el primero tiene que ver con el azar de los datos, o lo que se denominó el error de muestreo, ¿Cómo estar seguros de que los resultados no se deben a los efectos del error de muestreo sino a las condiciones de investigación planteadas? y segundo, si efectivamente la condiciones de investigación se dan ¿Cuánto es el impacto de estas condiciones?. Para resolver, en parte estos interrogantes se recurre a lo que se denomina la regla de decisión que se pasa a definir a continuación. Definición 19.4: Regla de decisión La regla de decisión es la que establece las condiciones para aceptar o rechazar una hipótesis. Ejercicio 3: Una compañía fabricante de aviones ha decidido cambiar de proveedor de los remaches utilizados en la unión de las estructuras principales del avión. Los remaches utilizados actualmente tienen una tensión promedio de 180 libras-fuerza, cualquier nuevo proveedor debe garantizar una tensión superior a esta cantidad. Formule las hipótesis nula y alternativa y una regla de decisión apropiada. Ayuda: Para la regla de decisión, piense en un valor de 𝑥̅ teniendo en cuenta el error de muestreo. Ejercicio 4: En el procedimiento de toma de decisión siempre se tendrá un riesgo o incertidumbre en tomar la decisión correcta. Proponga dos tipos de errores que se puedan cometer evaluar una hipótesis. Definición 19.5: Error tipo I Error de tipo I es el rechazo de la hipótesis nula 𝐻 , cuando esta hipótesis es en realidad verdadera. La probabilidad de cometer error tipo I se representa con la letra griega 𝛼. Definición 19.6: Error tipo II Error tipo II es la aceptación de la hipótesis nula 𝐻 cuando esta hipótesis es en realidad falsa. La probabilidad de cometer un error tipo II se presenta con la letra griega 𝛽. Definición 19.7: Nivel de significancia La probabilidad de cometer un error tipo I, se denomina nivel de significancia. Ejercicio 5: A modo de resumen, complete la siguiente información: 𝛼 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 ? ) = 𝑃(

?

|𝐻 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

151

? = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝐻 | ?

)

Ejercicio 6: Discuta con sus compañeros el siguiente interrogante: ¿Cuál de estos riesgos es más conveniente manejar en un procedimiento de prueba de hipótesis? Identifique el riesgo del productor y el riesgo del consumidor. La calidad de un procedimiento de prueba de hipótesis se determina por la potencia de la prueba que se define a continuación. Definición 19.8: Potencia. La potencia en un procedimiento de prueba de hipótesis es la probabilidad de rechazar la hipótesis nula 𝐻 siendo esta falsa. Se expresa así: 𝑃 = 1−𝛽 Conceptualmente la potencia tiene importancia en el sentido que informa sobre lo adecuado de los tamaños de muestra considerados en la investigación y/o sobre qué tan grande es la variabilidad del proceso de tal forma que se detecten las diferencias esperadas. En la práctica es aceptada una potencia entre 0.80 y 0.90, valores inferiores significarían errores tipo II muy altos y valores superiores requieren de tamaños de muestra muy grandes. En conclusión el cálculo de la potencia servirá para determinar la validez de los resultados permitiendo un análisis posteriori para determinar si los resultados no significativos obedecen a una falta de poder de la prueba para detectar una diferencia significativa o si realmente puede no existir tal diferencia. Ejercicio 7: El consumo de la vitamina E es fundamental para la preservación de la salud en los humanos, la cantidad promedio diaria estimada para una persona adulta sana es de 15 mg, una deficiencia de esta vitamina generaría problemas de defensas bajas, problemas musculares y problemas en los nervios, un consumo alto generaría problemas de sangrados y derrames cerebrales. Un fabricante de medicinas produce un suplemento vitamínico con esta vitamina. Suponga que el contenido de vitamina E producida por este fabricante tiene una distribución normal, con un promedio de 15 mg y una desviación estándar de 0.75 mg. En un procedimiento de control de calidad se desea probar que el valor promedio del contenido de vitamina E es de 15.0 mg, para lo cual se utilizara una muestra aleatoria de 9 unidades. a. b.

c. d. e.

Formule las hipótesis nula y alternativa. Suponga que hay fallas en la producción del suplemento vitamínico en este fabricante si se encuentran valores en los rangos 𝑥̅ ≥ 15.50 o 𝑥̅ ≤ 14.50. ¿Cuál es la probabilidad de que se determine una falla en la producción de la vitamina cuando en realidad el fabricante está produciendo con un valor promedio de 15 mg? Respuesta: 0.0455. ¿Cuál es la probabilidad de que se acepte una lote cuando en realidad el promedio de vitamina E sea de 15.8 mg? Respuesta: 0.11507. Con base en los resultados anteriores, determine que tan eficiente es el procedimiento de prueba de hipótesis realizado. Comente sobre los riesgos de cometer error tipo I y II en el contexto de este problema.

19.3 Pasos a seguir en un procedimiento de prueba de hipótesis con una sola muestra Los pasos a seguir en un procedimiento de prueba de hipótesis con una sola muestra se describen a continuación: 1. Identificar el parámetro de interés: 𝜃 2. Definición de la hipótesis nula:

152 𝐻 : 𝜃 = 𝜃 donde 𝜃 es el valor del parámetro a cuestionar. La hipótesis alternativa puede ser una de las siguientes opciones: 𝐻 :𝜃 < 𝜃

ó

𝐻 :𝜃 ≠ 𝜃

ó

𝐻 :𝜃 > 𝜃

La elección de la hipótesis alternativa depende de lo que se quiere probar, en muchas ocasiones esta hipótesis relaciona el cambio que se sospecha o espera que haya ocurrido en la población. 3. Nivel de significancia: 𝛼 El nivel de significancia establece al máximo el riesgo que se está dispuesto a aceptar, su valor es subjetivo, corresponde al investigador establecerlo. 4. Estadístico de prueba apropiado: 𝑘 El estadístico de prueba depende de la muestra y de la distribución de la población en estudio, la fórmula es: 𝑘= donde: 𝜃estimador de la muestra 𝜎 error estándar del estimador. 5. Establecimiento de la región de rechazo para el estadístico de prueba. Resolver ejercicio 8. 6. Calculo del estadístico de prueba 𝑘 basándose en los datos de una muestra. 7. Decisión. Esta depende de si 𝑘 cae en la región de aceptación o rechazo. 8. Conclusión. Se hace en términos del enunciado del problema. Ejercicio 8: Asumiendo normalidad en la población, realice graficas donde se indique la región de aceptación y la región o regiones de rechazo de 𝐻 para un nivel de significancia de 𝛼. 19.4 Prueba de hipótesis para media poblacional 𝝁 El procedimiento de prueba de hipótesis depende de la distribución de la población y del conocimiento o no de la varianza poblacional. Caso 1: Población normal y Varianza poblacional conocida 𝝈𝟐 Ejercicio 9: Plantee los ocho pasos establecidos para un procedimiento de prueba de hipótesis cuando 𝜃 = 𝜇. Ejercicio 10: Una empresa distribuidora de abarrotes tiene un proceso de empacado de 500 gramos, el cual se comporta con distribución normal y desviación estándar de 35 gramos. En una inspección de rutina se tomó una muestra de 𝑛 = 16 productos encontrándose un peso promedio de 485 gramos. Pruebe las hipótesis 𝐻 : 𝜇 = 500 versus 𝐻 : 𝜇 ≠ 500 usando un nivel de significancia del 5%. Caso 2: Población normal, varianza poblacional desconocida y muestra pequeña (n ) el 𝑉𝑎𝑙𝑜𝑟 𝑝 se obtiene así: 𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃(𝑧 > 𝑧 ) Si la hipótesis alternativa es tipo diferente (𝐻 : ≠ ) el 𝑉𝑎𝑙𝑜𝑟 𝑝 será: 𝑉𝑎𝑙𝑜𝑟 𝑝 = 2 ∗ 𝑃(𝑧 > |𝑧 |) Si la hipótesis alternativa es tipo menor (𝐻 : < ) el 𝑉𝑎𝑙𝑜𝑟 𝑝 se obtiene así: 𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃(𝑧 < 𝑧 ) Ejercicio 12: El periodo de garantía ofrecido por una fábrica de baterías es de 180 días. Un oficial de la oficina de protección al cliente inspecciono 36 clientes usuarios de estas baterías encontrando un periodo de vida útil promedio de las baterías de 175 días con una desviación estándar de 10 días. Pruebe las hipótesis 𝐻 : 𝜇 ≥ 180 versus 𝐻 : 𝜇 < 180 con un 𝛼 = 0.03. Calcule el 𝑉𝑎𝑙𝑜𝑟 𝑝. Ejercicio 13: Una entidad bancaria quiere probar que el retiro promedio por usuario en un cajero automático en una quincena de pago es de $ 520,000. Una muestra aleatoria de retiros de 10 clientes contabilizo un promedio de $588,000 y una desviación estándar $115,250. Haga la prueba asumiendo que los montos de retiros se distribuyen normal y un nivel de significancia del 5%. Respuesta. 𝑉𝑎𝑙𝑜𝑟 𝑝 = 0.095.

154 19.6 Tabla resumen de pruebas de hipótesis En lo tratado hasta aquí, solo se ha manejado la media poblacional, pero igual tratamiento se puede seguir con los demás parámetros estadísticos y con los casos de las diferencias de medias o razón de varianzas. En la tabla 19.1 se indican las principales pruebas de hipótesis con sus estadísticos de prueba y regiones de rechazo. Hipótesis Nula: 𝑯𝟎

Supuestos

𝜇=𝜇

𝜎: conocida

𝜇=𝜇

𝜎: desconocida, Población normal

𝑃=𝑃

Estadístico de prueba 𝑧= 𝑡=

̅ ⁄√

Población binomial con 𝑛 ≥ 50

𝑥̅ − 𝜇 𝜎 ⁄√𝑛 con 𝜐 = 𝑛 − 1

𝑧=

𝑝̂ − 𝑃 (

Hipótesis Alternativa: 𝑯𝟏 𝜇𝜇 𝜇𝜇 𝑃𝑃

)

𝜎 𝜎 𝜇 −𝜇 𝐷

(𝑥̅ − 𝑥̅ ) − 𝐷 +

𝑡=

(𝑥̅ − 𝑥̅ ) − 𝐷 𝑠 ∗

+

con 𝜐 = 𝑛 + 𝑛 − 2 𝑠 = 𝑡=

Poblaciones normales, varianzas diferentes y desconocidas (𝜎 ≠ 𝜎 )

𝜎 ≠𝜎

(

)

(

)

(𝑥̅ − 𝑥̅ ) − 𝐷

Región de rechazo 𝑧 < −𝑧 𝑧> 𝑧 ⁄ 𝑧>𝑧 𝑡 < −𝑡 ; 𝑡> 𝑡 ⁄ ; 𝑡>𝑡 ; 𝑧 < −𝑧 𝑧> 𝑧 ⁄ 𝑧>𝑧 𝜒 𝜒

;

𝜇 −𝜇 𝑧 ⁄ 𝑧>𝑧 𝑡 < −𝑡 ;

𝜇 −𝜇 ≠ 𝐷

𝑡> 𝑡

⁄ ;

𝜇 −𝜇 >𝐷

𝑡>𝑡

𝜇 −𝜇 𝐷

𝑡>𝑡

𝑑̅ − 𝐷 𝑡= 𝑠 √𝑛

𝜇 𝐷

𝑡 < −𝑡 ; 𝑡> 𝑡 ⁄ ; 𝑡>𝑡 ;

𝑝̂ − 𝑝̂

𝑃 𝑃

𝑧 < −𝑧 𝑧> 𝑧 ⁄ 𝑧>𝑧

+

𝑧=

𝑡> 𝑡

𝑝(1 − 𝑝)

+

;

con 𝑝 = 𝜎 𝜎

Tabla No. 19.1 Resumen de las principales pruebas de hipótesis

𝑓𝑓

;

,

155 19.7 Realización de pruebas de hipótesis utilizando el programa Excel Para el caso de las pruebas de comparación de medias para dos poblaciones, el programa Excel tiene incorporado en el análisis de datos las pruebas para la comparación de varianzas (Prueba F para varianzas de dos muestras) y las pruebas de comparación de medias tanto para el caso dependiente (Prueba t para medias de dos muestras emparejadas) y como para los casos de muestras independientes (Prueba t para medias de dos muestras suponiendo varianzas iguales, Prueba t para medias de dos muestras suponiendo varianzas desiguales y Prueba z para medias de dos muestras). Con el ejemplo indicado a continuación se ejemplifica el uso de estas funciones: Ejemplo: Un investigador quiere determinar si hay diferencias significativas en los ingresos familiares promedio en dos ciudades capitales del país. Se tomaron muestras aleatorias de familias en las dos ciudades como se indica en la tabla adjunta (valores en millones de pesos): Ciudad A

Ciudad B

1,35

0,85

2,40

0,85

3,50

1,40

4,80

1,35

4,52

3,55

1,60

1,95

1,95

1,35

2,15

2,50

Dados estos valores, el investigador concluye que es evidente que el ingreso familiar promedio en la ciudad B es menor que el de la ciudad A. ¿está usted de acuerdo con esta conclusión? Justifique con un razonamiento cuantitativo en términos de la Inferencia Estadística. Solución: primero se hace la prueba de comparación de varianzas: 𝐻 : 𝜎 = 𝜎 versus 𝐻 : 𝜎 ≠ 𝜎 como se indican en los recuadros siguientes:

Note que el Valor p (P(F