EXPOSICION

Universidad de Guayaquil Escuela Contador Público Autorizado Temas: Prueba de Hipótesis Prueba de Hipótesis para Media

Views 320 Downloads 3 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Universidad de Guayaquil

Escuela Contador Público Autorizado Temas: Prueba de Hipótesis Prueba de Hipótesis para Media Poblacional Prueba de Hipótesis para Proporciones Prueba de Hipótesis para Media Poblacional con Muestras Pequeñas Tipos de Errores Prueba de Hipótesis diferencias entre Grandes y Pequeñas Distribución de Fischer Análisis de Varianza Cátedra: Estadística II Catedrático: Ing. Galo Litardo García, Mgs. Integrantes: Arévalo Lozada Verónica Lisseth Desimavilla Remache Mariuxi Yolanda Hablich Sánchez Francisco Alejandro Marcillo Castillo Roxana Elizabeth Paredes Baque Karina Cecibel Santillán Icaza Johnny Vega García Luis Enrique

Semestre: 5/22 - Nocturno Guayaquil – Ecuador 2015 – 2016 1

Índice Introducción………………...…….…………………………………………………….. 3 Justificación……………………………………………..……………………………… 4 Objetivos……………….……………………………………………………………….. 5 Objetivo General Objetivo Especifico Prueba de Hipótesis…………………………………………………………………….. 5 Prueba de Hipótesis para la media Poblacional……..………………………………… 11 Pruebas de medias cuando se conoce la desviación estándar de la población....11 Prueba de hipótesis usando la escala estandarizada…………...………………. 15 Prueba de una cola para las medias………………...…………………………. 17 Prueba de Hipótesis para proporciones……………………………………………….. 23 Prueba de Hipótesis para media poblacional con muestras pequeñas………………… 28 Tipos de Errores……………………………………………………………………….. 30 Prueba de Hipótesis, diferencias entre grande y pequeñas………………...………….. 38 Distribución de Fischer y Análisis de Varianza....………………….………………… 41 Conclusión…………………………………………………………………….………. 48 Citas…………………………………………………………………………………… 49 Anexos Anexo No. 1 Tabla de Distribución Z (Positiva)…..…………………………..…….... 50 Anexo No. 1 Tabla de Distribución Z (Negativa)……………………………..…….... 51 Anexo No. 2 Tabla de Distribución T ……………..…………………………………. 52 Anexo No. 3 Tabla de Distribución de Fischer……………………………………….. 53 Anexo No. 4 Cuestionario…………………………………………………………….. 54

2

Introducción Una hipótesis es un enunciado acerca de un parámetro poblacional por la cual primero hay que definir los términos de hipótesis estadística y pruebas de hipótesis estadísticas. Después se muestran los pasos para llevar a cabo una prueba de hipótesis estadística. Luego se aplican pruebas de hipótesis para medias y proporciones, y por último se describen los posibles errores que se deben al muestreo en las pruebas de hipótesis.

3

Justificación Con el presente trabajo se pretende practicar los pasos fundamentales de la prueba de hipótesis y desarrollar ejercicios prácticos para poder mostrar todos los análisis descriptivos, ya que, se debe disponer de una sólida fundamentación conceptual para realizar apropiadamente una evaluación y sustentación a una decisión.

4

Objetivos Objetivo General Conocer y practicar en los ejercicios e indispensables para lograr una comprensión de conocimientos en los fundamentos, aplicaciones e interpretación de resultados en los cuales se basan los métodos estadísticos como lo es la prueba de hipótesis. Objetivo Específicos 

Conocer, entender y manejar los procedimientos para la realización de pruebas de hipótesis.



Reconocer la función e importancia de las pruebas de hipótesis.

¿Qué es una hipótesis? Afirmación relativa a un parámetro de la población sujeta a verificación ¿Qué es la prueba de hipótesis? La prueba de hipótesis comienza con una afirmación, o suposición, sobre un parámetro de la población, como la media poblacional. Procedimiento basado en evidencia de la muestra y la teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable. Procedimiento de cinco pasos para probar una hipótesis Existe un procedimiento de cinco pasos que sistematiza la prueba de una hipótesis; al llegar al paso 5, se está en posibilidades de rechazar o no la hipótesis. Sin embargo, la prueba de hipótesis, como la emplean los especialistas en estadística, no prueba que algo es verdadero de la forma en que un matemático demuestra un enunciado. En el siguiente diagrama aparecen los pasos. Analizaremos con detalle cada uno de ellos.

5

1 Procedimiento de cinco pasos para probar una hipótesis

Paso 1: se establece la hipótesis nula

H 0 y la hipótesis alternativa

H1

El primer paso consiste en establecer la hipótesis que se debe probar. Ésta recibe el nombre de hipótesis nula, la cual se designa

H 0 , La letra mayúscula H representa

la hipótesis, y el subíndice cero implica que “no hay diferencia”. Por lo general se incluye un término no en la hipótesis nula, que significa que “no hay cambio”. Por ejemplo, la hipótesis nula que se refiere a la cantidad media de millas que recorre cada neumático con cinturón de acero no es diferente de 60 000. La hipótesis nula se escribiría

H 0 : µ=60.000 .

En términos generales, la hipótesis nula se formula para realizar una prueba. O se rechaza o no se rechaza. Es una afirmación que no se rechaza a menos que la información de la muestra ofrezca evidencia convincente de que es falsa. Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de la muestra, no es posible decir que la hipótesis nula sea verdadera. En otras palabras, el hecho de no rechazar una hipótesis no prueba que rechazamos

H 0 sea verdadera, sino que no

H0 .

Para probar sin lugar a dudas que la hipótesis nula es verdadera, sería necesario conocer el parámetro poblacional. Para determinarlo, habría que probar, entrevistar o contar cada elemento de la población. Esto no resulta factible. La alternativa consiste en tomar una muestra de la población. La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Se representa

H 1 . También se le conoce como hipótesis de investigación. 6

La hipótesis alternativa se acepta si la información de la muestra ofrece suficiente evidencia estadística para rechazar la hipótesis nula. La forma simbólica de la hipótesis alternativa debe emplear alguno de estos símbolos: ¿ o> o ≠. Por ejemplo, la hipótesis alternativa se escribiría: H 1 : µ60.000 H 1 : µ ≠60.000

Hipótesis Nula.- Enunciado relativo al valor de un parámetro poblacional que se formula con el fin de probar evidencia numérica. Hipótesis Alternativa.- Enunciado que se acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la hipótesis nula. Paso 2: Se selecciona un nivel de significancia Después de establecer la hipótesis nula y alternativa, el siguiente paso consiste en determinar el nivel de significancia. Nivel de Significancia.- Probabilidad de rechazar la hipótesis nula cuando es verdadera. El nivel de significancia se expresa con la letra griega alfa, α . En ocasiones también se conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se trata del riesgo que se corre al rechazar la hipótesis nula cuando es verdadera. No existe ningún nivel de significancia que se aplique a todas las pruebas. Se toma la decisión de utilizar el nivel de 0.05 (expresado con frecuencia como nivel de 5%), nivel de 0.01, nivel de 0.10 o cualquier otro nivel entre 0 y 1. En términos de la prueba de hipótesis, rechazamos la hipótesis nula de que el envío cumplía con las normas cuando se debió aceptar. Al rechazar la hipótesis nula, se incurrió en un error tipo I. La probabilidad de cometer este tipo de error es α .

7

H 0 cuando es verdadera.

Error tipo I Rechazar la hipótesis nula,

La probabilidad de cometer otro tipo de error, conocido como error tipo II, se expresa con la letra griega beta ( β ). Error tipo II Aceptar la hipótesis nula cuando es falsa. Tabla No 1. Errores y Conclusiones Correctas en las Pruebas de Hipótesis Hipótesis nula Ho es verdadero Ho es falsa

Investigador No rechaza Ho

Rechaza Ho

Decisión correcta Error tipo II

Error tipo I Decisión correcta

Paso 3: Se selecciona el Estadístico de Prueba Hay muchos estadísticos de prueba. En este capítulo se utilizan z y t como estadísticos de prueba. Estadístico de prueba Valor, determinado a partir de la información de la muestra, para determinar si se rechaza la hipótesis nula. El estadístico de prueba se calcula convirtiendo al estadístico muestral (como la proporción muestral

^p , la media muestral

en una puntuación (como z, t o

´x , o la desviación estándar muestral s)

x 2 ) bajo el supuesto de que la hipótesis nula es

verdadera. El estadístico de prueba sirve, por lo tanto, para determinar si existe evidencia significativa en contra de la hipótesis nula. Paso 4: Se formula la Regla de decisión Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define la ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad de que ocurran en una hipótesis nula verdadera es muy remota. 8

En la gráfica se presenta la región de rechazo de una prueba de significancia:

2 Distribución muestral del estadístico Z, prueba de una cola a la derecha; nivel de significancia de 0.05

Observe lo siguiente en la gráfica: 

El área en que se acepta la hipótesis nula se localiza a la izquierda de 1.65. En breve se explicará la forma de obtener el valor de 1.65.



El área de rechazo se encuentra a la derecha de 1.65.



Se aplica una prueba de una sola cola (este hecho también se explicará más adelante).



Se eligió el nivel de significancia de 0.05.



La distribución muestral del estadístico z tiene una distribución normal.



El valor 1.65 separa las regiones en que se rechaza la hipótesis nula y en la que se acepta.



El valor de 1.65 es el valor crítico.

Valor Crítico Punto de división entre la región en que se rechaza la hipótesis nula y aquella en la que se acepta. Paso 5: Se toma una decisión El quinto y último paso en la prueba de hipótesis consiste en calcular el estadístico de la prueba, comparándola con el valor crítico, y tomar la decisión de rechazar o no la hipótesis nula. De acuerdo con la gráfica anterior si, a partir de la 9

información de la muestra, se calcula que z tiene un valor de 2.34, se rechaza la hipótesis nula con un nivel de significancia de 0.05. La decisión de rechazar H0 se tomó porque 2.34 se localiza en la región de rechazo; es decir, más allá de 1.65. Se rechaza la hipótesis nula porque es poco probable que un valor z tan alto se deba al error de muestreo (azar). Si el valor calculado hubiera sido de 1.65 o menos, supongamos 0.71, la hipótesis nula no se habría rechazado. Un valor calculado tan bajo no se atribuye al azar, es decir, al error de muestreo. Como se indicó, en la prueba de hipótesis sólo es posible una de las dos decisiones: la hipótesis nula se acepta o se rechaza. En lugar de aceptar la hipótesis nula,

H 0 , algunos investigadores prefieren expresar la decisión como “no se rechaza

H 0 ”, “se decide no rechazar

rechazar

H 0 ” o “los resultados de la muestra no permiten

H 0 ”.

Es necesario subrayar de nuevo que siempre existe la posibilidad de que la hipótesis nula se rechace cuando en realidad no se debe rechazar (error tipo I). Asimismo, existe una posibilidad definible de que la hipótesis nula se acepte cuando debiera rechazarse (error tipo II). Resumen de los pasos de la Prueba de Hipótesis 

Se establecen la hipótesis nula ( H 0 ) y la hipótesis alternativa ( H 1 ) .



Se selecciona el nivel de significancia, es decir, α .



Se selecciona un estadístico de prueba adecuado.



Se formula una regla de decisión con base en los pasos 1, 2 y 3 anteriores.



Se toma una decisión en lo que se refiere a la hipótesis nula con base en la información de la muestra. Se interpretan los resultados de la prueba.

10

Prueba de Hipótesis para Media Poblacional El promedio aritmético poblacional es un indicador muy importante, por lo tanto, frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o a disminuido. A través de la prueba de hipótesis se determina si la media poblacional es significativamente mayor o menor que algún valor supuesto. Hipótesis.- Se puede plantear uno de los tres tipos de hipótesis: 

Prueba de hipótesis a dos colas

Ho: µ = k H1: µ ≠ k 

Prueba de hipótesis a una cola superior

Ho: µ ≤ k H1: µ > k 

Prueba de hipótesis a una cola inferior

Ho: µ ≥ k H1: µ < k En las distribuciones en el muestreo se vio que para el caso de la media, hay tres situaciones, por consiguiente la estadística de trabajo a utilizar depende de los supuestos de la población y del tamaño de la muestra. [ CITATION Uni \l 12298 ] Pruebas de medias cuando se conoce la desviación estándar de la población Prueba de dos colas de medias Ejemplo No. 1 Un fabricante surte los ejes traseros para los camiones del Servicio Postal de Estados Unidos. Estos ejes deben soportar 80,000 libras por pulgada cuadrada en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción de

11

manera significativa. La larga experiencia indica que la desviación estándar de la resistencia de sus ejes es 4,000 libras por pulgada cuadrada. El fabricante selecciona una muestra de 100 ejes de la producción, los prueba y encuentra que la capacidad de carga media de la muestra es 79,600 libras por pulgada cuadrada. Datos:

µHo

= 80,000 ← Valores hipotetizados de la media de población

α = 4,000 ← Desviación estándar de la población n = 100

← Tamaño de muestra

x = 79,600 ← Media de la muestra Si el fabricante de ejes utiliza un nivel de significancia (α) de 0.05 en la prueba, ¿satisfarán los ejes sus requerimientos de carga? En símbolos, podemos establecer el problema como: Ho: µ = 80,000 ← Hipótesis nula: la media real es 80,000 libras por pulgada cuadrada H1: µ = 80,000 ← Hipótesis alternativa: la media real no es 80,000 libras por pulgada cuadrada α = 0.05 ← Nivel de significancia para probar esta hipótesis Cálculo del error estándar de la media: Como conocemos la desviación estándar de la población, y como el tamaño de la población es suficientemente grande para considerarlo infinito, podemos utilizar la distribución normal en nuestra prueba. Primero, calculamos el error estándar de la media ơx = ơx =

σ √n 4000 √100

12

ơx =

4000 10

ơx = 400 libras por pulgadacuadrada ⃪⃪ Error estándar de lamedia Illustration del problema: La figura 3 ilustra este problema, muestra el nivel de significancia de 0.05 como las dos regiones sombreadas que contienen, cada una, 0.025 del área. Determinación de los límites de la región de aceptación: La región de aceptación de 0.95 contiene dos áreas iguales de 0.475 cada una. De la tabla de la distribución normal (Anexo No. 1) podemos ver que el valor z apropiado para 0.475 del área bajo la curva es 1.96. Ahora podemos determinar los límites de la región de aceptación:

µHo: +1.96ơx = 80,000 + 1.96(400) = 80,000 + 784 = 80,784 libras por pulgada cuadrada ← Límite superior

3 Prueba de hipótesis de dos colas al nivel de significancia de 0.05

13

4 Prueba de hipótesis de dos colas al nivel de significancia de 0.05; muestra la región de aceptación y la media y la media de la muestra

µHo: +1.96ơx = 80,000 - 1.96(400) = 80,000 - 784 = 79,213 libras por pulgada cuadrada ← Límite superior Interpretación de los resultados Observe que hemos definido los límites de la región de aceptación (80,784 y 79,216) y la media de la muestra (79,600), y que se ilustran en la figura 4 en la escala de la variable original (libras por pulgada cuadrada). En la siguiente sección veremos otra forma de definir los límites de la región de aceptación y el valor de la media de la muestra. Evidentemente, la media de la muestra cae dentro de la región de aceptación; el fabricante debe aceptar la hipótesis nula porque no hay diferencia significativa entre la media hipotética de 80,000 y la media observada de los ejes de la muestra. Con base en esta muestra, el fabricante debe aceptar que la corrida de producción satisface los requerimientos de carga.

14

Prueba de hipótesis usando la escala estandarizada En la prueba de hipótesis que acabamos de concluir se requirieron dos números para tomar la decisión: un valor observado calculado a partir de la muestra, y un valor crítico que define la frontera entre las regiones de aceptación y de rechazo. Veamos con cuidado cómo obtuvimos ese valor crítico. Después de establecer el nivel de significancia de α = 0.05, buscamos en la tabla 1 del apéndice, la distribución de probabilidad normal estándar, para encontrar que ± 1.96 son los valores z que dejaban 0.025 de probabilidad en cada extremo de la distribución. En vez de medir la variable en sus unidades originales, la variable estandarizada z nos dice a cuántas desviaciones estándar arriba (z > 0) o abajo (z < 0 de la media se encuentra nuestra observación. Entonces hay dos escalas de medición, la escala original o sin procesar y la escala estandarizada. La figura 5 es igual a la figura 4, pero incluye ambas escalas. Observe que nuestra media muestral de 79,600 libras por pulgada cuadrada está dada en la escala sin procesar, pero los valores críticos z de ± 1.96 están dados en la escala estandarizada. Como estos dos números se dan en dos escalas distintas, no podemos compararlos directamente cuando probamos nuestras hipótesis. Debemos convertir uno de ellos a la escala del otro. Hicimos nuestra prueba de hipótesis en la escala original al convertir los valores z críticos de ± 1.96 a los valores críticos de x en la escala original. Entonces, como el valor observado de x (79,600) cayó entre los límites inferior y superior de la región de aceptación (79,216 y 80,784), aceptamos la hipótesis nula. En lugar de convertir los valores críticos z a la escala original, para obtener números directamente comparables con el valor observado de

´x ,

15

5 Pruebe de hipótesis de dos colas al nivel de significancia de 0.05, que muéstrala región de aceptación y la media de la muestra en las escalas sin procesar y estandarizar

podríamos haber convertido nuestro valor observado de

´x

a la escala estandarizada,

utilizando la ecuación para obtener un valor z observado, un número directamente comparable con los valores crítico z: Z=

x−μ Ho σx

Z=

79,600−80,000 400 Error estándar de la media

Z =−1,00 La media de la muestra está a un error estándar abajo de la media de la población La figura 5 también ilustra este valor observado en la escala estandarizada. Observe que el valor cae entre ± 1.96 de los límites inferior y superior de la región de aceptación de esta escala. Una vez más concluimos que se debe aceptar H0: el fabricante debe aceptar que la corrida de producción reúne los requisitos de carga. 16

¿Cuál es la diferencia entre los dos métodos que acabamos de utilizar para probar nuestras hipótesis? Sólo en que definimos las unidades (o escala de medición) de manera distinta en cada método. Sin embargo, los dos métodos siempre llevarán a las mismas conclusiones. Algunas personas se sienten mejor usando la escala de la variable original; otras prefieren la estandarizada, que acabamos de explicar. Los resultados de la mayoría de los paquetes estadísticos de cómputo usan la escala estandarizada. Prueba de una cola para las medias Ejercicio No. 2 Para una prueba de una cola para una media, suponga que un hospital usa grandes cantidades de dosis envasadas de un medicamento particular. La dosis individual de esta medicina tiene 100 cm3 (100 cc). La acción del medicamento es tal que el cuerpo tolera dosis excesivas sin sufrir daño. Por otra parte, las dosis insuficientes no producen el efecto médico deseado e interfieren con el tratamiento del paciente. El hospital ha adquirido la cantidad de medicamento que necesita al mismo fabricante durante varios años y sabe que la desviación estándar de la población es 2 cc. El hospital inspecciona, aleatoriamente, 50 dosis, tomadas de un envío muy grande y encuentra que la media de estas dosis es 99.75 cc

µHo = 100

← Valores hipotetizados de la media de población

α= 2

← Desviación estándar de la población

n = 50

← Tamaño de muestra

x = 99.75

← Media de la muestra

Paso 1: Establezca sus hipótesis, tipo de prueba y nivel de significancia

17

Si el hospital establece un nivel de significancia de 0.10 y nos pregunta si las dosis de esta entrega son demasiado pequeñas, ¿cómo podemos hallar la respuesta? Para empezar, podemos expresar el problema en símbolos: Ho: µ = 80,000

← Hipótesis nula: la media de las dosis de la remesa es 100 cc

H1: µ = 80,000

← Hipótesis alternativa: la media es menor que 100 cc

α = 0.10

← Nivel de significancia para probar esta hipótesis

Paso 2: Elija la distribución apropiada y encuentre el valor crítico Como conocemos la desviación estándar de la población y n es mayor que 30, podemos utilizar la distribución normal. (De la tabla Anexo No. 1) podemos determinar que el valor de z para el 40% del área bajo la curva es 1.28, de modo que el valor crítico para la prueba de cola inferior es –1.28. El hospital desea saber si las dosis reales son de 100 cc o si, por el contrario, las dosis son demasiado pequeñas. El hospital debe determinar que las dosis contienen más de una cierta cantidad, o debe rechazar el envío. Ésta es una prueba de cola izquierda, que se ilustra en la figura 6. Observe que la región sombreada corresponde al nivel de significancia de 0.10. También note que la región de aceptación consta del 40% en el lado izquierdo de la distribución y todo el lado derecho (50%), para un área total del 90%

18

6 Prueba de hipótesis de cola izquierda a nivel de significancia de 0.10

Paso 3: Calcule el error estándar y estandarice el estadístico muestral Ahora podemos calcular el error estándar de la media, utilizando la desviación estándar de la población que conocemos y la ecuación (debido a que el tamaño de población es suficientemente grande para considerarla infinito): ơx =

σ √n

ơx =

2 √500

ơx =

2 7,07

ơx = 0.2829 Error estándar de la media

19

7 Prueba de hipótesis de cola izquierda al nivel de significancia de 0.10; muestra la región de aceptación y la media muestral estandarizada

Ahora usamos la ecuación para estandarizar la media de la muestra, x, restando µHo, la media hipotética, y dividiendo entre ơx, el error estándar de la media: z Z=

x−μ Ho σx

Z=

99.75−100 0.2829

Z =−0.88 Paso 4: Bosqueje la distribución y señale el valor de muestra Al colocar el valor estandarizado en la escala z se observa que esta media muestral cae de lleno en la región de aceptación, como se muestra en la figura 7, Paso 5: Interprete el resultado Por tanto, el hospital debe aceptar la hipótesis nula, porque la media observada de la muestra no es significativamente menor que la media hipotética de 100 cc. Con base en esta muestra de 50 dosis, el hospital debe concluir que las dosis de la entrega son suficientes. [ CITATION Ric01 \l 3082 ]

Ejemplo No. 3: 20

Una empresa eléctrica fabrica baterías de celular que tienen una duraciónque se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 31 baterías tiene una duración promedio de 788 horas, ¿Muestran los datos suficiente evidencia para decir que la duración media no es 800? Utilice un nivel de significancia del 0.04. Datos: µHo = 800 hrs _

n = 31 x = 788 hrs δ

= 40 hrs

Solución: Se trata de una distribución muestral de medias con desviación estándar poblacional conocida. Por lo tanto usamos la distribución normal.

Prueba de hipótesis. La hipotesis se expresan de la siguiene manera: Como a la empresa no le preocupa si la duración es igual o mayor a su propuesta, entonces las hipótesis a plantear son: Ho; μ ≥ 800 horas H1; μ < 800 horas Nivel de significancia a = 0.04, Calcular el error estándar de la media y para ello emplearemos la expresión del error

estándar:

δ

x

21

=

σ √n

δ

δ

x

40 √31

=

x

= δ

40 5,5678 x

= 7,184 Error estándar de la media

Ahora determinamos el valor Z, ya que tenemos una muestra de 30:

8 Prueba de hipótesis de 1 cola izquierda a nivel de significancia de 0.04

Como α = 0.04 y es una prueba de hipótesis para un extremo, en este caso, el extremo izquierdo, entonces el nivel de significancia está contenido en este extremo, por lo que el nivel de confianza es 0.5 – 0.04 = 0.46 Buscamos en las tablas de la distribucion normal 0,46, encontramos que Z = 1.74 El limite izquierdo del intervalo de confianza sera: LI = µHo – Z* ơx = 800 – 1,74 ( 7,184 ¿ = 787,50 ← Límite inferior Gráficamente esto se representa así:

22

9 Prueba de Hipótesis a una cola inferior

Comprobemos con: Z=

x−μ δx

Z=

788−800 7,184

Z=

12 7,184

Z =−1,67 Como podemos observar -1,67 está localizado hacia la izquierda de la zona de aceptación. Se acepta la hipótesis nula Ho.

Conclusión: Como -1.643 ≥ -1.75 por lo tanto, no se rechaza no se rechaza Ho y se concluye con un nivel de significancia del 0.04 que la duración media de las baterías no ha cambiado.

Prueba de Hipótesis para Proporciones El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con datos cualitativos.

23

Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población Niveles de significación Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de significación En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa. a) Prueba de dos extremos para proporciones. Ejercicio No. 4 Una compañía que está evaluando la promovibilidad de sus empleados; es decir, está determinando la proporción de aquellos cuya habilidad, preparación y experiencia en la supervisión los clasifica para un ascenso a niveles superiores de la jerarquía. El director de recursos humanos le dice al presidente que el 80%, o sea el 0.8, de los empleados son “promovibles”. El presidente crea un comité especial para valorar la promovibilidad de todo el personal. El comité realiza entrevistas en profundidad con 150 empleados y en su juicio se da cuenta que sólo el 70% de la muestra llena los requisitos de la promoción. El presidente quiere probar, en un nivel de significancia de 0.05, la hipótesis de que 0.8 de los empleados pueden ser promovidos.

24

p = 0.8 q = 0.2 Datos: n = 150 p = 0.7

q = 0.3  = 0.05 Las hipótesis son: Ho: p = 0.8 H1 : p  0.8

80% de los empleados son promovibles. La proporción de empleados promovibles no es 80%.

Primero calculamos el error estándar de la proporción, mediante la siguiente expresión:

σ ¯ρ=



pH 0 qH 0 n

Sustituyendo valores:

α ¯p =



(. 8 )( .2 ) 150

α p¯ =

√ 0 . 0010666

α ¯p = 0 . 0327

En este caso, la compañía quiere saber si la verdadera proporción es mayor o menor que la supuesta proporción. Por consiguiente, es apropiada una prueba de dos extremos para una proporción. El nivel de significancia corresponde a las dos regiones sombreadas, cada una de las cuales contiene 0.025 del área. La región de aceptación de 0.95 se ilustra como dos áreas de 0.475 cada una. Puesto que la muestra es mayor que 30, podemos recurrir la distribución normal. Basándonos en la tabla de ésta distribución, podemos calcular que el valor correspondiente de Z para 0.475 del área bajo la curva es 1.96. Por tanto, los límites de la región de aceptación son:

25

Lc = PH0  Z Lc = 0.8  1.96(0.0327) Ls = 0.8 + 0.06409

Ls = 0.8641

Li = 0.8 – 0.06409

Li = 0.7359

Viéndolo en la campana de Gauss:

10 Grafico de Campana de Gauss

La probabilidad de la muestra

= 0.7, se localiza en la zona de rechazo, por lo que se

rechaza la hipótesis nula y se acepta la alternativa. Vamos a demostrarlo: Z=

0 . 7−0. 8 0 . 0327

Z=

−0 .1 0 .0327

Z=−3 . 058 δ ¯p

Podemos concluir que existe una diferencia significativa entre la supuesta proporción de empleados promovibles comunicada por el director de recursos humanos y la observada en la muestra, la proporción de toda la compañía no es del 80%.

b) Prueba de un extremo para proporciones Ejercicio No. 5

26

El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las órdenes se entregan en menos de 10 minutos

11 Ejercicio de Prueba de un extremo para Proporciones

Ejercicio No. 6

27

Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados de una universidad les espera un puesto de trabajo. En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. Puede concluirse en el nivel de significancia 0,02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor.

12 Ejercicio de Prueba de un extremo para proporciones

Prueba de Hipótesis para la Media Poblacional con Muestras Pequeñas 28

La distribución t de student fue descubierta por William S. Gosset en 1908. Gosset era un estadístico empleado por la compañía de cervezas Guinness con quien tenía un contrato que estipulaba que no podía usar su nombre en sus publicaciones. El recurrió al sobrenombre de “Student” que es como ahora conocemos el tipo de estadística que desarrollo. Cuando el tamaño de la muestra es pequeño (menos de 30) debe suponerse que la distribución de la población de la que se elige la muestra es aproximadamente normal. Si puede hacerse esta suposición y se conoce la desviación estándar poblacional, puede suponerse que la distribución muestral de la medias de la muestra es normal. Si no se conoce la desviación estándar de la población, la distribución muestral de las medias de la muestra se describe por una distribución t. Se calcula el estadístico de prueba mediante la ecuación siguiente:

(Tabla de Distribución t Anexo No. 3) x = media muestral µ = media poblacional hipotética s / √ n = error estándar estimado de la media Grados de libertad 

La forma de la distribución t de student depende de un parámetro llamado el número de grados de libertad.



El número de grados de libertad es igual al tamaño de la muestra (número de observaciones independientes menos 1).

gl=n−1 Ejercicio No. 7 29

Un supervisor desea probar que el promedio de calificaciones (media:µ) en las escuelas de ingenierías son menores a 12 pts. Se selecciona una muestra aleatoria de 25 escuelas y se obtiene una media muestral x= 11.916 y una desviación estándar es de S = 1.40. Se asume que la distribución de calificaciones es aproximadamente normal. Con un α=0.05 Paso para solucionar Paso 1.- Se define el valor supuesto que se desea probar: La hipótesis nula (H0) La hipótesis alternativa (H1) Formulación de la hipótesis: H0 = 12 H1 < 12 El promedio de calificaciones en las escuelas de ingenierías son menores a 12 pts. H1 indica que se trata de una prueba de una cola hacia la izquierda. Paso 2.- Seleccionar el nivel de significancia α y los grados de libertad n-1 Luego buscar el valor de t utilizando estos datos: Si se utiliza α= 0.05 y el valor critico de ttabulado para una cola, según la Tabla “DISTRIBUCION t DE STUDENT”. Podemos encontrar +/-1.71 para t de una cola, va depender de la dirección expresada en la H1. Paso 3.- Calcular el estadístico t aplicando la fórmula

Calculo el estadístico t aplicando fórmula. 30

Se tiene los siguientes datos: n = 25  = 11.916 µ = 12 S = 1.40 Remplazado en la formula se obtiene: t= -0.3 Formular la regla de decisión y concluir tomando y justificando la decisión: rechazar o rechazar la Hipótesis Nula (H0) Como el valor calculado del estadístico t=-0.3 es menor que el valor t abulado t (0.05; 24): -1.71. Entonces nos e rechaza la H0 En otras palabras la calificación promedio de los alumnos de ingeniería no es menor de 12 puntos.

13 Grafico de Estadístico t

Tipos de Error Existen dos tipos de error en las estadísticas: 

Error tipo I



Error tipo II

Error I (Falso Positivo):

31

El error de tipo I también denominado error de tipo alfa (α) o falso positivo, es el error que se comete cuando el investigador no acepta la hipótesis nula siendo ésta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia estadística. El error de tipo I se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza. La probabilidad de cometer Error de tipo I es el nivel de significación α. Error II (Falso NEGATIVO): El error de tipo II también llamado error de tipo beta (β) o falso negativo, es el error que se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad. Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula representa siempre una afirmación enérgica. Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. El error de tipo II se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta. La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n. 32

Tabla. No. 2 Error de tipo I H0 Aceptar Rechazar

Verdadera Decisión correcta Probabilidad = 1 − α ERROR DE TIPO I Probabilidad = α

Falsa Decisión incorrecta: ERROR DE TIPO II Decisión correcta

Errores de tipo III: Muchos estadísticos están adoptando un tercer tipo de error, de tipo III, que ocurre cuando la hipótesis nula fue rechazada por la razón equivocada. Ejemplo No. 8: Se tienen dos cajas, caja A y caja B. La caja A tiene 40 fichas con el número 1; 50 fichas con el número 10 y 10 fichas con el número 100. La caja B tiene 40 fichas con el número 100; 50 fichas con el número 10 y 10 fichas con el número 1. Se elige una caja al azar, y de ella se saca una ficha. Usted no sabe si es la caja A ó B. H0: La caja es la A H1: La caja es la B Se establece la regla de decisión: Rechazar la hipótesis nula si la ficha es de 100.

Tabla No. 3 Ejercicio no. 9 Fichas

1 10

Número de fichas Número de fichas en caja A en caja B 40 10 50 50

a. ¿Cuál es la probabilidad de cometer el error tipo I? Desarrolle. Respuesta: La probabilidad de cometer el error tipo I es el nivel de significación alfa: 33

α= P(rechazar H0/H0 es verdadera). α= P(sacar una ficha de 100 de la caja A). α= 10/100. α= 0.10. ¿Cuál es la probabilidad de cometer el error tipo II? Desarrolle. Respuesta: La probabilidad de cometer el error tipo II es beta: β = P(aceptar H0/H1 es verdadera). β = P(sacar una ficha de 1 ó de 10 de la caja B). β = 60/100. β0.60. Respuesta: La dirección del extremo en esta hipótesis es hacia la derecha, rechaza para valores grandes de fichas. Por lo tanto este es un test de una cola ó unilateral. b.

Si la ficha que sacamos es un 10: d-i. ¿Cuál es el valor_p?

Respuesta: Valor_p = P(de lo observado ó más extremo, bajo H0). Valor_p = P(sacar una ficha de 10 ó de 100 de la caja A). Valor_p = 60/100. Valor_p = 0.60. ¿Cuál es la decisión y la conclusión? Respuesta: El valor_p es mayor que el nivel de significación 0.10 en (a). Por lo tanto no podemos rechazar Ho y concluimos que la caja es la caja A. Ejemplo No. 9 “Comer para tener huesos sanos significa ingerir suficientes alimentos ricos en calcio y vitamina D”, es la campaña que han estado siguiendo los consultorios de la Región del Maule. En particular, el calcio se encuentra en muchos alimentos, pero la fuente más común es la leche y otros productos lácteos. Por ejemplo, tomar un vaso de 34

leche, significan 300 miligramos (mg) de calcio, y para un Adulto con edades entre 19 y 50 años, se recomienda una dosis de 1000 mg según la Academia Nacional de Ciencias de los EE.UU. Sobre la base anterior, se ha encuestado a un grupo de Adultos consultándose la cantidad de vasos de leche diarios que consume, reuniéndose la siguiente información según el lugar de origen. Tabla No. 3 De consumo de Leche diarios Cantidad de vasos de leche diario 0 1 2 3 4

Número de Adultos urbanos 36 28 21 12 3

Número de Adultos Rurales 5 14 22 27 32

Pero, en la recopilación de la información, en varios de los casos se omite el lugar de origen del Adulto, para resolver este problema, se plantea la siguiente hipótesis: Ho: El Adulto proviene de un lugar Urbano. H1: El Adulto proviene de un lugar Rural.

Se determinó la siguiente regla de decisión: Se rechaza H0 si la persona seleccionada consume al menos 4 vasos de leche diario. Indique el tipo de hipótesis planteada, ya sea Unilateral ó Bilateral. Justifique. Respuesta: Rechazamos Ho para valores grandes (4 ó más vasos diarios), es decir a la derecha, por lo tanto la hipótesis es unilateral Calcule el nivel de significación. Interprete el resultado obtenido. Respuesta: El nivel de significación es la probabilidad de cometer el Error Tipo I: α = P(error tipo I). 35

α = P(rechazar H0/ H0 es Verdadera). α = P(concluir que la persona es del área Rural y es del área Urbana). α = P(que la persona tome 4 vasos de leche diario y sea del área Urbana). α = Proporción de personas que toman 4 vasos de leche del área Urbana. α = 3/100 = 0.03. Luego, el nivel de significación es α=0.03. Calcule la probabilidad del Error Tipo 2. Interprete el resultado obtenido. Respuesta: La probabilidad del Error del Tipo 2 es Beta. β = P(error tipo II). β = P(aceptar H0/ H1 es Verdadera). β = P(concluir que la persona es del área Urbana y es del área Rural). Β = P(que la persona toma menos de 4 vasos de leche diario y sea del área Rural). β = Proporción de personas que toman menos de 4 vasos de leche del área Rural. β = 68/100 = 0.68. Luego, la probabilidad del Error del Tipo 2 es 0.68. Si la persona seleccionada ha consumido 3 vasos de leche, determine el valor_p. ¿Qué decisión debe tomar? Respuesta: Valor_p = P(observación ó más extremo bajo H0). Valor_p = P(que una persona del área Urbana tome 3 vasos de leche ó más) Valor_p = 15/100 = 0.15. Este valor_p es mayor que alfa = 0.03, por lo tanto no se rechaza H0. Decisión: El Adulto proviene de un lugar Urbano Ejemplo No.10: 36

El buen hábito de higiene bucal que deben tener las personas para una dentadura saludable es el tema de tesis que realiza un alumno de la carrera de Odontología de la Universidad de Talca, y para ello, su estudio se centra en niños de 7 años de edad que asisten a dos colegios A y B en la zona urbana de Talca, registrando la cantidad de cepillados diarios que realizan los niños: Tabla No. 4 Ejemplo del ejercicio No. 10 Cantidad de cepillos diarios 0 1 2 3 4 5 6

Cantidad de niños Colegio A Colegio B 2 3 7 9 10 14 16

15 13 11 8 5 4 1

Pero el alumno cuando completa sus fichas, no siempre registra el nombre del colegio al cual asiste el niño, y con la información previa propone el siguiente test de hipótesis: Ho: El niño asiste al colegio A. H1: El niño asiste al colegio B. Para concluir, establece la siguiente regla de decisión: Rechazar H0 si el niño realiza a lo más 1 cepillado diario. ¿Cuál es la probabilidad de cometer error tipo 1?. Interprete. Respuesta: α = P(rechazar H0/H0 es verdadera). α = P(el niño realiza a lo más 1 cepillado diario y que asiste al colegio A). α = (2+3)/(2+3+7+9+10+14+16) = 5/61. α = 0.0820.

37

Existe una probabilidad del 8.20% de afirmar que el niño asiste al colegio B cuando en verdad asiste al colegio A. ¿Cuál es la probabilidad de cometer error tipo 2? Interprete. Respuesta: β = P(aceptar H0/H1 es verdadera). β = P(al niño realiza más de 1 cepillado diario y que asiste al colegio B). β = 0.5088. Existe una probabilidad del 50.88% de afirmar que el niño asiste al colegio A cuando en verdad asiste al colegio B. Si el niño realiza 3 cepillados diarios, ¿A cuál colegio asiste? ¿Qué tipo de error podría cometer? Respuesta: Si el niño realiza 3 cepillado diarios, no se rechaza H0, es decir, el niño asiste al colegio A. Se podría estar cometiendo error tipo 2. Si el niño seleccionado realiza 3 cepillados diarios, ¿Cuál es el valor_p?. ¿Cuál es la decisión y conclusión? Respuesta: Valor_p = P(el niño realiza a lo más 3 cepillado diarios y que asiste al colegio A). Valor_p = (2+3+7+9)/61 = 21/61. Valor_p = 0.3443. Para todo valor de α mayor ó igual al 34.43%, se rechaza H0, es decir, con α = 8.20% no se rechaza H0, luego, el niño asiste al colegio A.

38

Pruebas de hipótesis, diferencias entre grande y pequeñas Prueba estadística para muestras grandes 1. Hipótesis nula. H0:  = 0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) H a:  > 0 ( < 0) Prueba de dos extremidades (o colas) Ha: ¿ 0.

^ ϑ−θ 0 σ ϑ^

3. Estadística de prueba. z = 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z  es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z /2 es tal que P(z > z/2) = P(z < z/2) = /2.

Cuando se plantean hipótesis para la media de una población y para la diferencia de medias de dos poblaciones y las desviaciones estándar poblacionales son conocidas o el tamaño de la muestra es grande • El estadístico de prueba está dado por:

z

Ejemplo No. 11: Pruebas de hipótesis para muestras grandes Las calificaciones de eficiencia de los meseros de un restaurante han estado distribuidas normalmente en cierto periodo, con una media de 200 y una desviación estándar de 16. Sin embargo meseros jóvenes han sido contratados recientemente y se han establecido nuevos métodos de adiestramiento y producción. Utilizando el nivel de significación de 0.01, probar la hipótesis de que la media es aun 200.

14 Grafico de Prueba de dos colas

Solución

39

Paso 1: Ho: µ = 200 H1: µ ≠ 200 Paso 2: α=

0.01 =0.05→ zo=2.58 2

Paso 3: Z=

x−µ ơ √n

Paso 4:

15 Grafico de dos colas la solución

Si se analizan las calificaciones de eficiencia de 100 meseros resultando una media de 203.5, ¿Debe rechazarse la hipótesis nula? Paso 5:

Z=

x−µ 203.5−200 = =2.18 ơ 16 √n √ 100

16 grafico del paso 5

40

Como cae en la región de aceptación, por lo tanto se acepta Ho y se concluye que la media no ha cambiado. Prueba de Hipótesis para muestras pequeñas Es estimar parámetros de población y probar (contrastar) si una afirmación se ve apoyada o desaprobada ante la evidencia de la muestra utilizando la distribución: T Ejemplo No. 12: Se sabe que la duración promedio de un foco que utilizan las lámparas de un cuarto de hotel es de 305 días. Un elemento fue modificado para que tenga mayor duración. Se probó una muestra de 20 focos modificados y se encontró que la vida media era de 311 días con una desviación estándar de 12 días. Al nivel de significación de .05m ¿la modificación incremento la vida de los focos? Solución: Paso 1: Ho: µ = 305 H1: µ > 305 Paso 2: α = 0.05, g . l=n−1=20−1=19 → ¿=1.72 Paso 3: t=

x−µ ơ √n

Paso 4:

17 Grafico cola a derecha

41

Paso 5:

t=

x−µ 311−305 = =2.22 ơ 12 √n √ 20

18 Grafico con cola a la derecha y en la región de rechazo

Como cae en la región de rechazo se acepta H1 y la media ha cambiado lo que indica que la duración del foco es mayor. Distribución de Fisher y Análisis de la Varianza A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la estimación intermediante entre la estimación interna

Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas teorías estadísticas hicieron mucho más precisos los experimentos científicos. Sus proyectos estadísticos, primero utilizados en biología, rápidamente cobraron importancia y fueron aplicados a la experimentación agrícola, médica e industrial. Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección natural en la genética, particularmente en la población humana. El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que indicará el valor máximo del valor estadístico de prueba que ocurría si Ho fuera 42

verdadera, a un nivel de significación seleccionado. Antes de proceder a efectuar este cálculo, se debe considerar las características de la distribución F. Características de la distribución F Existe una distribución F diferente para cada combinación de tamaño de muestra y número de muestras. Por tanto, existe una distribución F que se aplica cuando se toman cinco muestras de seis observaciones cada una, al igual que una distribución F diferente para cinco muestras de siete observaciones cada una. A propósito de esto, el número distribuciones de muestreo diferentes es tan grande que sería poco práctico hacer una extensa tabulación de distribuciones. Por tanto, como se hizo en el caso de la distribución t, solamente se tabulan los valores que más comúnmente se utilizan. En el caso de la distribución F, los valores críticos para los niveles 0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones de tamaños de muestra y número de muestras. La distribución es continua respecto al intervalo de 0 + ∞ La razón más pequeña es 0. La razón no puede ser negativa, ya que ambos términos de la razón F están elevados al cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra, acompañadas de pequeñas variancias muéstrales pueden dar como resultado valores extremadamente grandes de la razón F. La forma de cada distribución de muestreo teórico F (Tabla de distribución de Fischer Anexo No. 4) depende del número de grados de libertad que estén asociados a ella. Tanto el numerador como el denominador tienen grados de libertad relacionados. Determinación de los grados de libertad Los grados de libertad para el numerador y el denominador de la razón F se basan en los cálculos necesarios para derivar cada estimación de la variancia de la 43

población. La estimación intermediante de variancia (numerador) comprende la división de la suma de las diferencias elevadas al cuadrado entre el número de medias (muestras) menos uno, o bien, k - 1. Así, k - 1 es el número de grados de libertad para el numerador. En forma semejante, el calcular cada variancia muestral, la suma de las diferencias elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el número de observaciones de la muestra menos uno, o bien, n 1. Por tanto, el promedio de las variancias muéstrales se determina dividiendo la suma de las variancias de la muestra entre el número de muestras, o k. Los grados de libertad para el denominador son entonces, k(n -l). Uso de la tabla de F del análisis de variancia (ANOVA) En la tabla 5 se ilustra la estructura de una tabla de F para un nivel de significación de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando los grados de libertad del numerador n1 (que se listan en la parte superior de la tabla) así como los del denominador n2 (que se listan en una de las columnas laterales de la tabla) que corresponden a una situación dada. Utilizando el nivel de significancia de 0.05 para n1=7 y n2=3 grados de libertad, el valor de F es 8.89 Cálculo de la razón F a partir de datos muéstrales

Para calcular F se debe seguir el siguiente procedimiento: 1) Calcular la estimación interna (Denominador) 44

Determinar la varianza de cada muestra, utilizando la formula

Obtener la estimación interna de varianza (variancia promedio de la muestra), mediante la fórmula

2) Calcular la estimación intermediante (Numerador) Calcular la varianza de las medias muestrales, utilizando la fórmula

Multiplicar la varianza de las medias muestrales

Razón F

Las hipótesis Nula y Alternativa son: Ho: Todas las proporciones de la población son iguales H1: No todas las proporciones de la población son iguales Ejemplo No. 13 Los pesos en kg por 1,7 m de estatura se ilustran en la siguiente tabla. La finalidad es determinar si existen diferencias reales entre las cuatro muestras. Emplear un nivel de significación de 0,05 45

Tabla No 5

Solución: Las hipótesis Nula y Alternativa son: Ho: Todas las proporciones de la población son iguales H1: No todas las proporciones de la población son iguales Calculando los grados de libertad de numerador se tiene

Calculando los grados de libertad del denominador se tiene

Con 3 grados de libertad en el numerador, 20 grados de libertad en el denominador y con un nivel de significancia α = 0.05 con lectura de tabla se obtiene Ftabla = 3.10 Para calcular Fprueba se procede a la siguiente manera Calculando las medias aritméticas se obtiene:

46

Se llena la siguiente tabla para calcular las varianzas muestrales: Tabla No. 6 Calcular la varianza

Remplazando los datos en la fórmula de la varianza se obtienen las varianzas de las 4 muestras.

Calculando la estimación interna de varianza se obtiene:

Para calcular la estimación intermediante de varianza primero se calcular la varianza de las medias aritméticas

47

Para calcular la varianza de las medias aritméticas se calcula la media aritmética de las medias aritméticas la cuales

Se llena la siguiente tabla: Tabla No. 3

Se remplaza los datos de la tabla para calcular varianza de las medias aritméticas

Calculando la estimación intermediante de varianza se obtiene:

Finalmente calculando Fprueba se tiene:

Decisión: Como Fprueba es menor que Ftabla Ho se aprueba, por lo tanto no existen diferencias reales en los pasos de las 4 muestras, es decir, todas las proporciones de la población son iguales. [ CITATION Mgs12 \l 12298 ]

48

Conclusión Para la realización de una prueba de hipótesis existe tres métodos para probarlo la cual todos ellos conducen a la misma decisión cuando se usan los mismos estándares de probabilidad y riesgo.

49

Citas Bibliografía Triola, M. F. (2004). Estadística - Novena Edición . Wathen, L. M. (2012). Estadística aplicada a los negocios y la economía Decimoquinta Edición.

Betz, M.A. & Gabriel, K.R., "Type IV Errors and Analysis of Simple Effects", Journal of Educational Statistics, Vol.3, No.2, (Summer 1978), pp. 121–144. David, F.N., "A Power Function for Tests of Randomness in a Sequence of Alternatives", Biometrika, Vol.34, Nos.3/4, (December 1947), pp. 335–339. Colombia, U. N. (s.f.). Obtenido de http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capitulotr es/prueba2_2.html Ibujes, M. M. (2012). Obtenido de http://repositorio.utn.edu.ec/bitstream/123456789/940/1/Interaprendizaje%20de %20Probabilidades%20y%20Estad%C3%ADstica%20Inferencial%20con%20Excel, %20Winstats%20y%20Graph.pdf Ibujes, M. M. (2012). Obtenido de http://repositorio.utn.edu.ec/bitstream/123456789/940/1/Interaprendizaje%20de %20Probabilidades%20y%20Estad%C3%ADstica%20Inferencial%20con%20Excel, %20Winstats%20y%20Graph.pdf Rubin, R. I. (2001). ESTADISTICA PARA ADMINISTRACIÓN Y ECONOMÍA. mEXICO: PERSON EDUCACIÓN. Triola, M. F. (2004). Estadística - Novena Edición . Wathen, L. M. (2012). Estadística aplicada a los negocios y la economía - Decimoquinta Edición.

50

Anexo No. 1

51

Anexo No. 2

52

Anexo No. 3

53

54

55

Anexo No. 5 Cuestionarios 1.- ¿Cuáles son los pasos para establecer una prueba de hipótesis? 

Formulas la hipótesis



Nivel de significancia



Selección de un nivel de significancia.



Errores de tipo I y II



Pasos para seleccionar la distribución correcta.

2.- ¿Para qué se utiliza la Distribución F? La distribución F se utiliza para probar la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal. La distribución F también se utiliza para validar los supuestos para algunas pruebas estadísticas.

56

3.- ¿Cuántas Tipo de Error estadístico existe y cuáles son? Existen 3 y son: Error Tipo I(Falso Positivo) Error Tipo II (Falso Negativo) Errores de tipo III: Muchos estadísticos están adoptando un tercer tipo de error, de tipo III, que ocurre cuando la hipótesis nula fue rechazada por la razón equivocada. 4.- ¿Cuál es la diferencia entre la hipótesis de muestra grande y muestra pequeña? La diferencia se basa que en la de muestra grande deben ser mayores (>) o (=) iguales a 30, en cambio en la hipótesis de muestra pequeña estas deberán ser menor a 30 muestras.

57

58

59

60