Estadistica inferencial: E t e l

TECNÓ LOGICO NACIONAL DE MÉ XICO. Instituto Tecnoló gico de México. Estadistica inferencial Unidad 3 “Pruebas de hipó

Views 189 Downloads 1 File size 642KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TECNÓ LOGICO NACIONAL DE MÉ XICO. Instituto Tecnoló gico de México.

Estadistica inferencial Unidad 3

“Pruebas de hipó tesis con una muestra”.

Materia: Estadística Inferencial Alumna: Gonzá lez Alfonso Mó nica. Carrera: Ing. Gestió n Empresarial.

Página | 1

Índice 3.1 metodología para la prueba de hipótesis……………………………………3 3.2 Hipótesis nula y alternativo……………………………………………………8 3.3 Error tipo I y error II…………………………………………………………….8 3.4 Pruebas de hipótesis II para la media (desviación estándar poblacional)…………………………………………………………………………….9 3.5 Pruebas para proporciones……………………………………………………12 3.6 Selección del tamaño de muestra (para estimar la media poblacional)…………………………………………………………………………….17 3.7 Selección del tamaño de muestra (para estimar la proporción poblacional)…………………………………………………………………………….19 Bibliografía………………………………………………………………………………22

3.1 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS. Página | 2

Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muéstrales que nos permite explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación estándar o la forma de la población, pero a veces no se dispone de esta información. En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra. Hipótesis y prueba de hipótesis Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis. Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para verificar si la afirmación es razonable se usan datos. Objetivo de la prueba de hipótesis. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer Un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro. Procedimiento sistemático para una prueba de hipótesis de una muestra.

Página | 3

Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1. Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro. Paso 2: Seleccionar el nivel de significancia. Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel está bajo el control de la persona que realiza la prueba. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población. La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo.

Página | 4

Paso 3: Cálculo del valor estadístico de prueba. Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. Paso 4: Formular la regla de decisión SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota. Distribución muestral del valor estadístico z, con prueba de una cola a la derecha. Valor crítico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. Paso 5: Tomar una decisión. En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II).

EJEMPLOS. 1.  Una empresa está interesada en lanzar un nuevo producto al mercado.

Tras realizar una campaña publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25 no conocían el producto. A un nivel de significación del 1% ¿apoya el estudio las siguientes hipótesis? a. Más del 3% de la población no conoce el nuevo producto. b. Menos del 2% de la población no conoce el nuevo producto. Datos: n = 1000 Página | 5

x = 25

Dónde: x = ocurrencias n = observaciones = proporción de la muestra = proporción propuesta Solución: a)

a = 0,01 

H0 es aceptada, ya que z prueba (-0,93) es menor que z tabla (2,326), por lo que no es cierto que más del 3% de la población no conoce el nuevo producto. b)

a = 0,01 

Página | 6

H0 es rechazada, ya que z prueba (1,13) es menor que z tabla (2,326), por lo que es cierto que menos del 2% de la población no conoce el nuevo producto. 2. Cuando

las ventas medias, por establecimiento autorizado, de una marca de relojes caen por debajo de las 170,000 unidades mensuales, realiza una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media = 169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que las ventas mensuales por establecimiento se distribuyen normalmente; con un nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se considerará oportuno lanzar una nueva campaña publicitaria? Datos: n = 51

Solución: H0: ( = 170000 H1: ( < 170000 a = 0,05 

Se rechaza Ho, porque z prueba (-0,12) es menor que z tabla (1,645), por lo tanto se acepta H1: ( < 170000, y se debe considerar oportuno lanzar una nueva campaña publicitaria.

3.2 HIPOTESIS NULA Y ALTERNATIVA.

Página | 7

1. Las hipótesis nula y alternativa son las siguientes:

H o =P H −PM ≤0 , la proporción de hombres que reportan 9 o más visitas por mes es la misma o menor que la proporción de mujeres que hacen lo mismo.

H a =P H −PM >0 , la proporción de hombres que reportan 9 o más visitas por mes es mayor a la proporción de mujeres que hacen lo mismo. La información proporcionada es:

n H =45

n M =71

PH =.58

PM =. 42

PH −P M =.58−. 42=. 16 3.3 ERROR TIPO 1 Y ERROR TIPO 2. Se cometerá un error de tipo I cuando m=50, pero x para la muestra considerada cae en la región crítica Y se cometerá un error de tipo II cuando m ¹ 50 pero x para la muestra considerada cae en la región de aceptación EJEMPLOS. ERROR TIPO I (EJEMPLO) Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg. Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir: a = P( x < 48.5) + P( x > 51.5) Recordando que La distribución de x es Normal con media m=50 y desviación estándar s/ÖN =0.79, por lo tanto, usando Matlab

Página | 8

a = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79)) = 0.288+ 0.288 = 0.0576 Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera ERROR TIPO II (EJEMPLO) Supongamos que es importante rechazar H 0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H 0: m=50 cuando el valor verdadero es m=52 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 10 4 5

H1: = 52

H0: = 50 4 6

4 7

4 8

4 9

5 0

5 1

5 2

5 3

5 4

5 5

De acuerdo a la figura: b = P(48.5 £ x £ 51.5 | m=52) Usando Matlab: b = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

3.4 PRUEBAS DE HIPOTESIS Z PARA LA MEDIA (DESVIACION ESTANDAR POBLACIONAL CONOCIDA). La prueba de hipótesis es un procedimiento estadístico que comienza con una suposición que se hace con respecto a un parámetro de población, luego se recolectan datos demuestra, se producen estadísticas de muestra y se usa esta información para decidir qué tan probable es que sean correctas nuestras suposiciones acerca del parámetro de población en estudio. Ejemplos de hipótesis pueden ser: a) Probar si las ventas diaria de un abasto son 1000 o no b) Probar si la proporción de individuos que compran algún artículo en una tienda es o no mayor del 0.3.

Página | 9

Objetivo de la prueba de hipótesis Decidir, basado en una muestra de una población, cuál de dos hipótesis complementarias es cierta. Las dos hipótesis complementarias se denominan hipótesis nula e hipótesis alternativa. EJEMPLOS 1) El Instituto Eléctrico Edison publica cifras del número anual de Kilowatthora que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio mínimo de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal. Solución: Datos: m0 = 46 kilowatt-hora s= 11.9 kilowatt-hora x = 42 kilowatt-hora n = 12, a= 0.05 Hipótesis: Ho: m ³ 46 H1: m < 46 Estadístico de Prueba: Como la varianza de la población es desconocida y el tamaño demuestra es menor de 30 utilizaremos la distribución t de Student en el cálculo del estadístico.

Percentil:(11) t0.95 1.7965 Justificación y decisión: Como 1.16 > -1.796, no se rechaza Ho y se concluye con un nivel de significancia del0.05 que no existen suficientes evidencias para afirmar que el número promedio dekilowatt-hora que gastan al año las aspiradoras sea menor de 46 KW la hora Página | 10

2) Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de todos los bebés de seis meses es distinto a 14libras, suponga que sus pesos se distribuyen normalmente y calcule el valor de P. Solución: Datos: = 14 libras S = 1.21 libras = 14.3 libras n=8 a. = 0.052. Ensayo de hipótesis Ho:  = 14 libras H1:   14 libras

3) Regla de Decisión: Si -2.365  tR  2.365 NO se rechaza Ho Si tR  -2.365 o Si tR  2.365 Se rechaza Ho Cálculos:

Página | 11

Justificación y decisión: Como  – 2.365  0.7012  2.365 por lo tanto, no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que el peso promedio de todos los bebés de seis meses es de 14 libras.

3.5 PRUEBAS PARA PROPORCIONES. El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en relación con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fábrica de llantas quería determinar la proporción de llantas que se reventaban antes de 10.000 millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen una característica particular.  El gerente de la fábrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que muy pocas se revienten antes de las 10.000 millas. Si más de un 8% de las llantas se revientan antes de las 10.000 millas, se llegaría a concluir que el proceso no funciona correctamente. La hipótesis nula y alternativa se pueden expresar como sigue:

H 0 =P≤0 . 08

(Funciona correctamente)

H 1=P>0 .08

(No funciona correctamente)

La prueba estadística se puede expresar en términos de la proporción de éxitos como sigue:

Z=  

P s−P



Pq n

→ Ps =

X n

siendo X y N el número de éxitos de la muestra y n el tamaño de la muestra, P la proporción de éxitos de la hipótesis nula. Ahora se determinará si el proceso funciona correctamente para las llantas producidas para el turno de día. Los resultados del turno de día indican que cinco llantas en una muestra de 100 se reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de significancia α=0 . 05 , las regiones de rechazo y no rechazo se establecerían como a continuación se muestra. Y la regla de decisión sería: Rechazar Ho si z> + 1.645; de lo contrario no rechazar Ho. Con los datos que se tienen,

Página | 12

Ps =0 . 05⇒ Z =

P s−P



Pq n

=−1. 107

una vez reemplazado, recuerde p+q=1 Z=-1.107 +1.645; por tanto no rechazar Ho. La hipótesis nula no se rechazaría por que la prueba estadística no ha caído en la región de rechazo. Se llegaría a la conclusión de que no hay pruebas de que más del 8% de las llantas producidas en el turno de día se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un número excesivo de reventones en las llantas producidas en el turno de día. Una hipótesis estadística es una suposición hecha con respecto a la función de distribución de una variable aleatoria. Para establecer la verdad o falsedad de una hipótesis estadística con certeza total, será necesario examinar toda la población. En la mayoría de las situaciones reales no es posible o practico efectuar este examen, y el camino más aconsejable es tomar una muestra aleatoria de la población y en base a ella, decidir si la hipótesis es verdadera o falsa. En la prueba de una hipótesis estadística, es costumbre declarar la hipótesis como verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de significación y se declara falsa si la probabilidad calculada es menor que el valor tabular. La prueba a realizar dependerá del tamaño de las muestras, de la homogeneidad de las varianzas y de la dependencia o no de las variables. Si las muestras a probar involucran a más de 30 observaciones, se aplicará la prueba de Z, si las muestras a evaluar involucran un número de observaciones menor o igual que 30 se emplea la prueba de t de student. La fórmula de cálculo depende de si las varianzas son homogéneas o heterogéneas, si el número de observaciones es igual o diferente, o si son variables dependientes. Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se divide por la menor, este resultado es un estimado de la F de Fisher. Luego se busca en la tabla de F usando como numerador los grados de libertad (n-1) de la varianza mayor y como denominador (n-1) de la varianza menor para encontrar la F de Fisher tabular. Si la F estimada es menor que la F tabular se declara que las varianzas son homogéneas. Si por el contrario, se declaran las varianzas heterogéneas. Cuando son variables dependientes (el valor de una depende del valor de la otra), se emplea la técnica de pruebas pareadas. Como en general estas pruebas se aplican a dos muestras, se denominarán a y b para referirse a ellas, así entenderemos por: -

na al número de elementos de la muestra a nb al número de elementos de la muestra b xb al promedio de la muestra b Página | 13

-

s2a la varianza de la muestra a Y así sucesivamente

Entonces se pueden distinguir 6 casos a saber: -

Caso de muestras grandes (n>30) Caso de na = nb y s2a = s2b Caso de na = nb y s2a ≠s2b Caso de na ≠ nb y s2a = s2b Caso de na ≠ nb y s2a ≠ s2b Caso de variables dependientes EJEMPLOS 1. Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74 por ciento tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto, el banco desarrollará un paquete especial de servicios para este grupo. La administración quiere determinar si el porcentaje verdadero es mayor del 60 por ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron ingresos de $200,000 o más al año. El procedimiento para la prueba de hipótesis de proporciones es el siguiente: Especifica la hipótesis nula y alternativa. Hipótesis Nula:

H 0 =P≤. 60

Hipótesis Alternativa:

H a =P>. 60 ,

donde P = la proporción de clientes con ingresos familiares anuales de $200,000 o más. Específica el nivel de significación, α , permitido. Para una α=. 05 , el valor de tabla de Z para una prueba de una sola cola es igual a 1.64. Calcula el error estándar de la proporción específicada en la hipótesis nula.

s p=



p(1−p ) n

donde: p = proporción especificada en la hipótesis nula. Página | 14

n = tamaño de la muestra.

2. Por consiguiente:

3.

s p=



0. 60(1−0. 60 ) =.0828 35

Calcula la estadística de prueba:

z=

z=

( proporción observada )−( proporción ¿ ) sp

0 .7429−0 .60 =1 . 73 0 . 0828

La hipótesis nula se rechaza porque el valor de la Z calculada es mayor que el valor crítico Z . El banco puede concluir con un 95 por ciento de confianza (1−α=. 95 ) que más de un 60 por ciento de sus clientes tienen ingresos familiares de $200,000 o más. La administración puede introducir el nuevo paquete de servicios orientado a este grupo.

2. El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de los votos para las elecciones presidenciales han sido a favor de su partido. Los partidos de oposición levantaron una muestra de1,100 electores y encontraron que un 87% de ellos votaría por el PRI. El presidente del PRI quiere probar la hipótesis, con un nivel de significación de 0.05, que el 95% de los votos son para su partido.

Hipótesis Nula:

H o : p=0 .95 H : p≠0 .95

a Hipótesis Alternativa: Tamaño de muestra: n=1,100 Nivel de Significación = 0.05.

Página | 15

El primer paso es calcular el error estándar de la proporción utilizando el valor hipotético del porcentaje que históricamente vota por el PRI:

SE p =



p(1− p ) 0 . 95∗0 .05 = =0 .0066 n 1100



3. Ahora sólo es necesario construir el intervalo de confianza:

po ±1.96∗SE p 0 . 95±( 1 . 96∗0.0066 ) =0 . 937→0 .963 La proporción de .87 de votos por el PRI en la encuesta no cae en la región de aceptación, por lo tanto el presidente del PRI debe de “preocuparse” por que la tendencia entre los votantes es a favorecer menos al PRI. 4. Probemos la hipótesis de que el porcentaje de microempresas cuyos SEXO DEL PATRON

Valid

Hombre Mujer Total

Frequency 1634 314 1948

Percent 83.9 16.1 100.0

Valid Percent 83.9 16.1 100.0

Cumulative Percent 83.9 100.0

dueños son hombres captado por la ENAMIN es distinto de 88 por ciento. Hipótesis Nula:

H 0 =P=0 . 88

Hipótesis Alternativa:

s p=



H 0 =P≠0 . 88

0. 88(1−0 .88 ) =. 0074 1948

Página | 16

z=

0 .839−0 . 88 =−5 .54 0. 0074

La hipótesis nula se rechaza porque el valor de la Z calculada es menor que el valor crítico Z de 1.96. Podemos concluir con un 95 por ciento de confianza (1−α=. 95 ) que la proporción captada por la ENAMIN es estadísticamente distintaDE de 0.88. 3.6 SELECCIÓN DEL TAMAÑO LA MUESTRA (PARA ESTIMAR UNA MEDIA

POBLACIONAL). ¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional? La respuesta depende del error estándar de la media, si este fuera cero, entonces se necesitaría una sola media que será igual necesariamente a la media poblacional desconocida  , porque   = 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de precisión. Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la muestra, si éste incluye el total de la población, entonces   sería igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como queramos, para ser más preciso, dado un nivel de confianza y un error fijo de estimación  , se puede escoger un tamaño de muestra n tal que P(( ) = Nivel de confianza. Con el propósito de determinar n. El error máximo de estimación está dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja  n de la ecuación resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados fraccionarios. En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en: Página | 17

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

EJEMPLOS 1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras? Solución:

En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95% de confianza en que   difiere en menos de 4 libras de  .

2. Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?

Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas.

Página | 18

¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta.

3.7 SELECCIÓN DEL TAMAÑO DE LA MUESTRA (PARA ESTIMAR LA PROPORCION POBLACIONAL). Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad específica  .

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporción de la población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada referente a esa proporción entonces se tienen dos opciones: 



Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimación de P. Después con el uso de la fórmula se podría determinar de forma aproximada cuántas observaciones se necesitan para proporcionar el grado de precisión que se desea. Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la formula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.

Página | 19

p

n

0.10

3.84

0.20

6.82

0.30

8.96

0.40

10.24

0.50

10.67

0.60

10.24

0.70

8.96

0.80

6.82

0.90

3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la muestra alcanza su máximo valor.

Página | 20

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

EJEMPLOS 1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02? Solución: Se tratarán a las 500 familias como una muestra preliminar que proporciona una estimación de p=340/500=0.68.

Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.

2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10?

Página | 21

BIBLIOGRAFIA D.R., A. (2008). estadistica para administracion y la economia. Mexico: CENGAGE.

https://es.scribd.com/doc/106656471/Unidad-3-PRUEBAS-DE-HIPOTESIS-CONUNA-MUESTRA http://www.geocities.ws/e_gomez_lara/PHIPOTESIS.pdf file:///C:/Users/paulo/Downloads/Prueba%20de%20Hip%C3%B3tesis.pdf

Página | 22