Muestreo

MUESTREO ELEMENTOS DEL PROBLEMA DE MUESTREO Población concreta xxxxxxx xxxx xxx x x x x x x xx x x xxxxxxxx xxxx Mues

Views 154 Downloads 2 File size 651KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

MUESTREO

ELEMENTOS DEL PROBLEMA DE MUESTREO Población concreta xxxxxxx xxxx xxx x x x x x x xx x x xxxxxxxx xxxx

Muestra

Obtener información sobre una característica X

Mediante 2 estrategias: * Examinar todas y cada una de las unidades que la componen, es decir, realizar un censo que proporciona un conocimiento total de la característica de estudio sobre la población de interés. * Examinar sólo una parte de la población que recibe el nombre de muestra. A partir de ella se realizarán inferencias sobre la característica de estudio en toda la población

El conjunto de unidades de entre las que se seleccionará la muestra recibe el nombre de marco.

DEFINICIONES BÁSICAS POBLACIÓN: Todo conjunto de elementos finito o infinito, definido por uno o mas características que tienen todos los elementos que la componen. Debe estar definido en el tiempo y el espacio. MUESTRA. Es una parte representativa de la población , significa que debe reflejar las similitudes y diferencias encontradas en la población MUESTREO: Técnicas para determinar que parte de una realidad en estudio (Población) debe examinarse, con la finalidad de hacer inferencias sobre la población en referencia.

UNIDAD DE ANALISIS: Objeto o individuo del que hay que obtener la información (Persona, familia, vivienda, etc.) ESTIMADOR: Valor que se obtiene a partir de los datos de la muestra y que proporciona información sobre el valor del parámetro

ERROR DE MUESTREO: es el que surge al considerar una muestra y no examinar toda la población. El error de muestreo puede ser controlado y medido mediante un diseño cuidadoso de la muestra.

ERRORES DE NO MUESTREO: • Otro tipo de errores, más difícil de controlar, pueden ocurrir en la encuesta. En muchas encuestas, el error de muestreo cometido para esa encuesta puede ser despreciable en comparación con los errores que no son de muestreo. ERRORES DE NO MUESTREO MAS COMUNES: • Sesgo de selección. Este error ocurre cuando alguna parte de la población objetivo no está en la población muestreada. Una muestra así obtenida no es representativa de la población objetivo.

• Sesgo de medición. Ocurre cuando los datos observados difieren del valor verdadero. La obtención de respuestas precisas en las encuestas es fundamental pero esto a veces no se consigue por diversos motivos: las personas no dicen la verdad. Las personas no siempre comprenden las preguntas. Un entrevistador puede leer mal las preguntas o anotar las respuestas de manera equivocada. La formulación y el orden de las preguntas tiene un gran efecto sobre las respuestas obtenidas

No respuesta. La no respuesta de un individuo seleccionado para formar parte de la muestra puede causar un sesgo en los datos muestrales similar al sesgo de selección. Puede ocurrir que las personas que respondan no representen a la población bajo estudio. Los errores de no muestreo pueden controlarse con las siguientes acciones: 1. Re entrevistas. 2.Recompensas e incentivos. 3. Entrevistadores adiestrados. 4. Verificación de datos.

Razones para el uso del muestreo • • • •



MAYOR RAPIDEZ: Un numero reducido de observaciones se puede recolectarse , procesarse con mayor rapidez, que la información proporcionada por un censo y dar resultados mas oportunos. COSTO REDUCIDO: El costo total del estudio por muestreo es mucho menor que el censo, cubriendo .os mismos objetivos y por pocitos que los ejecutados por un censo MAYOR ALCANCE: dado a su flexibilidad y adaptabilidad el muestreo tiene mayor alcance frente al censo, respecto a la variedad de la información. MAYOR EXACTITUD: los datos obtenidos por un censo o una muestra están sujetos a diferentes tipos de errores y sesgos, un estudio muestral posibilita mayor exactitud por practicarse un mejor control sobre la recolección y el procesamiento de los datos. EVITAR LA DESTRUCCIÓN DE LA POBLACIÓN: En algunos casos, una unidad de observación debe ser destruida para ser observada. En ese caso, un censo destruiría a toda la población. Por ejemplo el muestreo en el control de calidad.

MÉTODOS DE MUESTREO •



MUESTREO NO PROBABILISTICO: Proceso por el cual no se puede asignar objetivamente probabilidades a los elementos seleccionados. Las unidades muestrales se seleccionan siguiendo determinado criterio. Este tipo de garantiza la representatividad de la muestra por lo tanto no permiten realizar inferencias. Pueden ser: Muestreo a juicio o criterio, por cuotas, por correo, bola de nieve, etc. MUESTREO PROBABILISTICO: Proceso muestral donde cada elemento de la población tiene una probabilidad perfectamente conocida de ser incluida en la muestra solo este tipo de muestreo nos asegura la representatividad de la muestra y nos proporciona estimaciones e inferencias con cierta medida de precisión. Por lo tanto es mas recomendable

• MUESTREO PROBABILISTICO: • Proceso muestral donde cada elemento de la población tiene una probabilidad perfectamente conocida de ser incluida en la muestra solo este tipo de muestreo nos asegura la representatividad de la muestra y nos proporciona estimaciones e inferencias con cierta medida de precisión. Por lo tanto es mas recomendable. Entre los tenemos: Métodos de muestreo probabilístico

- Muestreo aleatorio simple - Muestreo aleatorio estratificado - Muestreo aleatorio sistemático - Muestreos aleatorio por conglomerados.

MUETREO ALEATORIO SIMPLE Es un método de selección de “n” unidades de un conjunto de N, de forma tal que cada elemento tiene la misma posibilidad de ser elegido para integrar la muestra

MUETREO SIN REEMPLAZO Los elementos de la población no se repiten en la muestra, significa que una unidad seleccionada para integrar la muestra no es devuelta a la población

MUESTREO CON REEMPLAZO Los elementos de la población se repiten en la muestra , ello debido a que la unidad seleccionada es devuelta a la población antes de extraer otro elemento muestral.

ESTIMADORES PARA VARIABLES CUANTITATIVAS • Estimador de la media muestral

• Estimador del total poblacional • Estimador de la varianza poblacional

𝑠2 =

෌ 𝑦𝑖2 − 𝑛 ∗ 𝑦ത 2

𝑛−1

• Estimador de la varianza de la media muestral - Para muestreo sin reemplazo (Poblaciones finitas)

Factor de corrección para poblaciones finitas

= ( 1-n/N )= (1-f)

Factor de elevación Factor de Muestreo

N/n

f = n/N

Si (1- f) ≥ 0.95 ó “n “ ≤ 5% de la población , suele despreciarse. Si N es desconocido se supone que es suficientemente grande, luego (1-f) ≈ 1

- Para muestreo con reemplazo (poblaciones infinitas)

• Estimador de la varianza del estimador del total poblacional • Muestreo sin reemplazo

• Muestreo con reemplazo

INTERVALO DE CONFIANZA A. Para la media poblacional

Muestreo con reemplazo

Muestreo sin reemplazo

Error de estimación

B. Para el total poblacional Muestreo sin reemplazo

Muestreo con reemplazo

ESTIMADORES PARA VARIABLES CUALITATIVAS • Estimador de la proporción poblacional Donde:

a: # de unidades muestrales que poseen el atributo o característica estudiada

• Estimador de la varianza del estimador de P poblacional Muestreo sin reemplazo

Muestreo con reemplazo

• Estimador del total de unidades que poseen el atributo

• Estimador de la varianza del estimador del total Muestreo sin reemplazo

Muestreo con reemplazo

• Estimación por intervalos: Intervalo de confianza para la proporción poblacional Error de estimación

• Sea una población formada por 6 establos lecheros cada uno de los cuales cuenta con el ganado siguiente: Establo X1 X2 X3 X4 X5 X6

Número de cabezas 300 400 500 600 900 1.200

• Los parámetros de esta población son: • Promedio: 𝜇 = 650 vacunos • Varianza: 𝑆 2 = 115.000 • Construir la distribución de frecuencias de los posibles estimadores de obtener para el promedio poblacional que se puede construir a través de la selección de muestras simples aleatorias de tamaño n: 1, 2, 3, 4 y 5. Evalúe su comportamiento.

Respuesta • a.- con 𝑛 = 2 existirán 6!/ 4! ∗ 2! = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 J

M.S.A.j.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15



𝒔𝟐 𝒋

𝒔𝟐 𝝁 𝒋Ƹ

X1,X2 X1,X3 X1,X4 X1,X5 X1,X6 X2,X3 X2,X4 X2,X5 X2,X6 X3, X4 X3,X5 X3,X6 X4,X5 X4,X6 X5,X6

𝝁𝒋 350 400 450 600 750 450 500 650 800 550 700 850 750 900 1,05

5,000 20.000 45.000 180.000 405.000 5.000 20.000 125.000 320.000 5.000 80.000 245.000 45.000 180.000 45.000

1,666.67 6,666,67 15.000 60,000 135,000 1,666,67 6,666,67 41,666,67 106,666,67 1,666,67 26,666,67 81,666,67 15,000 60,000 15,000

valor esperado

650

115.000

38,333,33

• b.- con n=3 existirán 6!/ 3! ∗ 3! = 20 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 j

M.S.A.j.

1 X1,X2,X3 2 X1,X2,X4 3 X1,X2,X5 4 X1,X2,X6 5 X1,X3,X4 6 X1,X3,X5 7 X1,X3,X6 8 X1,X4,X5 9 X1,X4,X6 10 X1,X5,X6 11 X2,X3,X4 12 X2,X3,X5 13 X2,X3,X6 14 X2,X4,X5 15 X2,X4,X6 16 X2,X5,X6 17 X3,X4,X5 18 X3,X4,X6 19 X3,X5,X6 20 X4,X5,X6 valor esperado

𝜇𝑗

400 433,33 533,33 633,33 466,67 566,67 666,67 600 700 800 500 600 700 633,33 733,33 833,33 666,67 766,67 866,67 900 650

10.000 23,333,33 103,333,33 243,333,33 23,333,33 93,333,33 223,333,33 90.000 210,000 210,000 10,000 70,000 190,000 63,333,33 173,333,33 163,333,33 43,333,33 143,33,33 123,33,33 90,000 115,000

1,666.67 3,888,89 17,222,22 40,555,56 3,888,89 15,555,56 37,222,22 15,000 35,000 35,000 1,666,61 11,666,67 31,666,67 10,555,56 28,888,89 27,222,22 7,222,22 23,888,89 20,555,56 15,000 19,166,67

• a fin de estimar el valor real del inventario de objetos de una tienda es seleccionada una muestra de objetos anotándose, para cada uno de los objetos observados, su valor real y el valor que registra en libros . • Como resultado del muestreo efectuado resulto que la proporción entre el valor real y el valor registrado en libros fue de 1.021; aproximadamente, esta proporción tiene distribución normal con una desviación estándar de 0.0002. • Si el valor total del inventario que registran los libros contables es de $80.000, estimar los límites de confianza que tendría el valor real de los objetos considerando un nivel de seguridad de 95%.

• 𝑦𝑖 = Valor real del objeto i-ésimo. • 𝑥𝑖 =Valor en libros del objeto i-ésimo • 𝑟 = σ 𝑦𝑖 / σ 𝑥𝑖 = 0.121 con distribución normal (R ; 0.0082) • σ𝑁 𝑖=1 80.000 ; luego el valor real estimado sería

• 𝑌෠ = 𝑟 σ𝑁 𝑖=1 𝑥𝑖 = 1.021 80.000 = $81.680

• La varianza del estimador será: 𝑟 σ𝑁 𝑖=1 𝑥𝑖 = 2 ∗ 0.00822

2 𝑁 σ𝑖=1 𝑥𝑖

• 𝑣 𝑌෠ = 𝑣 𝑟 80.000 • Si el error estándar del estimado será: • 𝑆 𝑌෠ =

=

𝑉 𝑌෠ = 80.000 ∗ 0.0082 = 656

• Los límites de confianza resultantes son: • 𝐿. 𝐶. 𝑌 = 𝑌෠ ± 𝑧 𝑆 𝑌෠ = 81.680 ± 1.95 ∗ (656)

• 𝐿. 𝐶. 𝑌 = (82,960 ; 80,400)

TAMAÑO DE MUESTRA En ocasiones se fija de antemano el máximo error de estimación que estamos dispuestos a σ aceptar en una estimación 𝑍1−αΤ2 = e 𝑛

Luego la cantidad de información necesario para conseguir lo anterior depende del tamaño de muestra según:

Poblaciones Infinitas Variables cuantitativas

𝑛=

Variables cualitativas 𝑛=

2 2 𝑧1− 𝛼ൗ 𝜎 2 𝑒2

Poblaciones Finitas

𝑛=

2 2 𝑧1− 𝛼ൗ 𝜎 𝑁 2

2 2 𝑧1− 𝛼ൗ 𝜎 2

+ 𝑒 2 (𝑁 − 1)

2 𝑧1− 𝛼ൗ 𝑝𝑞 𝑁 2 2 𝑝𝑞 𝑁 𝑝𝑞𝑧1− + 𝛼𝑒ൗ2 (𝑁 − 1)

2 𝑛= 2 𝑧1− 𝛼ൗ 𝑝𝑞 𝑧1− 𝛼ൗ 2 2 2 𝑛 = 2 2 𝑒2 𝑧1− 𝛼ൗ 𝑝𝑞 + 𝑒 (𝑁 − 1) 2



En muchas situaciones por facilidad de calculo se usa en la 𝝈 expresión: 𝒛𝟐𝟏−𝜶Τ𝟐 = e=B , z = 2 para un nivel de confianza 𝒏

de: (1-α ) = 0.95 •

Luego el tamaño de muestra es:

𝑛 = 𝐵2 /

𝜎2 2 𝑧1− 𝛼Τ

2

𝑛=

𝜎2 𝐷

Variables cuantitativas

𝑛=

𝑝𝑞 𝐷

Variables cualitativas

D

Tamaño de muestra para estimar el total: Donde : D =

𝐵2 2 2 𝑧1− 𝛼ൗ 𝑁 2

Variables cuantitativas

𝑁 𝜎2 𝑛= 2 𝜎 +(𝑁 − 1)𝐷

Variables cualitativas

𝑁𝑝𝑞 𝑛= 𝑝𝑞 + (𝑁 − 1)𝐷

• Importante: * 2 𝑅 𝑅 𝜎 ≅ ↔ 𝜎2 ≅ 4 16

*

• un petitorio realizado es apoyado por cierto número de firmas las que estén contenidas en 676 hojas. Una muestra simple aleatoria de 50 hojas es tomada con el fin de estimar al total de firmas que apoyan la petición con un margen de error de 1,000 firmas y una probabilidad de 1/20. • Los resultados que se registran en las 50hojas fueron: • No firma: 42,41,36,32,29,27,23,19,16,15,14,11,10,9,7,6, 5,4,3. • Frecuencia (𝑓1 ):23,4,1,1,1,2,1,1,2,2,1,1,1,1,1,3,2,1,1 • ¿Cuál será el tamaño de muestra requerido?

• Respuesta: • 𝑁 = 676 • 𝑆 2 = σ 𝑓𝑖 𝑦𝑖 2 − σ 𝑓𝑖 𝑦𝑖 2 /2 /(𝑛 − 1) = [54,497 − (1,471)2 /50]/49 = 229

• • • • • • • • •

𝑠 = 229 = 15.13 𝑑 = 1,000 Firmas ∞ = 1/20 = 0.05; Luego 𝑧 = 2 aproximadamente 𝑛0 = (𝑁𝑧𝑠/𝑑)2 = (676 ∗ 2 ∗ 15.13/1,000)2 𝑛0 = 419 𝑛 = [𝑛0 /(1 + 𝑛0 /𝑁)] = [419/(1 + 419/676)] 𝑛 = 260 Páginas del petitorio deberán ser muestras requeridas.

• Se desea estimar el número total de gusanos por acre en cualquier campo donde la cantidad de gusanos excede a los 200,00 por acre en la capa superior del suelo límite de error de30% al nivel de probabilidad de 95%. La barrena para muestrear es un cubo de 9*9 pulgadas de área por 5 pulgadas de altura. Si en número de gusanos en una muestra se supone tiene una distribución ligeramente más variable que la distribución Poisson (tomamos 𝑆 2 = 1.2𝑦). ത • ¿Qué tamaño de muestra simple será requerido? (un acre =43,560 𝑝𝑖𝑒𝑠 2 )

Área de la barrena Área de un pie Área de la barrera n° de unidades de muestreo(acre)

=9*9 =12*12 =81/144

=81𝑝𝑢𝑙 2 =144𝑝𝑢𝑙 2 =0.5625𝑝𝑖𝑒𝑠 2

=43,560/0.5625 =77,400 bar

𝑁 = 77,400 𝑑 = 0.3 ∗ 200,000 = 60,00 Gusanos por acre ∞ = 0.05 Luego 𝑡 = 2 aproximadamente

𝑆 2 = 1.2 ∗ 𝑦ത = 1.2(200,000/77,400) = 3.096 𝑆 = 3.096 = 1.76

• • • • • • •

𝑛0 = (𝑁𝑧𝑠/𝑑)2 = (77,400 ∗ 2 ∗ 1.76/60,000)2 𝑛0 = 21 𝑛 = [𝑛0 /(1 + 𝑛0 /𝑁) = [21/(1 + 21/77,400)] 𝑛 = 21 Luego una muestra simple aleatoria de21 barrenadas son necesarias.

EJERCICIOS • Con el propósito de seleccionar una muestra representativa de los habitantes de una ciudad, una muestra de nombres es extraída de la guía telefónica de esta ciudad procediendo a visitar y entrevistar a las familias de las personas cuyo nombre resulto seleccionado. • ¿Satisface la muestra seleccionada con los criterios de representatividad? • Para estimar la población total de una ciudad en la que todos los niños en edad escolar asisten a la escuela, una muestra de niños en edad escolar asisten a la escuela, una muestra de niños es seleccionada en las escuelas y se entrevista a sus respectivas familias. • ¿Será representativa la muestra así seleccionada?







• • • •

En una ciudad que contienen 24.000 viviendas y que dispone una exacta lista de ellas, las viviendas están listadas según orden alfabético del nombre de la familia que las ocupan; así mismo aparecen, las respectivas direcciones de las viviendas. Se desea efectuar una encuesta por muestreo de viviendas alquiladas para fines de estimar la distribución de los alquileres mensuales. Se ha decidido que para obtener estimadores con exactitud aceptable son requeridas entrevistar a 400 viviendas ocupadas por inquilinos. El listado de viviendas que se dispone no especifica si se trata de viviendas ocupadas por sus propietarios o por inquilinos pero se sabe que alrededor de 2/3 del total de viviendas en la ciudad sean alquiladas. Describa como extraería la muestra indicando: Método de selección Tasa de muestreo Tratamiento que se daría a las viviendas ocupadas por sus propietarios.

• a fin de estimar el valor real del inventario de objetos de una tienda es seleccionada una muestra de objetos anotándose, para cada uno de los objetos observados, su valor real y el valor que registra en libros . • Como resultado del muestreo efectuado resulto que la proporción entre el valor real y el valor registrado en libros fue de 1.021; aproximadamente, esta proporción tiene distribución normal con una desviación estándar de 0.0002. • Si el valor total del inventario que registran los libros contables es de $80.000, estimar los límites de confianza que tendría el valor real de los objetos considerando un nivel de seguridad de 95%.

• El propietario de una playa de estacionamiento después de observar 26 días de trabajo encontró que su ingreso promedio por día es de $10 con un error estándar de $1.20; si el costo de guardianía es de $7 por día ¿Cuál es la probabilidad que la utilidad del propietario a largo plazo sea cuando menos $5 por día?. • ¿Qué supuesto habría de hacerse para responder a esta pregunta?

• Sea la población • 𝑌𝑖 : 8, 3, 1, 11, 4,7 / 𝑌ത = 5.67 ; 𝑆 2 = 13.47 • Calcular el promedio para todas las muestras simples aleatorias de tamaño n=2 y verificar que dicho promedio es un estimador insesgado y que su varianza cumple con la relación • 𝑉 𝑌ത = 1 − 𝑓 ∗ 𝑆 2 / 𝑛 = 1 − 2 / 6 ∗ 13.47 / 2 = 4.49 • Asimismo calcular 𝑆 2 para todas las muestras y verifique que 𝐸 𝑠 2 = 𝑆 2 = 13.47

• Sea la población ሼ𝑌1 = 8, 3, 1, 11, 4, 7 / 𝑌ത = 5.67 ; 𝑆 2 = 13.47ሽ • Calcular el promedio para todas la muestras aleatorias con reemplazo de tamaño n=2 y verificar dicho promedio es un estimador insesgado y que su varianza cumple con la relación • 𝑉 𝑌ത = 𝜎 2 / 𝑛 = σ 𝑌ത − 𝑦 2 / 𝑁𝑛 = 𝑆 2 (𝑁 − 1)/ 𝑁𝑛 = 13.47 6 − 1 / 6 ∗ 2 = 5.61

• una bodega posee 26 estantes y desea usar el muestreo para reducir su trabajo de inventario, con el fin de estudiar el uso del muestreo hizo el inventario total de sus estantes y resultaron los valores 29,38,42,44,45,47,51,53,53,54,56,56,56,58,58,59,60,60,60,60, 61,61,62,64,65,65,67,67,68,69,71,74,77,82 y 85 • Se considera correcto el estimador del valor total del inventario si proporciona un intervalo menor a 200 con probabilidad 1 en 20. Un consultado sugiere que la muestra simple aleatoria de 12 estantes es suficiente para lograr la estimación. ¿Esta Ud. De acuerdo?

Dos agrónomos A y B hicieron una encuesta para investigar el estado de los frutos de 200 árboles de una plantación de manzano. El agrónomo A selecciono una muestra simple aleatoria de 20 árboles y conto el número de frutos malogrados por cada árbol y obtuvo los resultados: El agrónomo B usando las mismas técnicas examino a los 200 árboles de la plantación registrando solo aquellos árboles que tenían todos los frutos sanos; encontró que 60 árboles de manzano no tenían frutos malogrados. Estimar el número total de frutos malogrados en la plantación de manzanos. •Usando solo los resultados del agrónomo A. •Usando los resultados de ambos agrónomos A y B. •¿Los estimadores serán insesgados? •¿Cuál estimador espera sea más preciso?

N° de frutos malogrados Árbol (yi)

0,1,2,3,4,5,6,7,8,9,10

N° de árboles (fi)

8,4,2,2,1,1,0,0,0,1,1