poblacion y muestra estadistica

INTRODUCCIÓN AL MUESTREO PARTE 1: GENERALIDADES MUESTREO  Procedimiento por el cual se extrae, de un conjunto de un

Views 168 Downloads 0 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

  • Author / Uploaded
  • F jcr
Citation preview

INTRODUCCIÓN AL MUESTREO PARTE 1: GENERALIDADES

MUESTREO



Procedimiento por el cual se extrae, de un conjunto de unidades que constituyen el objeto de estudio ( población), un número de casos reducido (muestra) elegidos con criterios tales que permitan la generalización a toda la población de los resultados obtenidos al estudiar la muestra.

CONCEPTOS INICIALES  Población: Conjunto de unidades de las que se desea

obtener cierta información. Unidades: Personas, Estudiantes, Trabajadores, Familias, Viviendas, Escuelas, Organizaciones, Artículos de Prensa

 Muestra: Selección de unas unidades concretas de la

población que representen la característica que se quiere medir.

RAZONES DE MUESTREO Disminución de costos ( tiempo, personal, material)  Al disminuir el número de casos disminuyen también los errores asociados a la manipulación de los datos.  Puede confiarse en la generalización de los resultados si se ha tenido cuidado al seleccionar la muestra. 

CRITERIOS IMPORTANTES PARA LA SELECCIÓN DE LA MUESTRA Salvo en poblaciones muy pequeñas y accesibles nunca se observan a todas las unidades de la población. Se debe diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece. Cualquier diseño muestral comienza con la búsqueda de la información que ayude a la identificación de las características de la población bajo estudio.

CONDICIONES QUE DEBE CUMPLIR UNA “BUENA” MUESTRA  Que comprendan parte de la población y no la totalidad

de ésta. ( salvo en los casos antes explicados en la lámina 5)  Aunque el sentido común pareciera indicar que poblaciones más grandes deben producir muestras mayores, esto no es siempre cierto ya que:



El tamaño de la población NO es el único elemento que influye en el tamaño de la muestra.

CONDICIONES QUE DEBE CUMPLIR UNA “BUENA” MUESTRA La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna anomalía, la muestra resultará por este mismo hecho viciada.

Que sea representativa o reflejo fiel de la población, de tal modo que reproduzca sus características básicas en orden a la investigación.

CONDICIONES QUE DEBE CUMPLIR UNA “BUENA” MUESTRA Si hay sectores diferenciados en la población que se supone ofrecen características especiales la muestra también deberá comprenderlos en la misma proporción.

TAMAÑO DE LA MUESTRA Es el número de unidades a incluir en la muestra.

Existen varios factores que influyen en el tamaño de la muestra: Tiempo y recursos disponibles Modalidad de Muestreo Tipo de Análisis Previsto

Varianza o heterogeneidad de la población Margen de Error máximo admisible

Nivel de confianza de la estimación muestral

MODALIDAD DE MUESTREO SELECCIONADA La selección de las modalidades de muestreo ( probabilísticos y no probabilísticos) se halla determinada por varios factores: los objetivos, los recursos, la accesibilidad de la población y el tiempo.

Los diseños no probabilísticos demandan un tamaño muestral menor.

TIPOS DE MUESTREOS PROBABILÍSTICOS •Todas las unidades tienen igual probabilidad de participar en la muestra. •La elección de cada unidad muestral es independiente de las demás •Se puede calcular el error muestral

NO PROBABILISTICOS •Cada unidad NO tiene igual probabilidad de participar en la muestra. •No se puede calcular el error muestral •Alto riesgo de invalidez producido por la introducción de sesgos

USOS DE CADA TIPO DE MUESTREO Muestreo Probabilísticos

Estimación de Parámetros Comprobación de Hipótesis

Muestreos No Probabilísticos Estudios Pilotos Investigaciones en poblaciones de difícil registro o localización ( Ej. Marginales

EJEMPLO: ¿MUESTREO PROBABILÍSTICO? 

Se realiza un muestreo entre los alumnos que van a clases de Estadística II, eligiéndolos al azar a la entrada de la sala.

Este diseño es … porque aquellos que no van a clases NO PUEDEN ser elegidos

EJEMPLO: ¿MUESTREO PROBABILÍSTICO? 

Se utiliza la lista de propietarios de líneas telefónicas para elegir a aquellos que serán encuestados.

Este diseño es … porque aquellos que no tienen teléfono NO PUEDEN ser elegidos

EJEMPLO: ¿MUESTREO PROBABILÍSTICO? 

Un investigador toma muestras del carbón extraído de una mina, tomando al azar trozos de carbón de la parte superior de cada carro.

Este diseño es … porque solo se toma carbón de la parte superior

FACTORES QUE INFLUYEN EN EL TAMAÑO DE LA MUESTRA :TIPO DE ANÁLISIS DE DATOS PREVISTO La técnica de análisis influye en el tamaño de la muestra: Comparación de Medias Estimación de Proporciones ( parámetros) Análisis Univariables Análisis Multivariables

HETEROGENEIDAD POBLACIONAL Cuanto mas heterogénea sea la población mayor será su varianza poblacional lo que implicará mayores tamaños muestrales. Cuando se desconoce el valor de la varianza poblacional se recurre al supuesto mas desfavorable, asumiendo una varianza poblacional igual a 0,5.

0,5 significa que una unidad seleccionada tiene 50 % de posibilidades de pertenecer o no a un grupo específico dentro de la población.

3/24/2019

2DA PARTE: ERRORES Y CÁLCULO DEL TAMAÑO DE LA MUESTRA 18

ERRORES, ERRORES, ERRORES Aleatorio

Muestral Sistemático

V = v± e Valor Verdadero en la población

Valor Medido en la muestra

ERROR

ERROR ALEATORIO El error aleatorio no se suele ajustar a ninguna regla o norma , varían en cada caso , en su sentido y magnitud, y por ello tiende a anularse cuando se trata de un número elevado de casos.  Los errores aleatorios se cometen, por ejemplo, cuando un encuestado elige erróneamente una casilla queriendo hacerlo en otra, cuando un encuestador marca erróneamente un dato, etc.

ERRORES SISTEMÁTICOS 



Un error sistemático es aquel que se produce de igual modo ( sentido y proporción) en todas las mediciones que se realizan sobre un parámetro de la muestra

Contrario al error aleatorio, NO se anula en muestras grandes.

ERRORES SISTEMÁTICOS. EJEMPLOS Las tendencias subjetivas conscientes o inconscientes del investigador. Sustituciones, según criterio propio del investigador, de unidades de la muestra que habían sido elegidas al azar. Insuficiente observación del conjunto de la población que influye en una deficiente definición de sus características.

ERROR MUESTRAL  Cuando se extrae una muestra de una población es

frecuente que los resultados obtenidos de la muestra no sean exactamente los valores reales de la población.

 El error de muestreo ocurre al estudiar una muestra en

lugar de la población total.

 La diferencia entre el valor del parámetro de una

población y el obtenido de una muestra recibe el nombre de error muestral. ( y que no puede ser asociado a otro tipo de explicación, es decir no es error aleatorio o sistemático)

ERROR MUESTRAL Por muy perfecta que sea la muestra siempre habrá grado de divergencia entre los parámetros estimados usándola y los de la verdadera población. En el cálculo del error intervienen: Tamaño de la muestra Varianza poblacional Nivel de confianza Tipo de muestreo

ESTIMACIÓN DEL ERROR



Cuando variable bajo estudio es una media. (solo válido para variables numéricas)

s ez 1 f n Donde: Z: grado de confianza de la estimación s: desviación típica muestral de la variable analizada n: tamaño de la muestra 1-f: Factor de corrección para poblaciones finitas. f= n/N

EL ERROR MUESTRAL ES MAYOR EN LA MEDIDA QUE: Crece el grado de confianza que el investigador quiere dar a su estimación del parámetro medido mediante la muestra  Es más elevada la variabilidad de la variable estudiada.  Es menor el tamaño de la muestra. 

ESTIMACIÓN DEL ERROR



Cuando la variable bajo estudio es una proporción (ej, variables nominales u ordinales con pocas categorías)

pq ez 1 f n 1 Donde: Z: grado de confianza de la estimación p: proporción de la muestra para la categoría a examinar q: 1-p n: tamaño de la muestra 1-f: Factor de corrección para poblaciones finitas. f= n/N

TAMAÑO DE LA MUESTRA VS. ERROR MUESTRAL

MARGEN DE CONFIANZA EN LA ESTIMACIÓN Expresa el grado de probabilidad que el investigador tiene en que su estimación se ajuste a la realidad.  Los valores comúnmente utilizados son 95, 99, 99,9% 

MARGEN DE ERROR ADMISIBLE Los incrementos en el tamaño de la muestra repercuten en una mayor precisión y por consiguiente en menor error muestral. El error muestral interviene en el cálculo del tamaño de la muestra solo si el diseño es probabilístico. En el muestreo probabilístico el investigador fija el error máximo admisible a priori y sobre esa base realiza el cálculo del tamaño de la muestra.

CÁLCULO DEL TAMAÑO DE LA MUESTRA * Para comparaciones de media

 zs  n  e

2

Para estimación de proporciones

z 2 pq n  n 1  2 e

* Para poblaciones infinitas (donde N>> n )

EJEMPLO DEL CÁLCULO DEL TAMAÑO DE LA MUESTRA (POBLACIÓN INFINITA)  Estimando qué proporción de sujetos poseen una

característica al nivel de confianza del 99.7% (Z=3) y un error de admitido del 2%, será: 2

3 x50 x50 n  5625 2 2 EL TAMAÑO DE LA POBLACIÓN NO FUE TOMADO EN CUENTA!!! POR QUÉ P y Q valen 50 % ?

CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS. (F=N/N>0,05) Ej. El número óptimo para un estudio de 60.000 personas estableciendo un nivel de confianza de 95.5%(z=2), y el margen de error en el 3%, sería 4 * 50 * 50 * 60.000 n = --------------------------------9 (60.000-1) + 4 * 50 * 50 n= 1091

2

NZ pq n 2 2 e ( N  1) Z pq

TAMAÑO DE LA MUESTRA

Fuente: Metodología y Técnicas de Investigación

3RA PARTE

TIPOS DE MUESTREO

RECORDANDO: TIPOS DE MUESTREOS PROBABILÍSTICOS •Todas las unidades tienen igual probabilidad de participar en la muestra. •La elección de cada unidad muestral es independiente de las demás •Se puede calcular el error muestral

NO PROBABILISTICOS •Cada unidad NO tiene igual probabilidad de participar en la muestra. •No se puede calcular el error muestral •Alto riesgo de invalidez producido por la introducción de sesgos

ALGUNOS TIPOS DE MUESTREO PROBABILÍSTICO

Simple

Sistemático

Estratificado

Por Conglomerados

MUESTREOS PROBABILÍSTICOS: SIMPLE

Se realiza utilizando alguna fuente de elección aleatoria. Supone que cada unidad de la población tiene elemento que lo identifica ( ej. Un número identificador) y mediante el cual puede ser elegido si “sale” sorteado.

La afirmación anterior implica que hay que tener un listado completo de TODAS las unidades de la población

MUESTREOS PROBABILÍSTICOS: SIMPLE Ventajas Facilidad en los cálculos estadísticos Elevada probabilidad de lograr “equivalencia” entre las características de la muestra y las correspondientes a la población

Desventajas Cada que cada miembro de la población tiene que ser identificado Complicado en poblaciones grandes Alto costo

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO SISTEMÁTICO Similar al muestro simple salvo que:



Solo la primera unidad de la muestra se elige al azar siempre que el número seleccionado sea mayor que el coeficiente de elevación.

1.



Coeficiente de Elevación = N/ n 

2.

Donde  N: Tamaño de la población  n : Tamaño de la muestra

Los restantes elementos de la muestra se hayan sumando, sucesivamente el coeficiente de elevación.

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO ESTRATIFICADO  Presupone el conocimiento de las características de las

unidades que forman la población para poder dividirla en grupos ( estratos)  Se eligen los integrantes de la muestra en cada estrato

creado siguiendo algún tipo de muestreo de los vistos anteriormente.

EJ. MUESTREO PROBABILÍSTICO POR ESTRATOS Escuelas

Estrato Primario Escuela Primarias

Escuela Secundarias

Escuela 1

Escuela 2

Escuela 1

Escuela 2

Profesores

Profesores

Profesores

Profesores

Se seleccionan ALEATORIAMENTE ni profesores de cada una de las escuelas seleccionadas . Ej. 2 de la escuela primaria 1 y 2 de la escuela primaria 2.

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO ESTRATIFICADO El objetivo de este tipo de muestreo es garantizar la

representatividad equitativa de los estratos ( que implica representación equitativa de las características de la población). Se logra si: Son máximas las diferencias entre los estratos Son mínimas las diferencias entre los integrantes de un mismo estrato. Los criterios de división de la población en estratos se encuentren relacionadas con los objetivos de la investigación.

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO ESTRATIFICADO  Los tamaños de cada estrato pueden ser: Los mismos ( Afiliación simple) Proporcional al peso relativo ( tamaño) del estrato dentro de la población (Proporcional) En función de la heterogeneidad de cada estrato ( Óptima)

EJEMPLO MUESTRO POR ESTRATOS. AFILIACIÓN SIMPLE

nestratos

2500  3

EJEMPLO MUESTRO POR ESTRATOS. AFILIACIÓN PROPORCIONAL

nestrato1  0,45 x 2500  1125 nestrato 2  0,39 x 2500  975 nestrato3  0,16 x 2500  400

EJEMPLO DE MUESTREO POR ESTRATOS. AFILIACIÓN ÓPTIMA Paso 1 : Multiplicar el porcentaje de la población correspondiente al estrato por la varianza del estrato

45 x1900  85500 39 x 2600  101400 16 x 2100  33600

Paso 2: Se suman todos los valores obtenidos en el paso 1 (85500+101400+33600=220500)

Paso 3: Se calcula a proporción de cada valor obtenido en el paso 1 dentro del paso 2.

Pr oporciónestrato1  85500 / 220500  0,388 Pr oporciónestrato 2 101400 / 220500  0,460 Pr oporciónestrato3 33600 / 220500  0,152 Paso 4 : Se calcula el tamaño de la muestra de cada estrato multiplicando su proporción por el tamaño de la muestra global ( 2500) 0,388 x 2500  970 0,460 x 2500  1150 0,152 x 2500  380

 970,1150 ,380  2500

VENTAJAS Y DESVENTAJAS DEL MUESTREO ALEATORIO ESTRATIFICADO Ventajas 1.

2.

No es necesario disponer de la lista de toda la población sino de las subpoblaciones de orden superior extraídas ( por ej. las escuelas primarias y secundarias) Existe una considerable reducción de costos

Desventajas 

Puede ocurrir que los integrantes de una unidad superior se parezcan, reduciendo la representatividad de otros en la muestra final.

MUESTREO ALEATORIO POR CONGLOMERADOS 



La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. A diferencia de un estrato, un conglomerado es una unidad de elementos que contienen representantes de toda la población

EJEMPLO: MUESTREO POR CONGLOMERADOS

Escuelas

Escuelas Primarias

Escuela 1

Escuela 2

Escuelas Secundarias

Escuela 1

Escuela 2

Todos los profesores de las Escuelas 2 (Primaria) y 1 (Secundaria) son parte de la muestra

EJEMPLOS DE CONGLOMERADOS



Zona Geográfica



Edificio



Una institución



…..

VENTAJAS DEL MUESTREO POR CONGLOMERADOS 



Es ventajoso, desde el punto de vista de costos, si se pueden agrupar los integrantes de la población por conglomerados, en los cuales el criterio de agrupación no sea la variable que se estudia.

No es preciso tener un listado de toda la población, sino de las unidades ( conglomerados) por los que se agruparán.

DESVENTAJAS



El error es mayor que cuando se utilizan otras técnicas de muestreo.

TIPOS DE MUESTREOS NO PROBABILÍSTICOS Por Cuotas

“ Bola de Nieve”

MUESTREO POR CUOTAS La población debe ser dividida en estratos definidos por variables cuya distribución dentro de la población sea conocida.  Se procede a calcular el tamaño de cada estrato siguiendo el mismo procedimiento que si fuese un muestreo probabilístico estratificado. ( proporcional) 

MUESTREO POR CUOTAS 

A diferencia del M. Probabilístico Estratificado el entrevistador es libre para escoger a quienes forman parte de cada estrato. (CUOTA)

MUESTREO POR CUOTAS Ventajas

Resulta más económico que los muestreos probabilísticos .  Fácil de ejecutar el trabajo de campo  No precisa el listado de la población 

Desventajas 

  

Supone mayor error muestral que los diseños probabilísticos. No existe un método válido para calcular el error. Dificultad para el control del trabajo de campo. Limitaciones en la representatividad de la muestra para las características no especificadas en los controles de cuotas.

MUESTREO DE BOLA DE NIEVE Este modelo es particularmente útil cuando se muestrean poblaciones cuyos componentes, por motivos morales, ideológicos, legales o políticos tienden a ocultar su identidad.  A partir de unos pocos individuos el entrevistador, con ayuda de los primeros, va “ conociendo” a nuevos miembros de la muestra. 

MUESTREO BOLA DE NIEVE El riesgo fundamental está asociado a la selección inadecuada de los primeros miembros de la muestra y de quienes dependerá el resto.  También es posible que ocurran distorsiones si no se tiene en cuenta criterios muy específicos para la selección de la muestra. 