tema2. Muestreo

Muestreo [2.1] ¿Cómo estudiar este tema? [2.2] Concepto de muestreo y tipos [2.3] Muestreos aleatorios [2.4] Muestreos n

Views 136 Downloads 1 File size 953KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Muestreo [2.1] ¿Cómo estudiar este tema? [2.2] Concepto de muestreo y tipos [2.3] Muestreos aleatorios [2.4] Muestreos no aleatorios [2.5] Cálculo del tamaño de la muestra [2.6] Error de muestreo y nivel de confianza: evaluación de

TEMA

2

muestras para la investigación de mercados profesional

Investigación Cuantitativa

Esquema

Muestreo estadístico

No probabilístico

Probabilístico • • • • •

Aleatorio simple Estratificado Por conglomerados Polietápico Aleatorio sistemático

• • •

Por cuotas Opinático o intencional, casual o incidental Por redes o bola de nieve

Cálculo del tamaño muestral Error de muestreo y nivel de confianza: evaluación de muestra para la investigación de mercados profesional.

TEMA 2 – Esquema

2

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Ideas clave 2.1. ¿Cómo estudiar este tema? Para estudiar este tema deberás leer las Ideas clave desarrolladas en este documento, que se complementan con lecturas y otros recursos que se muestran al final del tema para que puedas ampliar los conocimientos sobre el mismo. Por consiguiente, es suficiente con leer los contenidos de los siguientes apartados con mucha atención y siendo consciente de que toda la información que se transmite en los mismos es de esencial adquisición para un profesional del ámbito de la investigación de mercados. Se trata de conocimientos absolutamente aplicados que un investigador de mercados siempre tiene en mente y necesita en su día a día para llevar a cabo su trabajo. Se imparten con el objetivo de que sean adquiridos para desarrollar la profesión y no únicamente con el objetivo de pasar un examen o prueba. Este tema está dedicado al muestreo, que constituye el pilar fundamental de la investigación cuantitativa, pues la forma de compilación de los datos en los que se basa cualquier investigación de mercado y su calidad son los factores que garantizan la posterior utilidad de los análisis que se lleven a cabo. El muestreo, al igual que el resto de las materias que integran las disciplinas que componen la Estadística, tiene fundamentos científicos, pero la aplicación de los mismos para la obtención de muestras fiables y representativas, también tiene algo de arte. Al público en general, y a muchos de los clientes con los que se trabaja en el entorno profesional, les cuesta bastante comprender la mecánica del muestreo y, por ello, es muy importante que el profesional de la investigación de mercados tenga la mejor preparación posible en este terreno. Ganar experiencia y sabiduría en el diseño de muestras es un deber de todo profesional de la investigación de mercados, para ser capaz de jugar con todos los elementos que integran este proceso y poder elaborar propuestas alternativas que ofrezcan, a costes razonables, datos fiables y representativos de las poblaciones objetivo.

TEMA 2 – Ideas clave

3

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

El coste de un trabajo de campo es, precisamente, uno de los aspectos que más preocupa a los clientes de las empresas de investigación de mercados. A veces, se pueden llevar a cabo ajustes justificados de forma científica, mientras que, en otras ocasiones, según cuál sea el objetivo del estudio y el grado de exactitud con el que se quiera estimar el resultado, no será posible llevar a cabo rebajas. El diseñador de muestras debe estar preparado para enfrentar discusiones en torno a presupuestos de trabajo de campo con sus clientes y, tener argumentos para justificar todas las recomendaciones que deba hacer en torno a cualquier proyecto.

2.2. Concepto de muestreo y tipos Teniendo en cuenta que: » Universo: se define como el conjunto teórico finito o infinito de sujetos o elementos que tienen una característica común, observable y susceptible de ser medida. » Población estadística: conjunto finito o infinito de elementos (personas, animales, cosas, entidades…) susceptibles de ser observados, medidos o registrados con relación a alguna característica de interés para un investigador. El muestreo es el proceso de seleccionar un conjunto de individuos de una población con el fin de estudiarlos y poder caracterizar el total de la población.

Proceso estadístico

Población

Inferencia estadística

Muestreo

Muestra Figura 1. Fuente: adaptado de http://metodologiadelainvestigacion6.blogspot.com.es

TEMA 2 – Ideas clave

4

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Para muchos investigadores, el concepto de universo y de población es equivalente. Sin embargo, en la realidad se debe tener en cuenta que pueden darse diferencias. Ejemplo I

Supongamos que el departamento de marketing de la empresa «Verdifresh» quiere realizar un estudio acerca del gasto medio semanal por hogar de la ciudad de Valencia en fruta y verdura. ¿Cuál es el universo? Según la definición, el universo estaría compuesto por TODOS los hogares de la ciudad de Valencia. Sin embargo, en la realidad, el universo no se puede abarcar porque el número de hogares de Valencia es un conjunto de elementos en constante movimiento: hogares nuevos que se crean, hogares que se cierran, la cifra puede estar cambiando constantemente. Por consiguiente, para hacer el estudio, los investigadores tienen que conformarse con un censo correspondiente a una fecha concreta y, en consecuencia, con los hogares que figuren en el registro censados en ese momento. Este censo disponible es la población de referencia y a ella debe referirse el estudio y sus resultados. Por otro lado, un estudio como el que quiere abordar este departamento de marketing tendría un coste inabordable si hubiese que localizar y entrevistar a todos los hogares censados en Valencia. Con gran probabilidad, «Verdifresh» encargaría un trabajo de campo telefónico, con lo cual, el universo pasaría a ser el listado de teléfonos que utilizase la empresa de trabajo de campo, o bien, se decantaría por encuestas cara a cara en una muestra representativa de los supermercados Mercadona (que es la cadena que vende estos productos) en Valencia, con lo cual, el universo pasaría a ser el conjunto de clientes habituales y casuales de dichos supermercados. Es debido a estas cuestiones que, para la realización de estudios estadísticos se emplean muestras de la población abarcable, debiendo considerarse el concepto de universo como teórico en muchas ocasiones.

TEMA 2 – Ideas clave

5

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Dado que el objetivo de la inferencia estadística es el de inducir el comportamiento de una población a partir de la extracción y análisis de una muestra, el punto más importante de un proceso de muestreo es que la información contenida en la muestra extraída sea representativa de la población que la ha generado. Esta representatividad se consigue trabajando con las denominadas muestras aleatorias. Una muestra es aleatoria cuando todos los elementos de la población de referencia tienen la misma probabilidad de ser seleccionados y cuando estos elementos se extraen de forma independiente. Al estudiar una característica o variable de la población, nos interesará averiguar el valor de los parámetros que describen esta variable y que serán desconocidos para nosotros. La muestra, si es representativa, nos proporcionará una estimación de estos parámetros mediante los estadísticos que podremos calcular a partir de la información contenida en la muestra. Los tipos de muestreo se dividen en:

Muestreo probabilístico

Muestreo no probabilístico

Todos los individuos u objetos integrantes de la población tienen la misma probabilidad de ser extraídos para formar parte de una muestra

La elección de los elementos no depende de la probabilidad, sino de las causas relacionadas con las características de la investigación o de quien establece la muestra

Aleatorio simple Estratificado por conglomerados Polietápico Aleatorio sistemático

Por cuotas Opinático o intencional, casual o incidental, Por redes o bola de nieve Figura 2.

Elegir una muestra probabilística o no probabilística depende de los objetivos del estudio, del esquema de investigación y del alcance de sus contribuciones, pero es mucho más habitual trabajar con probabilísticas.

TEMA 2 – Ideas clave

6

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

2.3. Muestreos aleatorios Muestreos aleatorios Muestreo aleatorio simple Muestreo aleatorio estratificado Muestreo por conglomerados o racimos

Muestreo polietápico Muestreo sistemático Figura 3.

» Muestreo aleatorio simple o Es el más popular entre los muestreos probabilísticos. o Se utiliza cuando se conocen (o se tiene un listado o registro) todos los elementos que conforman la población. o Cada elemento de la población tiene la misma probabilidad de ser elegido para formar parte de la muestra. o Es el más utilizado y el más recomendable junto con sus variaciones. En la práctica, aplicar un muestreo aleatorio simple para extraer una muestra de n elementos de una población consiste en: o Disponer de un censo o lista de todos los elementos que forman la población. o Tener asignado un número identificativo para cada elemento de la población. o Utilizar una tabla de números aleatorios, un bombo de lotería, un software estadístico generador de números aleatorios o extractor de muestras, o cualquier otro dispositivo que nos permita seleccionar de forma aleatoria n números identificativos de los elementos de la población para formar una muestra de tamaño n.

TEMA 2 – Ideas clave

7

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

o Escoger los casos que corresponden a los n números aleatorios e identificar a los elementos de la población que los poseen: estos elementos son los que forman la muestra aleatoria simple.

Ventajas

Inconvenientes

El muestreo aleatorio simple garantiza las condiciones de representatividad dado que permite extraer muestras aleatorias.

Hay que tener una lista o censo de la población, cosa que no se puede lograr la mayoría de las veces.

Tabla 1. Ventajas e inconvenientes del muestreo aleatorio simple.

Actualmente, en estudios particulares, este tipo de muestreo se lleva a cabo utilizando un programa estadístico que seleccione una muestra de elementos aleatoriamente de una lista general, que es la población y, en trabajos de campo profesionales, especialmente en los telefónicos, los entrevistadores disponen del sistema CATI (Computer Assisted Telephone Interview) que efectúa selecciones de números de teléfono de listados profesionales muy grandes y representativos de las poblaciones, de forma automática. Ejercicio I

Supongamos que sobre una población de 20 estudiantes universitarios estamos investigado acerca de los que han tenido alguna experiencia laboral. Estudiante 1.Juan 2. Lucía 3.Pedro 4. Marcos 5. Laura 6. Amparo 7. Alejandro 8.Miguel 9. Eduardo 10. María

¿Experiencia laboral? Sí NO NO NO SÍ SI NO NO NO SÍ

Estudiante 11. Rebeca 12. Rafael 13. Vicente 14. Lucas 15. Natalia 16. Patricia 17. Mario 18. Javier 19. Luis 20. Aitana

¿Experiencia laboral? NO NO SÍ NO NO NO NO NO SÍ SÍ

Tabla 2.

Elija una muestra aleatoria simple de tamaño n = 8 de esta población. Use la tabla de números aleatorios adjunta, empiece en la fila 2 columna 1 y continúe seleccionando dígitos adecuados al caso hacia la derecha. Cuando termine proporcione una lista con los integrantes de la muestra.

TEMA 2 – Ideas clave

8

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

17 5 17 25 27 22 38 18 9 32 33 3 28 39 39 17

30 34 31 12 40 13 2 3 31 22 14 6 33 10 21 18

Tabla de números aleatorios 13 31 24 26 14 11 23 9 40 2 22 27 27 10 12 30

5 15 34 20 2 9 19 20 1 22 9 33 25 29 28 24

Tabla 3.

o ¿Cuál es el parámetro poblacional que nos interesa estudiar en esta población? o ¿Qué resultado muestral nos proporciona la muestra extraída acerca de este parámetro? o ¿Se parece al poblacional? Solución

Para generar la muestra aleatoria simple, tomamos 8 números de la tabla de números aleatorios. Comenzamos, tal como se nos indica, por la fila 2 de la columna 1, que contiene el número 5 y continuamos hacia la derecha. El siguiente número es el 34, pero como sólo tenemos 20 estudiantes, lo dejamos. El siguiente es el 31, que tampoco nos sirve. El siguiente es el 15: lo tomamos. Seguimos en la tercera fila. Tomamos el 17 y los otros no nos sirven. Seguimos en la cuarta fila, que nos proporciona dos números válidos: el 12 y el 20. Seguimos en la quinta fila, que nos proporciona el 14 y el 2. Seguimos en la sexta fila, que nos proporciona el 13. Con este número ya tenemos 8, que son: 5, 15, 17, 12, 20, 14, 2, 13. Ahora, para extraer la muestra, tomamos a los estudiantes de la lista que se corresponden con estos números aleatorios, tal y como se ve en la siguiente tabla.

TEMA 2 – Ideas clave

9

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Estudiante 1.Juan 2. Lucía 3.Pedro 4. Marcos 5. Laura 6. Amparo 7. Alejandro 8.Miguel 9. Eduardo 10. María

¿Experiencia laboral? Sí NO NO NO SÍ SI NO NO NO SÍ

Estudiante 11. Rebeca 12. Rafael 13. Vicente 14. Lucas 15. Natalia 16. Patricia 17. Mario 18. Javier 19. Luis 20. Aitana

¿Experiencia laboral? NO NO SÍ NO NO NO NO NO SÍ SÍ

Tabla 4.

El parámetro poblacional que nos interesa estudiar acerca de esta población es: Parámetro poblacional = P = proporción de estudiantes que tienen experiencia laboral en la población La muestra extraída, proporciona una estimación de este parámetro, la proporción muestral o número de casos de la muestra que tienen experiencia laboral, que en este caso es: Proporción muestral = p = 3/8 = 0,375 El resultado obtenido mediante la muestra aleatoria simple, indica que la proporción de estudiantes que tiene experiencia laboral en esta población está en torno al 37,5%. En este caso, conocemos el parámetro poblacional, pues: P = 7/20 = 0,35 Por consiguiente, el resultado real en la población es que hay un 35% de estudiantes con experiencia laboral. La muestra se ha aproximado bastante, pero se da una diferencia entre p y P, que es el error muestral. En este caso, no hemos controlado el error, pues simplemente queríamos experimentar la mecánica de la extracción, pero en la realidad si se hace, ya que el tamaño de la muestra se calcula para cometer un error concreto (el menor posible), para un nivel de confianza determinado de las estimaciones. Al explicar el cálculo del tamaño de la muestra se verá claro este aspecto del muestreo.

TEMA 2 – Ideas clave

10

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

» Muestreo aleatorio estratificado El muestreo aleatorio estratificado es una ampliación del simple, que proporciona muestras más eficientes a partir de la utilización de más información acerca de la población. Al explicar el muestreo aleatorio simple, hemos considerado a la población como un conjunto de individuos acerca de los que interesa estudiar una característica, sin plantearnos la existencia de subgrupos (denominados estratos) de interés dentro de la población. Sin embargo, en la realidad, muchas poblaciones están subdivididas en estratos que hay que tener en cuenta a la hora de diseñar muestras. Ejemplo II

Supongamos que se desea realizar un estudio acerca de la intención emprendedora de los estudiantes universitarios en España. La población objetivo de este tipo de estudio es la población de estudiantes universitarios de España. En este caso, para tener una muestra representativa de esta población, hay que tener en cuenta que está formada por los estratos de las especialidades:

Figura 4. Fuente: Elaboración propia.

TEMA 2 – Ideas clave

11

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Por supuesto, también será importante considerar otros estratos tales como: o Universidad o Curso o Género Y otros, pero la especialidad es fundamental, pues es un factor muy determinante de la intención emprendedora. Si al diseñar una muestra representativa de la población para un estudio cualquiera no se tiene en cuenta la existencia de estratos, podríamos obtener como resultado lo que se conoce como una muestra sesgada. Una muestra sesgada sería aquella que mostraría un desequilibrio en la composición: demasiados (o pocos) hombres o mujeres, demasiados (o pocos) jóvenes o mayores, respecto de la población, y así sucesivamente. Una muestra es representativa de la población cuando su distribución reproduce la de la población en sus estratos relevantes. Si al calcular la distribución muestral y compararla con la poblacional vemos que hay diferencias notables entre los porcentajes de personas en cada estrato, entonces estaremos ante una muestra sesgada que no representa bien a la población. Se denomina muestreo estratificado a aquel en el que los elementos de la población se dividen en estratos, en que la muestra se toma asignando un número determinado de miembros a cada estrato y escogiendo, finalmente, por muestreo aleatorio simple a los elementos dentro de cada estrato. Una muestra estratificada puede ser proporcional o no serlo. En la realidad, lo más habitual es diseñar muestras proporcionales, es decir, muestras que se compongan de una proporción de elementos igual a la que hay en la población para cada estrato. Por eso, cuando se realiza un muestreo estratificado proporcional, lo que se hace es dividir el tamaño total de la muestra proporcionalmente al tamaño relativo del estrato en la población. 𝑛

𝑛

𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑎 = ∑ 𝑛𝑖 = ∑ 𝑛 · 𝑖=1

TEMA 2 – Ideas clave

12

𝑖=1

𝑁𝑖 𝑁

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Siendo: o n el tamaño de la muestra total. o ni el tamaño muestral de cada estrato. o Ni el tamaño poblacional de cada estrato. o N el tamaño de la población. Por ejemplo, si en una población hay un 55% de mujeres y un 45% de hombres, en la muestra mantendremos esta misma proporción. Sin embargo, la muestra no proporcional puede ser la más eficiente en algunos casos, como vamos a ver enseguida. Este procedimiento es satisfactorio si no hay gran diferencia en dispersión de un estrato a otro. Pero no es el procedimiento más eficiente cuando las desviaciones estándares difieren sustancialmente en los distintos estratos, ya que la consideración más importante para la representatividad de la muestra no es el tamaño, sino la variación de la población. Ejemplo III

Supongamos que tenemos una población de N = 500 individuos dividida en cuatro grupos de edad (estratos) de tamaño: 10%, 20%, 30% y 40% de la población y que ha de extraerse una muestra de n = 200 individuos. Una muestra proporcional se compondría de: 20 individuos del estrato 1, ya que 200x0,1 = 20 individuos 40 individuos del estrato 2, ya que 200x0,2 = 40 individuos 60 individuos del estrato 3, ya que 200x0,3 = 60 individuos 80 individuos del estrato 4, ya que 200x0,4 = 80 individuos Total

200 individuos

Este procedimiento es satisfactorio si no hay gran diferencia en dispersión de un estrato a otro. Pero no es el procedimiento más eficiente cuando las desviaciones estándares difieren sustancialmente en los distintos estratos, ya que la consideración más importante para la representatividad de la muestra no es el tamaño sino la variación de la población.

TEMA 2 – Ideas clave

13

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Ejemplo IV

Supongamos que tenemos una población de 500 personas estratificada en grupos de edad como en el ejemplo anterior:

Grupo de edad

Frecuencia

Porcentaje

Porcentaje válido

Porcentaje acumulado

18-24 AÑOS

50

10,0

10,0

10,0

25-34 AÑOS

100

20,0

20,0

30,0

35-44 AÑOS

150

30,0

30,0

60,0

45-54 AÑOS

200

40,0

40,0

100,0

Total

500

100,0

100,0

10,0

Tabla 5.

Supongamos que analizamos la distribución de la edad concreta de los individuos en cada uno de los estratos y que obtenemos el siguiente resultado: N

Media

Desviación típica

Estrato

Tamaño

Edad

Edad

1,00

50

20,46

1,82

2,00

100

29,41

2,88

3,00

150

39,45

3,38

4,00

200

49,11

2,78

Total

500

39,40

10,11

Tabla 6.

Observando los resultados, vemos que la desviación estándar del Estrato 1 es menor que la del Estrato 2, que a su vez es menor que la del Estrato 3. En cambio, el Estrato 4 presenta una desviación estándar parecida a la del Estrato 2. En consecuencia, la distribución de las edades es más dispersa en el Estrato 3 que en los otros y, por consiguiente, para extraer una muestra representativa de dicho estrato vemos, intuitivamente, que se necesitará un tamaño muestral mayor que en algunos de los otros casos.

TEMA 2 – Ideas clave

14

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

El tamaño inicial del estrato no es lo más importante, sino la variabilidad de su contenido. El Estrato 3 tiene 150 individuos, 50 menos que el Estrato 4, que tiene 200. Si aplicamos la proporcionalidad a la determinación de la muestra, tomaríamos 80 individuos del Estrato 4 y 60 del Estrato 3. Sin embargo, como veremos a continuación, si tenemos en cuenta que el Estrato 3 es más disperso la muestra más eficiente tomaría más elementos del Estrato 3 que la proporcional y menos elementos del Estrato 4 que la proporcional. En definitiva, para obtener la máxima eficiencia en la estratificación, debemos asignar mayor representación a los estratos con mayor dispersión y menor representación a los estratos con menor dispersión. Para ello, podemos dividir el tamaño total de la muestra entre los estratos proporcionalmente a la variabilidad del estrato, tomando menos elementos de estratos donde la característica tenga menor dispersión. Esto se consigue aplicando la asignación de Neyman:

𝑛𝑖 = 𝑛 ·

𝑁𝑖 𝜎𝑖 𝑛 ∑𝑖=1 𝑁𝑖 𝜎𝑖

Siendo: o

ni = tamaño muestral del estrato.

o

n = tamaño de la muestra total a extraer.

o

Ni = tamaño poblacional del estrato.

o

σi = desviación estándar de la variable en cada estrato poblacional.

Ejemplo V

De la población anterior de N = 500 individuos dividida en cuatro grupos de edad (estratos) de tamaño: 10%, 20%, 30% y 40% de la población, ha de extraerse una muestra de n = 200 individuos. Se sabe que la dispersión poblacional de cada estrato es: 1,82; 2,88; 3,38 y 2,78 años. Determinar el tamaño muestral de cada estrato aplicando la asignación de Neyman para lograr la máxima eficiencia.

𝑛1 = 𝑛 ·

𝑁𝑖 𝜎𝑖 𝑛 ∑𝑖=1 𝑁𝑖 𝜎𝑖

= 200 ·

50 · 1,82 = 12,62 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78

𝑛2 = 𝑛 ·

𝑁𝑖 𝜎𝑖 𝑛 ∑𝑖=1 𝑁𝑖 𝜎𝑖

= 200 ·

100 · 2,88 = 39,98 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78

TEMA 2 – Ideas clave

15

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

𝑛3 = 𝑛 ·

𝑁𝑖 𝜎𝑖 𝑛 ∑𝑖=1 𝑁𝑖 𝜎𝑖

= 200 ·

150 · 3,38 = 70,31 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78

𝑛4 = 𝑛 ·

𝑁𝑖 𝜎𝑖 𝑛 ∑𝑖=1 𝑁𝑖 𝜎𝑖

= 200 ·

200 · 2,78 = 77,11 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78

Comparemos las muestras:

Muestra proporcional

estratificada

Muestra estratificada eficiente no proporcional

Estrato 1

20

12,62≈13

Estrato 2

40

39,98≈40

Estrato 3

60

70,31≈70

Estrato 4

80

77,11≈77

Total

200

200 Tabla 7.

En conclusión, necesitaríamos realizar menos entrevistas en los Estratos 1 y 4, las mismas en el Estrato 2 y más entrevistas en el Estrato 3. ¿Cuál es el obstáculo al que nos enfrentamos en la realidad para aplicar la asignación eficiente de Neyman? El desconocimiento de la variabilidad de los estratos de la población, que salvo excepciones no suele estar disponible. ¿Cómo podemos solucionar este problema? Obteniendo estos datos a partir de estudios previos si los hay, apelando al juicio de expertos, realizando muestras piloto o, incluso, aplicando la intuición si se tiene mucha experiencia. En caso de no ser factible llevar a cabo la determinación de la variabilidad de los estratos, entonces se aplicará la asignación proporcional. » Muestreo por conglomerados o racimos Se utiliza cuando no es posible obtener una lista de todos los elementos de la población y su empleo es adecuado si la población es muy grande y dispersa.

TEMA 2 – Ideas clave

16

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Los conglomerados se caracterizan por ser homogéneos entre sí, pero internamente presentan un alto grado de heterogeneidad en sus componentes. La técnica consiste en lo siguiente: se divide a la población en grupos o racimos, luego se selecciona aleatoriamente algunos de esos grupos, por considerar que cada uno de ellos es representativo de la población y, posteriormente, se toma una muestra aleatoria de cada uno de los grupos que se han seleccionado. Este procedimiento produce una muestra más precisa a un menor costo ya que se utiliza cuando hay una variación considerable dentro de cada grupo, siendo los grupos similares entre sí. El conglomerado es común en los diseños polietápicos y en las muestras de zona geográfica. Cuando se muestrean conglomerados que contienen números de unidades desiguales, pueden utilizar el muestreo probabilístico proporcional al tamaño para que la probabilidad de selección del conglomerado sea igual a la proporción de unidades que contiene. Ejemplo VI

Como hemos visto, en la muestra por conglomerados, los elementos que componen una población se reúnen en unidades de muestreo de mayor tamaño, llamadas conglomerados. Para llevar a cabo una encuesta electoral, o de consumo, o de opinión, podemos muestrear familias en lugar de votantes, consumidores u opinantes individuales. En estos casos, las familias forman los conglomerados y los miembros de las familias son las unidades de muestreo. Otros casos típicos son los que se diseñan para analizar los gastos familiares o para controlar el nivel de audiencia de los programas y cadenas de televisión. En estos casos, se utiliza un muestreo por conglomerados–familias que han sido elegidas aleatoriamente. Las familias incluyen personas de todas las edades, muy representativas de las mismas edades y preferencias de la totalidad de la población.

TEMA 2 – Ideas clave

17

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

» Muestreo polietápico Muestreo en el que se procede por etapas: se obtiene una muestra de unidades primarias, más amplias que las siguientes; de cada unidad primaria se toman, para una submuestra, unidades secundarias, y así sucesivamente hasta llegar a las unidades últimas o más elementales. Puede considerarse como una modificación del muestreo por conglomerados. En este caso, no forman parte de la muestra elementos o unidades de todos los conglomerados, sino que, una vez seleccionados los conglomerados aleatoriamente, se efectúan submuestras dentro de cada uno de ellos. Ejemplo VII

Múltiples etapas, polietápico: o 1º etapa: muestra de ciudades. o 2º etapa: muestra de familias. o 3º etapa: muestra de individuos. El Instituto Nacional de Estadística de España aplica este diseño para la realización de muchas encuestas debido al gran tamaño y dispersión de la población española. Por ejemplo, para la encuesta nacional de salud, en la que se capta la opinión de los españoles sobre su salud y sobre el sistema nacional de salud, se efectúa una selección de municipios, distritos, hogares y, finalmente, un miembro del hogar. » Muestreo sistemático Los elementos se seleccionan de la población en un intervalo uniforme que se mide respecto de tiempo, orden o espacio. Se emplea si existe una lista ordenada sistemáticamente de los elementos de la población, siendo imprescindible conocer cuántos elementos componen esa población. Es el muestreo más adecuado para llevar a cabo auditorías, por ejemplo, ya que permite extraer muestras sistemáticas y aleatorias de documentos de cualquier archivo documental organizado.

TEMA 2 – Ideas clave

18

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

La técnica consiste en tomar cada k elementos de una lista que contiene todos los elementos de una población, eligiéndose al azar el primer elemento de la muestra. Para determinar el valor k se calcula el cociente entre el tamaño de la población N y el tamaño de la muestra n. Ejemplo VIII Si se tiene una población de 150 documentos ordenados según un número de registro y se desea tomar una muestra de 30, entonces, en primer lugar, se calcula k:

𝐾 =

𝑁 150 = =5 𝑛 30

Este resultado indica que habrá que tomar un documento de cada 5, comenzando por uno que se determina tomando un número al azar entre 1 y 5. Si el número escogido al azar fuese el 2, entonces, se tomaría el segundo documento, después el número 7, después el número 12, después el 17 y así, sucesivamente, hasta tener una muestra de 30 documentos. El azar, en este caso, interviene en la selección del número por el cuál comenzar la primera extracción. El resto de elementos de la muestra se extrae de forma sistemática.

Figura 5. Fuente: https://egonzalezauditoriadesistemas.wordpress.com

TEMA 2 – Ideas clave

19

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

2.4. Muestreos no aleatorios Muestreo no aleatorio Muestreo por cuotas Muestreo opinático o intencional Muestreo por casual o incidental Muestreo por redes Muestreo sistemático Figura 6.

» Muestreo por cuotas o Es el más popular de los muestreos no probabilísticos. o Consiste en formar estratos de la población sobre la base de ciertas características y en procurar que estén representadas en proporciones semejantes a las que existen en la población. o Principales características utilizadas para estratificar la población: sexo, edad, ocupación, etc. o Una vez determinada la cuota se eligen los primeros que se encuentran y que cumplen esas características. Este tipo de muestreo tiene como beneficio que se pueden realizar estudios exploratorios rápidos y económicos. Por ejemplo: Una empresa farmacéutica quiere estimar la aceptación del sabor de un nuevo producto de cierta gama inocua, para lo cual invita a la degustación del producto en un hospital utilizando un muestreo por cuotas de sexo y edad, para estimar si hay diferencias entre hombres, mujeres, niños, jóvenes, adultos de mediana edad y mayores de 64 años. Los encuestadores y administradores del producto, van llenando cuotas establecidas de personas con estas características hasta completar la muestra y ellos son los que eligen a las personas según su criterio.

TEMA 2 – Ideas clave

20

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

» Muestreo opinático o intencional Es una técnica que se basa en la opinión del investigador para constituir una muestra de sujetos en función de su carácter típico, como en el estudio de casos extremos o marginales, o de los casos típicos. Permite estudiar fenómenos raros o inusitados. Es cierto que en este tipo de muestreo la realización del trabajo de campo puede simplificarse enormemente al concentrarse mucho la tarea de selección de la muestra. Sin embargo, se pueden cometer errores y sesgos debidos al investigador por tratarse de un muestreo subjetivo (según las preferencias del investigador) y, también por el hecho de que los resultados de la encuesta no tienen fiabilidad estadística exacta. Por ejemplo: o Encuesta sobre consumo de un producto financiero muy específico. o Encuestas a usuarios de sistemas de envío de dinero al extranjero. o Encuestas a compradores de productos informáticos y otras. » Muestreo casual o incidental La muestra está conformada por sujetos fácilmente accesibles y presentes en un lugar determinado, y en un momento preciso. Los sujetos se incluyen en el estudio a medida que se presentan, y hasta que la muestra alcance el tamaño deseado. Por ejemplo: o Encuestas en vía pública que se realizan en un día y horario determinado. o Encuestas de opinión a la salida de cines acerca de una programación concreta. » Muestreo por redes (bola de nieve) o Consiste en localizar a algunos individuos según determinadas características. o Se utiliza en poblaciones marginales o de difícil acceso. o Se basa en redes sociales, en las amistades. Cuando se encuentra el primer representante, este puede conducir a otro, y ese a un tercero, y así, sucesivamente hasta conseguir una muestra suficiente.

TEMA 2 – Ideas clave

21

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Por ejemplo: o Personas que padecen una determinada enfermedad. o Personas que fueron sometidas a un tipo particular de intervención. o Personas que forman parte de determinados grupos sociales, etnias, refugiados y similares.

Figura 7. Fuente: https://egonzalezauditoriadesistemas.wordpress.com

2.5. Cálculo del tamaño de la muestra Determinar el tamaño para que una muestra sea representativa y proporcione estimaciones fiables es uno de los elementos clave del muestreo. Pero, ¿por qué es tan importante? Cuando queremos estimar un parámetro poblacional utilizamos un estimador. Los mejores estimadores para los casos más habituales de estimar una media (µ), una desviación estándar (σ) o una proporción (P) poblacional son la media (¯x), la desviación estándar (s) y la proporción (p) muestral. Pero, aun trabajando con los mejores estimadores, sabemos que se va a producir un error, es decir, una diferencia entre el parámetro poblacional y el valor de la estimación muestral. Este error se denomina error de muestreo. Este error es desconocido, porque también lo es el parámetro poblacional. Por esta razón, se construyen intervalos de confianza que nos proporcionan los límites entre los cuales hay una probabilidad de que el verdadero valor del parámetro esté contenido en ellos.

TEMA 2 – Ideas clave

22

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

El tamaño muestral forma parte de la formulación de los intervalos de confianza y, de hecho, si observamos el siguiente intervalo para la media poblacional:

𝑃 (𝑥̅ − 1,96

𝜎 √𝑛

≤ 𝜇 ≤ 𝑥̅ + 1,96

𝜎 √𝑛

) = 0,95

Donde: 1,96 = α/2 = valor de la distribución normal estándar que limita el área de confianza del 95%.

Figura 8. Fuente: http://es.slideshare.net

Es fácil darse cuenta de que el error muestral es 1,96

𝜎 √𝑛

, ya que es la cantidad en que el

estimador muestral difiere del parámetro poblacional. Teniendo en cuenta este hecho, un analista puede decidir cuál es el error máximo que quiere cometer al estimar el parámetro con un nivel de confianza dado. Es decir, puede fijar un valor para el error muestral y, a partir de ese valor, determinar cuál debe ser el tamaño de la muestra (n) para que se cumpla con la probabilidad asignada, es decir, para el nivel de confianza fijado. Como cada parámetro tiene su propio intervalo de confianza, la determinación del tamaño muestral obedece a una fórmula concreta según queramos estimar: » Una media poblacional (µ). » Una proporción poblacional (P). » Una desviación estándar poblacional (σ).

TEMA 2 – Ideas clave

23

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Nosotros vamos a limitar la explicación a los dos primeros: determinar el tamaño de la muestra para estimar una media y para estimar una proporción poblacionales, que son los que se dan a la práctica en investigación de mercados profesional. Es muy importante tener en cuenta, en las siguientes fórmulas, los valores que toma Zα/2 según el nivel de confianza que se escoja: Zα/2 = 1,96 para un nivel de confianza del 95%, que es el más habitual. Zα/2 = 1,64 para un nivel de confianza del 90%. Zα/2 = 2,58 para un nivel de confianza del 99%. » Tamaño muestral para estimar una media poblacional 1. Si conocemos la varianza poblacional:

𝑆𝑒𝑎 𝑑 = 𝑒𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑧𝛼⁄2

𝜎 √𝑛

Despejando de esta expresión la n o tamaño muestral, tenemos: 𝑧𝛼/2 𝜎 2 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( ) 𝑑 Entonces, se cumple que:

𝑃(𝜇 − 𝑑 ≤ 𝑥̅ ≤ 𝜇 + 𝑑) = 1 − 𝛼 Es decir, que, para un nivel de confianza dado, la media muestral queda entre el parámetro poblacional menos y más el error muestral con la probabilidad 1-α. Ejercicio Un punto de venta de «Verdifresh» quiere calcular el gasto medio mensual en ensaladas de sus clientes. ¿Qué tamaño muestral, o, dicho de otra forma, a cuántos clientes tiene que entrevistar para averiguar este gasto medio con un nivel de confianza del 99% y sin cometer un error superior a 5 euros? Se supone que el gasto sigue una normal de desviación estándar de 12 euros.

TEMA 2 – Ideas clave

24

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Solución Datos de los que disponemos: Conocemos la desviación estándar poblacional (que es lo mismo que conocer la varianza) σ = 12 euros Sabemos el nivel de confianza 1-α = 0,99 de donde el valor de zα/2 = 2,58 Sabemos el error que queremos cometer como máximo d = 5 euros Por consiguiente, el tamaño muestral adecuado para estimar la media poblacional en estas condiciones es: 𝑧𝛼/2 𝜎 2 2,58 ∙ 12 2 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( ) =( ) = 38,34 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 𝑑 5 En definitiva, si entrevistamos aleatoriamente a unos 38 clientes habituales y representativos, tenemos una probabilidad del 95% de que la media muestral que obtengamos cumpla que: 𝑃(𝜇 − 5 ≤ 𝑥̅ ≤ 𝜇 + 5) = 0,95 2. Si no conocemos la varianza: La fórmula a aplicar para determinar el tamaño muestral es: 𝑧𝛼/2 𝑠 2 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( ) 𝑑 Es la misma fórmula que para el caso de varianza conocida pero la varianza poblacional se sustituye por una estimación (s) de dicha varianza (ya que es desconocida) que se obtiene con lo que llamamos una muestra piloto, es decir, entrevistando a unas pocas personas, o haciendo una medición para unas cuantas unidades, o tomando un valor de un estudio anterior o cualquier otro dato que nos permita obtener una varianza muestral.

TEMA 2 – Ideas clave

25

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

» Tamaño muestral para estimar una proporción poblacional Al igual que en el caso de la media, partimos de la fórmula del intervalo de confianza para estimar una proporción poblacional:

𝑃(1 − 𝑃) 𝑃(1 − 𝑃) 𝑃(𝑝 − 𝑧𝛼⁄2 √ ≤ 𝑃 ≤ 𝑝 + 𝑧𝛼⁄2 √ )=1−𝛼 𝑛 𝑛

𝑃(1 − 𝑃) 𝑆𝑒𝑎 𝑑 = 𝑒𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑧𝛼⁄2 √ 𝑛

Despejando de esta expresión la n o tamaño muestral, tenemos: 𝑧𝛼2 𝑃(1 − 𝑃) 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =

2

𝑑2

Como desconocemos la proporción poblacional P, podemos sustituirla por la proporción obtenida en una muestra piloto, o directamente, como se hace la mayoría de las veces, por el valor p = 0,5 que es el que corresponde al supuesto de máxima amplitud del intervalo de confianza, también llamado de máxima indeterminación. Es importante comprender el supuesto de máxima indeterminación, porque se aplica constantemente, ya que lo más habitual es desconocer cómo se comporta una población en cuanto a la proporción de sus integrantes que hacen o no alguna cosa, que poseen o no una cualidad y similares. Si, por ejemplo, estamos estudiando la proporción de personas que comprarían un producto o no lo harían en una población, lo más normal, es que no tengamos idea de cuál sería la proporción de los que comprarían. Entonces, el «peor» supuesto o de máxima indeterminación, o de máxima dispersión, es el de suponer que el 50% lo compre y el otro 50% no lo compre. En este caso: p = 0,5 y q = (1-p) = 0,5 varianza p.q = 0,5·0,5 = 0,25

TEMA 2 – Ideas clave

26

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Cualquier otro supuesto que hiciésemos, nos daría una varianza menor, es decir, una situación menos dispersa en la población. Por ejemplo: o Si p = 0,1 (lo compra un 10%) y q = 0,9, (no lo compra un 90%), entonces p·q = 0,1·0,9 = 0,09. o Si consideramos p= 0,4 (lo compra un 40%) y q= 0,6 (no lo compra un 60%), entonces p·q = 0,4·0,6 = 0,24, etc. Cualquier par de valores de p y q que probemos dará un valor de pq menor que 0,25. Por eso, tomando 0,25, aseguramos que nos ponemos «en el peor» de los casos, de forma que, la estimación que hagamos de P será fiable porque abarcará todas las situaciones posibles, incluyendo la más dispersa de todas. Por consiguiente, el tamaño muestral para estimar una proporción: 𝑧𝛼2 𝑝(1 − 𝑝) 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =

2

𝑑2 𝑧𝛼2 0,5 ∙ 0,5

𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =

2

𝑑2

Entonces, se cumple que: 𝑃(𝑃 − 𝑑 ≤ 𝑝 ≤ 𝑃 + 𝑑) = 1 − 𝛼 Es decir, que, para un nivel de confianza dado, la proporción muestral queda entre el parámetro poblacional menos y más el error muestral con la probabilidad 1-α. Ejercicio El jefe del departamento de marketing de «Verdifresh» quiere averiguar qué proporción de clientes de una zona de Valencia visita la página web de la empresa con un error máximo del 5%.

TEMA 2 – Ideas clave

27

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Se sabe que hace dos años un estudio similar dio un valor del 25% de los clientes de la zona. Determina el tamaño muestral mínimo necesario para obtener una muestra que proporcione una estimación de la proporción poblacional de clientes de la zona que visitan actualmente la web al 95% de confianza. Solución Sabemos que p = 0,25. Sabemos que 1-α = 0,95, por lo que los valores de z son ±1,96. Sabemos que el error máximo que se quiere cometer es del 5%, por lo que d = 5/100 = 0,05 (recordad que el error siempre se pone en la fórmula en tanto por uno en el caso de estimación de proporciones) Por consiguiente: 𝑧𝛼2 𝑝(1 − 𝑝) 𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =

2

𝑑2

=

1,962 ∙ 0,25 ∙ 0,75 = 288,12 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠 0,052

Para estimar la proporción de clientes de la zona que visitan la web con un error máximo del 5% y un nivel de confianza del 95%, hay que entrevistar a 288 clientes como mínimo. Si se hacen las entrevistas aplicando un muestreo aleatorio, entonces, se cumplirá que: 𝑃(𝑃 − 5 ≤ 𝑝 ≤ 𝑃 + 5) = 0,95 Es decir, que para un nivel de confianza del 95%, la proporción muestral quedará entre el parámetro poblacional menos y más el error muestral del 5% con una probabilidad de 0,95. » Tamaño muestral para estimar una media o una proporción poblacional en el caso de poblaciones finitas Las fórmulas presentadas en el apartado anterior, se utilizan habitualmente cuando no se conoce el tamaño de la población objetivo o cuando se supone que es infinito.

TEMA 2 – Ideas clave

28

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

En el caso de conocer el tamaño de la población objetivo, se recomienda el uso de las siguientes fórmulas alternativas, ya que, en muchos casos, reducen el tamaño de la muestra, lo cual implica una reducción de costes para el cliente en la realización de trabajos de campo. o Para el caso de estimación de una media poblacional:

𝑛=

𝑁. 𝑧 2 . 𝑆 2 𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2

o Para el caso de estimación de una proporción poblacional: 𝑁. 𝑧 2 . 𝑝𝑞 𝑛= 2 𝑑 (𝑁 − 1) + 𝑧 2 𝑝𝑞 Ejercicio 1 ¿A cuántas personas tenemos que entrevistar de una población de 50 000 habitantes para saber la edad media con un nivel de confianza del 99% y un error máximo de 1 año si en una muestra piloto se obtuvo una varianza de 45 años al cuadrado? Solución 1 Como se trata de estimar una media poblacional para una población finita, aplicamos:

𝑛=

𝑛=

𝑁. 𝑧 2 . 𝑆 2 𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2

50 000. 2,582 . 45 14 976 900 = = 297,76 2 2 1 (50 000 − 1) + 2,58 . 45 49 999 + 299,538

Redondeando, habría que entrevistar a 298 personas seleccionadas aleatoriamente. Ejercicio 2 ¿A cuántas personas tendría que estudiar de una población de 15 000 habitantes para conocer cuántas compran fármacos al menos una vez por semana con un nivel de confianza del 95% y un error muestral del 2%?

TEMA 2 – Ideas clave

29

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Solución 2 Como se trata de estimar una proporción poblacional para una población finita, aplicamos:

𝑛=

𝑛=

𝑁. 𝑧 2 . 𝑝𝑞 𝑑2 (𝑁 − 1) + 𝑧 2 𝑝𝑞

15 000. 1,962 . 0,5.0,5 14 406 = = 2069,82 2 2 0,02 (15 000 − 1) + 1,96 . 0,5.0,5 5,9996 + 0,9604

Redondeando, habría que entrevistar a 2 070 personas.

2.6. Error de muestreo y nivel de confianza: evaluación de muestras para la investigación de mercados profesional » Jugando con el nivel de confianza y el error muestral Cuando se elaboran presupuestos de trabajo de campo es importante saber jugar con el nivel de confianza y el error muestral, para poder ofrecer al cliente precios ajustados y entregar muestras de fiabilidad que puedan ir desde una fiabilidad aceptable, a una estándar y a una excelente. o Las muestras estándar son aquellas en las que se aplica un error muestral máximo del ±5% para un nivel de confianza del 95%. o Las muestras aceptables son aquellas en las que se aplica un error muestral máximo del ±5% para un nivel de confianza de entre el 90% y el 94%. o Las muestras excelentes serían aquellas con errores inferiores al ±5% y niveles de confianza de entre el 95% y el 99%. Teniendo esto presente, se puede jugar con el diseño y calcular varias alternativas de tamaño muestral, cuando hay problemas de presupuesto en una negociación para realizar un trabajo de campo.

TEMA 2 – Ideas clave

30

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Los elementos con los que se puede jugar en la fórmula, son el error y el nivel de confianza. También se puede jugar con la p y la q, siempre que se realice una muestra piloto, pero esta, ya de por sí, supone un coste adicional, aunque si sale favorable (es decir, si rebaja la máxima indeterminación pq = 0,25), se pueden aprovechar las entrevistas piloto llevadas a cabo, e incluirlas en la muestra. Veamos un ejemplo para comprender mejor la importancia de esta parte del diseño de muestras. Ejercicio Una empresa de reciclaje de escombros, que vende arena, grava y otros productos derivados del reciclaje que se utilizan en el ámbito de la construcción y adecuación de jardines y otros espacios, quiere llevar a cabo un estudio de satisfacción de sus clientes, así como captar su opinión acerca de diversos aspectos relacionados con esta actividad. La empresa tiene una cartera de 2 300 clientes tras cinco años de andadura. Si las principales estimaciones que desean que proporcione el estudio son las referentes a la nota media de satisfacción con sus servicios en una escala de 9 puntos donde 1 = muy insatisfecho y 9 = muy satisfecho, más la de la proporción de clientes que está comprando productos al menos una vez al mes, ¿qué tamaño muestral puede recomendar la empresa de trabajo de campo sin pasarse de un presupuesto de 3 500 euros, sabiendo que el coste unitario de cada entrevista es de 10 euros? Solución La empresa de trabajo de campo considera los datos de partida y efectúa algunos cálculos de tamaño muestral posible: 1. Cálculo del tamaño muestral para estimar la nota media de satisfacción Para este cálculo, deciden aplicar un nivel de confianza del 95% y un error muestral de ±0,5 puntos en la escala de 9. Como no se conoce la desviación estándar, se decide aplicar una de 3 puntos, en base a la experiencia de otros estudios de satisfacción de clientes, pues, aunque pueda haber algún caso extremo de puntuación baja o alta, la mayoría de clientes suele estar más satisfecho que insatisfecho, a menos que una empresa lo haga muy mal, cosa que no parece aplicable al caso de la empresa de reciclaje.

TEMA 2 – Ideas clave

31

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Bajo estos supuestos, el tamaño de la muestra se obtiene aplicando valores a la fórmula:

𝑛=

𝑛=

𝑁. 𝑧 2 . 𝑆 2 𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2

2300 · 1,962 32 = 130,51 0,52 · 2299 + 1,962 32

2. Cálculo de la muestra necesaria para estimar la proporción de clientes que compra producto reciclado al menos una vez al mes Para este supuesto, decide aplicar un nivel de confianza del 95% y un error muestral de ±3%, bajo un supuesto de máxima indeterminación p = q = 0,5. El cálculo queda como sigue:

𝑛=

𝑛=

𝑁. 𝑧 2 . 𝑝𝑞 𝑑2 (𝑁 − 1) + 𝑧 2 𝑝𝑞

2300 · 1,962 0,5 · 0,5 = 729,13 0,032 · 2299 + 1,962 0,5 · 0,5

A la vista de estas cifras, la empresa de trabajo de campo, sabe que la muestra para calcular la proporción, cubre de sobras la que se necesita para estimar la media de satisfacción. Sin embargo, es necesario reducir el tamaño muestral de esta propuesta, pues 729 encuestas a 10 euros, supondrían un coste excesivo: 7 290 euros frente a los 3 000 disponibles. Para reducir el tamaño muestral, sin bajar el nivel de confianza, el diseñador de la muestra decide aumentar el error muestral hasta el límite de ±5%, ya que el de ±3% era más exigente. El nuevo cálculo da lo siguiente:

𝑛=

2300 · 1,962 0,5 · 0,5 = 329,30 0,052 · 2299 + 1,962 0,5 · 0,5

En este caso, aplicando los valores tradicionales, habría que hacer 329 encuestas, que cubrirían bien ambos objetivos con un coste de trabajo de campo de 329 x 10 = 3 290 euros, precio asumible por parte del cliente. La muestra sería fiable y adecuada.

TEMA 2 – Ideas clave

32

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Por consiguiente, la empresa de investigación de mercados aconsejaría hacer 329 - 330 entrevistas que proporcionarían estimaciones de la proporción muestral con un error del ±5% a un nivel de confianza del 95% y un error muestral inferior a 0,5 puntos en la estimación de la media de satisfacción del cliente en una escala de 9 puntos. » Evaluación de muestras a posteriori En muchas ocasiones, al aplicar el criterio de máxima indeterminación, la muestra que finalmente se obtiene es más precisa de lo que se piensa a priori, es decir, cuando se hace el diseño. El desconocimiento de la varianza p·q en una población nos hace aplicar, en muchas ocasiones, un tamaño muestral más elevado del que realmente sería necesario para estimar una proporción. Sin embargo, como empresa de trabajo de campo o profesionales, siempre deberemos hacer lo posible para calcular tamaños que garanticen la fiabilidad de las estimaciones. Con todo, lo que sí que podemos hacer para proporcionar mayor satisfacción al cliente, es calcular el error muestral realmente cometido a posteriori, es decir, una vez extraída la muestra bajo criterios exigentes. Si el error a posteriori es más bajo que el que aplicamos a la fórmula inicial de cálculo de tamaño de la muestra, siempre lo podremos incluir en la ficha técnica y ampliar el grado de fiabilidad inicial, lo cual siempre será una buena noticia para el cliente, ya que le estaremos indicando que las estimaciones realizadas con esa muestra son más fiables de lo que podíamos pensar todos en un principio. Veamos un ejemplo para comprender mejor cómo funcionan estos mecanismos de revisión de fiabilidad. Ejemplo: Una empresa de transporte público local encargó un estudio para la puesta en marcha de una nueva línea de autobús en un municipio, que uniría otros 4 en su recorrido. La población total de estos 4 municipios era de 80 000 habitantes, de entre 14 y 84 años, que eran las edades estimadas de los usuarios potenciales.

TEMA 2 – Ideas clave

33

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

La empresa quería que le estimasen la proporción de personas que estarían interesadas en utilizar la línea al menos una vez por semana. La empresa de trabajo de campo calculó el tamaño muestral necesario para efectuar esta estimación con un error muestral máximo del ±5% para un nivel del 95%, bajo criterio de máxima indeterminación (lo habitual en un caso como este). El cálculo dio el siguiente resultado:

𝑛=

80 000. 1,962 . 0,5.0,5 = 382,33 0,052 (80 000 − 1) + 1,962 . 0,5.0,5

Por consiguiente, se realizaron 383 entrevistas aleatorias entre la población. Tras llevar a cabo las entrevistas, el resultado del estudio, indicó que un 34% de la población estaba interesado en utilizar la nueva línea de autobús al menos una vez a la semana. La empresa de trabajo de campo, revisó el error a priori (5%), dado que la estimación de la proporción dio un resultado bastante por debajo del 50%. Para ello, despejó el error de la fórmula de cálculo del tamaño muestral:

𝑁𝑧 2 𝑝𝑞 2 √ 𝑛 − 𝑧 𝑝𝑞 𝑑= 𝑁−1 Aplicando valores, sabiendo que p = 0,34 y q = 0,66 (pues salió un 34% de respuesta positiva contra un 66% de otra respuesta acerca del interés por utilizar el nuevo autobús una vez a la semana): 80 000. 1,962 . 0,34.0,66 − 1,962 0,34.0,66 √ 383 𝑑= = 0,0473 79999 Multiplicando el resultado por 100, la empresa concluyó que, en realidad, la muestra extraída comete un error muestral de ±4,73% en lugar de un error de ±5%.

TEMA 2 – Ideas clave

34

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Dominar estas técnicas resulta conveniente e importante, ya que la estadística no es una ciencia exacta y, toda reducción del error muestral es buena noticia, ya que confiere mayor fiabilidad de los estudios que se realizan. La estimación que se lleva a cabo en este estudio es puntual, y arroja un 34% de usuarios potenciales, pero, desde un punto de vista de rentabilidad de la nueva línea de autobús, al cliente le interesa más conocer el intervalo de confianza de esta estimación, que se halla restando y sumando el error a la estimación puntual, es decir, haciendo: o 34% – 4,73% = 29,27% o 34% + 4,73% = 38,73% De esta forma, la empresa de investigación de mercados puede decirle a la de transporte que, semanalmente, puede esperar una demanda de entre un 29,27% (80 000 x 0,2927 =23 416 viajeros potenciales) de la población y un 38,73% (80 000 x 0,3873 = 30 984 viajeros potenciales) de la población con un 95% de probabilidad. Las cifras habrían sido diferentes de aplicar el 5% en lugar del 4,73% como error de muestreo, y menos realistas, pues el intervalo habría sido más amplio: entre un 29% (23 200 viajeros) y un 39% (31 200 viajeros). Como profesionales de la investigación de mercados, debemos conocer todos estos recursos y ofrecer siempre la máxima calidad a los clientes de trabajo de campo e informes de estimaciones, para que ellos puedan diseñar sus estrategias de venta y analizar la viabilidad de los productos que ofrecen al mercado.

TEMA 2 – Ideas clave

35

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Lo + recomendado No dejes de leer… Informe metodológico: encuesta sobre Equipamiento y Uso de Tecnologías de Información y Comunicación en los Hogares 2016 (TIC–H’16) Para ver cómo diseña el Instituto Nacional de Estadística una encuesta oficial de ámbito nacional. En el documento, hallarás los conceptos estudiados en este tema, aplicados a la población española para la elaboración de esta encuesta de carácter anual. Accede al artículo a través del aula virtual o desde la siguiente dirección web: http://www.ine.es/metodologia/t25/t25304506616.pdf

No dejes de ver… Demostración efectiva de funcionamiento de un sistema CATI Este vídeo contiene una demostración de uso de un sistema de llamada predictiva muy útil para servicios del tipo: call centers, contact centers, telemarketing, televenta, SAC, etc.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web: https://www.youtube.com/watch?v=DpZdoUyP19I

TEMA 2 – Lo + recomendado

36

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

+ Información A fondo Sistema CATI Presentación resumida sobre del sistema CATi como el más implementado actualmente para la realización de encuestas en call centers. Accede al artículo a través del aula virtual o desde la siguiente dirección web: http://es.slideshare.net/sociologiaymercado/sistema-cati

Webgrafía Capacitación de encuestadores En este vídeo de youtube se describe cómo capacita la empresa real, Captura Consulting, a los encuestadores que realizan los trabajos de campo y cómo organizan el trabajo de campo.

Accede a la página web a través del aula virtual o desde la siguiente dirección: https://www.youtube.com/watch?v=lD72OPINBBM

TEMA 2 – + Información

37

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Bibliografía Hueso, A. y Cascant, M.J. (2012). Metodología y técnicas cuantitativas de investigación. En Cuadernos docentes en procesos de desarrollo, nº 1. Valencia: Editorial Universitat Politécnica

de

València.

Recuperado

de

https://riunet.upv.es/bitstream/handle/10251/17004/Metodolog%C3%ADa%20y%20t %C3%A9cnicas%20cuantitativas%20de%20investigaci%C3%B3n_6060.pdf?sequence =3 Lind, D.A. y otros (2005). Estadística Aplicada a los Negocios y la Economía. México: McGraw Hill. Pérez, C. (2009). Técnicas de muestreo estadístico. Madrid: Garceta Grupo Editorial. Ruíz–Maya, L. y Martín, J. (2004). Fundamentos de Inferencia Estadística (3ª Edición). Madrid: Ed. Thomson.

TEMA 2 – + Información

38

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Actividades Trabajo: ejercicios de muestreo y tamaño muestral Descripción y pautas de elaboración Los ejercicios son sencillos y muy aplicados. Basta con completar los espacios reservados para colocar las soluciones. Objetivos » Adquirir práctica en las operaciones de muestreo. Ejercicio 1: «Verdifresh» se plantea realizar un estudio de satisfacción de los clientes de la ciudad de Valencia con sus productos. Para acceder a los consumidores plantea un muestro polietápico en que en la primera etapa selecciona 5 zonas de las 19 en que se divide Valencia capital, en la segunda etapa 10 puntos de venta de esas zonas (2 de cada una de ellas) y en la tercera etapa a los clientes que compran algún producto «Verdifresh» el día concreto en el que se hace la encuesta. Si las zonas de Valencia y los puntos de venta (Mi) que hay en cada una de ellas son:

1

Ciutat Vella

M1, M2, M3, M4

2

Eixample

M5, M6, M7, M8, M9, M10

3

Extramurs

M11, M12, M13, M14, M15, M16

4

Campanar

M17, M18, M19, M20

5

La Saïdia

M21, M22, M23

6

El Plà del Real

M24, M25

7

L’Eixample

M26, M27, M28, M29

8

Patraix

M30, M31, M32, M33, M34

9

Jesús

M35, M36, M37, M38, M39, M40

10

Cuatre Carreres

M41, M42, M43

TEMA 2 – Actividades

39

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

11

Poblats Marítims

M44, M45

12

Camins al Grau

M46, M47

13

Algirós

M48, M49, M50, M51

14

Benimaclet

M52, M5, M54, M55

15

Rascanya

M56, M57

16

Benicalap

M58, M59, M60

17

Pobles del Nord

M61, M62

18

Pobles de l’Oest

M63, M64

19

Pobles del Sud

M65, M66, M67

Establece la muestra de zonas y puntos de venta a considerar para realizar las encuestas utilizando la siguiente serie de números aleatorios entre 1 y 19 generada por Excel: » 15, 12, 11, 2, 8, 9, 6, 1, 12, 17, 11, 19, 9, 9, 14, 10, 3, 10, 14 para seleccionar la zona. » Las siguientes series de números aleatorios entre 1 y 6 generadas por Excel, para seleccionar los puntos de venta en los casos en que haya más de dos puntos de venta en la zona: o 1, 3, 6, 5, 2, 4 para la primera zona seleccionada con más de dos puntos de venta. o 2, 3, 1, 6, 4, 5, para la segunda con más de dos puntos de venta. o 2, 5, 4, 1, 3, 6 para la tercera con más de dos puntos de venta. o 1, 3, 2, 5, 6, 4 para la cuarta con más de dos puntos de venta. Utiliza las series de 6 números aleatorios que sean necesarias. Al poner la muestra en la tabla preparada para ello, conservar el orden en el que se extraen las zonas y los puntos de venta y NO ordenarlos de otra forma. Utiliza esta tabla para resolver este ejercicio.

TEMA 2 – Actividades

40

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

La muestra de zonas y puntos de venta a considerar para realizar las encuestas es: Nº aleatorio

Zona que le corresponde

Nº aleatorio o dos casos

Punto de venta que le corresponde

Ejercicio 2 «Verdifresh» quiere estudiar a una muestra de 10 agricultores de entre 5 000 posibles que realizan un determinado cultivo en una comunidad autónoma. Para seleccionar a los candidatos se plantea realizar un muestreo sistemático sobre la lista de los 5 000. ¿Qué número corresponderá en la lista a cada uno de los 10 candidatos si el número aleatorio entre 1 y K es 320? Incluye la solución aquí, indicando el valor de K y rellenando la tabla con los números solicitados:

K=

Ejercicio 3 El departamento de Recursos Humanos de «Verdifresh» está haciendo una auditoría de las horas extraordinarias trabajadas en el último año por sus trabajadores de todas las secciones, que son 320. El objetivo es el de estimar la media de horas extraordinarias realizadas por persona. Como el número de partes emitidos por los trabajadores acerca de las horas extraordinarias es muy elevado, se decide extraer una muestra. ¿De qué tamaño debe ser la muestra de partes emitidos para estimar la media de horas extraordinarias con un error máximo de 2 horas para un nivel de confianza del 95%?

TEMA 2 – Actividades

41

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Como información adicional, los analistas toman la dispersión que se obtuvo el año anterior en un estudio similar, que es una desviación estándar de 4,8 horas. Indica la fórmula empleada y el tamaño de la muestra calculada en la respuesta.

Ejercicio 4 ¿A cuántas personas habría que estudiar de una población de 70 000 habitantes de 18 y más años para conocer cuántas compran un libro al menos una vez por mes con un nivel de confianza del 95% y un error muestral del 4%, bajo supuesto de máxima indeterminación? Indica la fórmula empleada y el tamaño de la muestra calculada en la respuesta.

Ejercicio 5: Si en el ejercicio anterior se obtiene una proporción del 18% una vez aplicado el muestreo y realizadas las entrevistas, ¿qué error muestral a posteriori se ha cometido al hacer esta consulta? ¿Mejora este error las expectativas iniciales acerca de la fiabilidad de la estimación obtenida con la muestra? Indica la fórmula empleada y el error muestral cometido a posteriori en la respuesta.

TEMA 2 – Actividades

42

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

Test 1. En un muestreo probabilístico… A. Todos los individuos u objetos integrantes de la población tienen una probabilidad de 0,5 de entrar a formar parte de la muestra. B. Todos los individuos u objetos integrantes de la población tienen la misma probabilidad de ser extraídos para formar parte de una muestra. C. Todos los individuos u objetos integrantes de la población tienen probabilidades aproximadamente iguales de ser extraídos para formar parte de una muestra. 2. En un muestreo se han seleccionado distritos sanitarios, después hospitales y, después facultativos cirujanos para hacer un estudio sobre su opinión acerca de sus condiciones de trabajo. Este tipo de muestreo es… A. Aleatorio sistemático. B. Aleatorio estratificado. C. Aleatorio polietápico. 3. Un muestreo por cuotas consiste en… A. Formar estratos de la población sobre la base de ciertas características y procurar que estén representadas en proporciones semejantes a las que existen en la población. B. Formar estratos de la población y aplicar un muestreo aleatorio simple a los individuos de cada estrato. C. Entrevistar indiscriminadamente a personas de todo tipo en lugares públicos sin aplicar ningún criterio en especial. 4. Al calcular el tamaño muestral, si lo hacemos a un nivel de confianza del 99%, el valor de z es… A. 1,96. B. 2,58. C. 1,64.

TEMA 2 – Test

43

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

5. Al calcular el tamaño muestral para estimar una proporción… A. No es recomendable superar un error muestral del ±5%. B. Siempre hay que poner en la fórmula un error del ±5%. C. Las mejores estimaciones se obtienen utilizando un error muestral del ±%. 6. La siguiente fórmula sirve para… 𝑧𝛼/2 𝜎 2 𝑛= ( ) 𝑑 A. Calcular el tamaño muestral para estimar una proporción cuando se conoce el tamaño de la población. B. Calcular el tamaño muestral para estimar una proporción cuando se conoce la desviación estándar poblacional. C. Calcular el tamaño muestral para estimar una media cuando no se conoce el tamaño de la población y se conoce la desviación estándar poblacional o una aproximación de la misma. 7. La siguiente fórmula sirve para… 𝑧𝛼2 𝑝(1 − 𝑝) 𝑛=

2

𝑑2

A. Calcular el tamaño muestral para estimar una proporción cuando se conoce el tamaño de la población. B. Calcular el tamaño muestral para estimar una proporción cuando no se conoce el tamaño de la población. C. Calcular el tamaño muestral para estimar una media cuando no se conoce el tamaño de la población. 8. El supuesto de máxima indeterminación se aplica cuando… A. Al calcular el tamaño muestral para estimar una media, se desconoce el tamaño de la población. B. Al calcular el tamaño muestral para estimar una proporción, se desconocen los valores poblacionales de P y Q. C. Al calcular el tamaño muestral para estimar una media se desconoce el valor de la desviación estándar poblacional.

TEMA 2 – Test

44

© Universidad Internacional de La Rioja (UNIR)

Investigación Cuantitativa

9. De los siguientes conceptos, el que corresponde a una técnica para seleccionar los elementos de una muestra es… A. Tabla de números aleatorios. B. Estratos. C. Extracciones. 10. Deseamos conocer la opinión de los ciudadanos de Málaga sobre el sistema de salud pública. Para ello elegimos una muestra aleatoria de entre los abonados a una compañía telefónica. Entonces… A. La población de estudio es la de los ciudadanos de Málaga. B. La población objetivo es la de los abonados a la compañía telefónica en Málaga. C. La población de estudio es la de los abonados a la compañía telefónica en Málaga.

TEMA 2 – Test

45

© Universidad Internacional de La Rioja (UNIR)