fase dos

INFERENCIA ESTADÍSTICA FASE 2 JOSE DE JESUS VIÑA MESTIZO CÓDIGO : 1065644634 ANUAR DE JESUS OYOLA Tutor ESCUELA DE CI

Views 136 Downloads 8 File size 218KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

INFERENCIA ESTADÍSTICA FASE 2

JOSE DE JESUS VIÑA MESTIZO CÓDIGO : 1065644634

ANUAR DE JESUS OYOLA Tutor

ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGIA E INGENIERIA INGENIERIA DE SISTEMAS VALLEDUPAR, CESAR SEPTIEMBRE DE 2019 Actividad 1: Calculo tamaño de muestra

Descripción de la actividad: Cada estudiante deberá dar respuesta a la pregunta: “¿Como seleccionar el tamaño muestral?”; posteriormente, con la ayuda de Excel, calculará un (1) tamaño de muestra para estimar la media de la variable seleccionada. Cada estudiante seleccionará y realizará un cálculo de tamaño de muestra diferente a partir de la siguiente tabla, el tamaño de muestra que aparece con el nombre “colaborativo” se debe realizar de forma grupal. En la hoja de Excel los diferencian colocando el nombre del estudiante que lo realiza. Los siguientes son los valores que debe usar como referencia para calcular los tamaños de muestra “n”: ¿CÓMO SELECCIONAR EL TAMAÑO MUESTRAL? Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en cualquier estudio de investigación de mercados, se debe justificar convenientemente de acuerdo al planteamiento del problema, la población, los objetivos y el propósito de la investigación. ¿DE QUÉ DEPENDE EL TAMAÑO MUESTRAL? El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que estará en campo. Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas: 1) Tamaño de la población. Una población es una colección bien definida de objetos o individuos que tienen características similares. Hablamos de dos tipos: población objetivo, que suele tiene diversas características y también es conocida como la población teórica. La población accesible es la población sobre la que los investigadores aplicaran sus conclusiones. 2) Margen de error (intervalo de confianza). El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta, es decir, es

la medida estadística del número de veces de cada 100 que se espera que los resultados se encuentren dentro de un rango específico. 3) Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95% significa que los resultados de una acción probablemente cubrirán las expectativas el 95% de las veces. 4) La desviación estándar. Es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. CÁLCULO DEL TAMAÑO DE LA MUESTRA DESCONOCIENDO EL TAMAÑO DE LA POBLACIÓN La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la población es la siguiente:

En donde Z = nivel de confianza, P = probabilidad de éxito, o proporción esperada Q = probabilidad de fracaso D = precisión (error máximo admisible en términos de proporción) CÁLCULO DEL TAMAÑO DE LA MUESTRA CONOCIENDO EL TAMAÑO DE LA POBLACIÓN La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la población es la siguiente:

En donde, N = tamaño de la población Z = nivel de confianza, P = probabilidad de éxito, o proporción esperada Q = probabilidad de fracaso D = precisión (Error máximo admisible en términos de proporción). Parámetro

Variable

Promedio o media poblacional

  Población Nivel de confianza

Error

José Viña Mestizo

8%

0,009

Densidad

Colaborativo

5%

0,004

TAMAÑO DE MUESTRA DENSIDAD     N∗Z 2α∗p∗q 1.03025667 FORMULA n= 2 2 e ∗( N −1 ) +Z α ∗p∗q  

 

Proporcion acepta Proporcion rechazo error maximo

MEDIA

Significancia

% proteína

MEDIA   Población Nivel de confianza

Estudiante

TAMAÑO DE LA MUESTRA "n"=

N= Z=

3000 1.96

p= q= e=

5% 0.95 0.00 4

2375.370997

TAMAÑO DE MUESTRA % PROTEINA   N∗Z 2α∗p∗q 3.198 FORMUL n= 2 e ∗ ( N −1 ) +Z 2α ∗p∗q 9 A  

 

TAMAÑO DE LA MUESTRA "n"=

N= Z=

3000 1.96

p= q= e=

8% 0.96 0.00 9

Proporcion acepta Proporcion rechazo error maximo

Actividad 2: Tipo de muestreo Descripción de la actividad:

1613.636293

Cada estudiante deberá dar respuesta a las siguientes preguntas: 

¿Qué es un muestreo?



¿Cuándo se utiliza un muestreo?



¿Cuáles son los diferentes tipos de muestreos? Explique en que consiste cada uno de ellos.



¿Como se realiza el muestreo sistemático?



¿Cómo se realiza el muestreo aleatorio simple? Posteriormente, con la ayuda de Excel, y teniendo en cuenta la muestra obtenido en la

Actividad 1: Calculo tamaño de muestra, realizara un muestreo sistemático. ¿Qué es un muestreo? En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. El muestreo es una herramienta de la investigación científica y se refiere al procedimiento empleado para obtener una o más muestras de una población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, luego se procede a la selección de los elementos de la muestra. La función básica del muestreo es determinar qué parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población.  En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción sigue la llamada distribución muestral.

Es decir que el muestreo es una herramienta para determinar qué parte de una población debemos analizar cuando no es posible realizar un censo. Depende de los objetivos del estudio el elegir una muestra probabilística o no probabilística. ¿Cuándo se utiliza un muestreo? En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. Cuando no se está interesado en todos los elementos: sino sólo en algunos ejemplares o casos de la población. Cuando se está interesado por igual en todos los elementos de la población: se querría estudiarlos a todos; pero por razones prácticas, se tendría que escoger sólo una muestra.

¿Cuáles son los diferentes tipos de muestreos? Explique en que consiste cada uno de ellos. MUESTREO PROBABILÍSTICO Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:



Muestreo aleatorio simple: El procedimiento empleado es el siguiente. primero se asigna un número a cada individuo de la población y segundo, a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.



Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.



Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un

tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos: Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación. 

Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades

hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

MÉTODOS DE MUESTREO NO PROBABILÍSTICOS A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos: 

Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación.

Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. 

Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).



Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.



Muestreo Discrecional: A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

¿Como se realiza el muestreo sistemático? El muestreo sistemático consume menos tiempo que el resto, ya que requiere la selección del tamaño de la muestra y la identificación del punto de partida, y, además, este debe continuar en intervalos regulares (para formar la muestra). 

Es necesario desarrollar una audiencia estructural definida para que el investigador comience a trabajar en el aspecto del muestreo.



El investigador a cargo debe determinar el tamaño de la muestra ideal, es decir, cuántas personas de la población completa se van a elegir.



La clave para obtener resultados precisos razonables y prácticos es tener una audiencia grande.



Una vez que se decida el número de tamaño de la muestra, se debe asignar un número a cada miembro de la muestra.



Decide cuál será el intervalo de esta muestra. Este es básicamente la distancia estándar entre los elementos.

¿Cómo se realiza el muestreo aleatorio simple? Un muestreo aleatorio simple, Es un subconjunto de una muestra elegida de una población más grande. Cada individuo se elige al azar y por pura casualidad. En este tipo de muestreo cada individuo tiene la misma probabilidad de ser elegido en cualquier etapa del proceso. 

Prepara una lista de todos los miembros de la población, posterior a esto marca a cada miembro con un número específico.



De esta población, las muestras aleatorias se eligen de dos maneras: tablas de números aleatorios y con un software de generador de números aleatorios. un software generador

de números aleatorios, ya que los números de muestra se generan sin interferencia humana. DENSIDAD FORMULA

% PROTEÍNA FORMULA

k=

N n

Tamaño poblacion Tamaño muestra deseada Poblacion Tamaño muestra Resultado

k=

N n

1613     50%     N= 1613   n= 50   k= 32.26 32

Tamaño poblacion Tamaño muestra deseada Poblacion Tamaño muestra Resultado

237 5     40%     N= 2375   n= 40   59.37 5 k= 5 9

Actividad 3: Intervalos de confianza Para el desarrollo de esta actividad, es necesario que el estudiante revise en el Entorno de conocimiento (Unidad 1), las siguientes referencias: Descripción de la actividad: Cada estudiante deberá dar respuesta a las preguntas: 

¿Para que se utilizan los intervalos de confianza?



¿A qué se le llama error de estimación?



¿Qué representan los límites de confianza obtenidos en un intervalo de confianza?



¿Como se calculan los intervalos de confianza para la media?



¿Cómo se calculan los intervalos de confianza para la proporción?

Teniendo en cuenta el muestreo colaborativo realizado en la Actividad 2: Tipo de muestreo, cada estudiante con la ayuda de Excel realizara un intervalo de confianza para la media y un intervalo de confianza para la proporción, seleccionando una variable cuantitativa y una variable cualitativa de las siguientes tablas: ¿Para que se utilizan los intervalos de confianza? Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad). Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional.

¿A qué se le llama error de estimación? Error de estimación es el valor absoluto de la diferencia entre una estimación particular y el valor del parámetro. En realidad por cada valor estimado del parámetro se tiene un error de estimación por lo general diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarán la mayoría de los valores de error de estimación para un estimador y parámetro dados.

¿Qué representan los límites de confianza obtenidos en un intervalo de confianza? Representan la distribución de la media de una muestra aleatoria, siempre y cuando provengan de una población con varianza finita. ¿Como se calculan los intervalos de confianza para la media? Supongamos que queremos calcular un intervalo de confianza para una media poblacional sabiendo que la media muestral es de 32 y la desviación típica poblacional de 6. La muestra es de 50 individuos. Los pasos para calcular los intervalos de confianza son: 

1 Lo primero es fijar un nivel de confianza 1-αα (siendo αα la máxima probabilidad aceptada de cometer un error). La probabilidad de que nuestra estimación esté dentro de ciertos valores es fijada de antemano. Normalmente los valores de confianza son del 90%, 95% o 99%. Hay que tener en cuenta que mientrás más alto el nivel de confianza más estrecho será el intervalo. Para este ejercicio fijamos un nivel de confianza del 90%



2 Cálculo del margen de error Cuando estimo la media poblacional a través de la media muestral y cuando la desviación estándar de la población es conocida, el máximo error de estimación dado para un nivel de confianza 1-αα está dado por la siguiente ecuación. E=zα/2σn−−√.E=zα/2σn.

siendo zα/2zα/2 , el cuantil de la distribución normal estándar que arrastra una probabilidad de α/2α/2, con αα nivel de significancia establecido si yo deseo tener un nivel de confianza del 90$, entonces αα va a ser del 0.1 y α/2α/2 va a ser 0.05 calculo los valores para que z tengo una probabilidad del 10%



3 Cálculo de los límites del intervalo. Está dado por la siguiente fórmula: x¯¯¯−zα/2σn−−√