PROYECTO INTEGRADOR parte 2.docx

MARÍA DE LA LUZ ARREGUIN ÁLVAREZ ESTADÍSTICA INFERENCIAL UNIDAD 5. INFERENCIAS ESTADÍSTICAS DE DOS POBLACIONES ACTIVI

Views 156 Downloads 23 File size 924KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

MARÍA DE LA LUZ ARREGUIN ÁLVAREZ

ESTADÍSTICA INFERENCIAL

UNIDAD 5. INFERENCIAS ESTADÍSTICAS DE DOS POBLACIONES

ACTIVIDAD 5. PROYECTO INTEGRADOR ETAPA 1

Introducción En una sociedad en continuo cambio, como la que nos ha tocado vivir, hemos dejado de asombrarnos por los avances de la ciencia y la tecnología. La estadística ha jugado un papel primordial en este desarrollo, al proporcionar herramientas metodológicas generales para analizar la variabilidad, determinar relaciones entre variables, diseñar de forma óptima experimentos, mejorar las predicciones y la toma de decisiones en situaciones de incertidumbre. La estadística es una ciencia aplicada de las matemáticas y es una valiosa herramienta para la toma de decisiones. Permite el estudio de fenómenos mediante la descripción del mismo a través de inferencias mediante distribuciones probabilísticas. En el presente proyecto se calcularan valores estadísticos como la media y desviación estándar además de hacer un análisis con intervalos de confianza que un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido. La estimación de la muestra de los departamentos de las colonias Portales del sur y Narváez permitirá tomar una decisión o inferencia final.

Justificación El presente proyecto estimación de un intervalo para la media consiste en realizar el análisis de inversión para edificio de departamentos, en base al ingreso familiar en la delegación Benito Juárez de la Ciudad de México para tomar la decisión de invertir en la construcción de un edificio de departamentos, con precio de venta de 1´500,000 pesos, el ingreso promedio que se requiere es de 35,000 pesos por familia. Para la ejecución de este proyecto se tomara en cuenta la estimación puntual y por intervalos con distribución normal. Dicho análisis permitirá inferir en si se toma la decisión de invertir en la construcción de dicho edificio.

Marco teórico Estimación Cuando queremos realizar un estudio de una población cualquiera de la que desconocemos sus parámetros, por ejemplo, su media poblacional o la probabilidad de éxito si la población sigue una distribución binomial, debemos tomar una muestra aleatoria de dicha población a través de la cual calcular una aproximación a dichos parámetros que desconocemos y queremos estimar. Bien, pues esa aproximación se llama estimación.

Estimación puntual Una

estimación

puntual

del

valor

de

un

parámetro

poblacional

desconocido, es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. Para realizar la estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado. El valor de este parámetro muestral será la estimación puntual del parámetro poblacional. Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro desconocido de la población. Al valor usado se le llama estimador. La media de la población se puede estimar puntualmente mediante la media de la muestra: La proporción de la población se puede estimar puntualmente mediante la proporción de la muestra: La desviación típica de la población se puede estimar puntualmente mediante la desviación típica de la muestra, aunque hay mejores estimadores: Estimación por intervalos Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ. Sabemos que, para valores de n , la media muestral x sigue una distribución aproximadamente normal con media µ x = µ y desviación estándar n x σ = σ .

A veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un cierto nivel de confianza, en este caso hablamos de estimación por intervalos. Intervalo de confianza En estadística, se llama intervalo de confianza a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En

estas

circunstancias, α es

el

llamado error

aleatorio o nivel

de

significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo. El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más probabilidad de acierto (mayor nivel de confianza), mientras que, para un intervalo más pequeño, que ofrece una estimación más precisa, aumenta su probabilidad de error. Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución normal. En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

Intervalo de confianza para la media muestral Si

y s son la media y la desviación estándar de una muestra aleatoria de

una población normal con varianza 𝝈𝟐 , desconocida, un intervalo de confianza (

de

) 100% para µ es:

𝑋̅ − 𝑡𝛼 2

𝑆 √

< 𝜇 < 𝑋̅ + 𝑡𝛼 𝑛 2

𝑆 √𝑛

(A.Jhonson, 2012)

Donde 𝒕𝜶/𝟐 es el valor t con 𝒗 = 𝒏 − 𝟏grados de libertad, que deja un área 𝜶

de 𝟐 a la derecha. Se hace una distinción entre los casos de

conocida y

desconocida al

calcular las estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el teorema del límite central, mientras que para

desconocida se hace uso de la distribución muestral de la variable

aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa de que el muestreo se realiza de una distribución normal. En tanto que la distribución tenga forma aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se desconoce mediante el uso de la distribución t y se puede esperar buenos resultados. Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se pueda suponer, con reemplazar ha

desconocida y n 30, se puede

y se puede utilizar el intervalo de confianza:

𝑋̅ ± 𝑍𝛼/2

𝑆 √𝑛

Por lo general éste se denomina como un intervalo de confianza de muestra grande. La justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy cerca de la

real y de esta manera el

teorema del límite central sigue valiendo. Hipótesis estadísticas En cualquier estudio sobre la realidad educativa, el investigador se plantea interrogantes a los que trata de dar respuesta o temas de interés sobre los que pretende incrementar su conocimiento. En la indagación sobre esos interrogantes, el investigador formula hipótesis, que no son posibles soluciones o respuestas a los problemas planteados. Tales hipótesis permanecerán en el terreno de la conjetura hasta tanto no sean comprobadas. “Inferencias concernientes a la media” La estadística permite comprobar hipótesis científicas a partir de los datos recogidos sobre un problema, pero para ello es necesario que tales hipótesis sean formuladas en términos estadísticos. Es decir, las hipótesis científicas tienen que ser operativizadas previamente, expresadas en forma de afirmaciones acerca de parámetros. Por tanto, en una prueba de decisión estadística no contrastamos directamente las hipótesis científicas, sino que trabajamos con hipótesis estadísticas que son una traducción de aquéllas. Tras comprobar la hipótesis estadística, podemos inferir que la hipótesis científica queda validada. Las hipótesis estadísticas son proposiciones acerca de parámetros de la población (media, proporciones, varianza, diferencia de medias, etc.) o de su distribución. Cuando llevamos a cabo una prueba estadística, estamos trabajando con una hipótesis nula, que simbolizamos por H0. Junto a ésta, consideramos la

hipótesis alternativa, opuesta a la anterior, que queda simbolizada por H1. Veamos en qué consisten cada una de ellas: 

a) Hipótesis nula (H0). Generalmente, niega la hipótesis científica que queremos someter a contraste. Por ejemplo, puede afirmar que no existe una relación entre variables; que no se dan diferencias entre determinados grupos o que no existen diferencias entre dos distribuciones, atribuyendo al azar cualquier posible relación o diferencia observada,



b) Hipótesis alternativa (H1). Toda hipótesis nula va siempre acompaña da de una hipótesis alternativa, la cual afirmaría que las relaciones, las diferencias, etc. observadas no son debidas al azar y, por tanto, resultan estadísticamente significativas.

Prueba de hipótesis para la media

Ejemplo 

Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado mostró una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media actual es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Planteamiento del problema

Análisis de inversión para edificio de departamentos, en base al ingreso familiar en la delegación Benito Juárez de la Ciudad de México, se realizó una muestra de tres cuadras en la colonia Portales Sur y otra igual en la colonia Narvarte, para tomar la decisión de invertir en la construcción de un edificio de departamentos, con precio de venta de 1´500,000 pesos, el ingreso promedio que se requiere es de 35,000 pesos por familia.

1. Con los datos que se muestran de los ingresos por familia se procede a hacer el cálculo de la media y la desviación estándar para ambas colonias.

2. Establecimiento de hipótesis en base a el ingreso promedio de 35,000 Hipótesis nula Hipótesis alternativa H0: μ = 35000 H1: μ≠ 35000

3. Intervalo de confianza con un 90% por colonia y su respectiva interpretación

4. Calculo del error con un 10%

Interpretación: Se puede afirmar que con un 90% de confianza el error máximo es de 1.35 para Portales y Narvaez 1.44.

Distribución Muestral de la Media: Prueba de Hipótesis.

Portales sur Media Muestral 33.38 Desviación Muestral 549.09% Error de la Media 0.818528421

Narvarte Media Muestral Desviación Muestral Error de la Media

34.51 585.67% 0.873066245

Calcular el intervalo de Confianza para la media de los ingresos por familia de la colonia Portales Sur.

Intervalo de confianza a 90% Z: 1.64 Alfa: 10.0%

Inferior

Intervalo de confianza a 95% Z: 1.96 Alfa: 5.0%

Intervalo de confianza a 99% Z: 2.58 Alfa: 1.0%

Superior

t90 1.64

32.03

34.72 A un nivel de confianza del 90% la media POBLACIONAL se encuentra entre 32.03 y 34.72

t95 1.96

31.77

34.98 A un nivel de confianza del 95% la media POBLACIONAL se encuentra entre 31.77 y 34.98

t99 2.58

31.27

35.49 A un nivel de confianza del 99% la media POBLACIONAL se encuentra entre 31.27 y 35.49

Calcular el intervalo de Confianza para la media de los ingresos por familia de la colonia Narvarte.

Intervalo de confianza a 90% Z: 1.64 Alfa: 10.0%

t90 t95 t99

Intervalo de confianza a 95% Z: 1.96 Alfa: 5.0%

Intervalo de confianza a 99% Z: 2.58 Alfa: 1.0%

Inferior Superior 33.08 35.95 A un nivel de confianza del 90% la media POBLACIONAL se encuentra entre 33.08 y 35.95 1.96 32.80 36.22 A un nivel de confianza del 95% la media POBLACIONAL se encuentra entre 32.80 y 36.22 2.58 32.26 36.76 A un nivel de confianza del 99% la media POBLACIONAL se encuentra entre 32.26 y 36.76 1.64

Evalúa el intervalo de confianza con un 10% de error. Aun 10% de error la media poblacional se encuentra entre un límite inferior de 33.08 mil y el límite superior de 35.95 mil.

La colonia portales se encuentra estadísticamente mas entre los límites por lo que es la colonia que se sugiere para el negocio inmobiliario de acuerdo a los ingresos por familia.

Conclusiones Por el momento se puede apreciar que la colonia Portales tiene un menor error maximo en fallar para la construcción del edificio ademas se acepta la hipotesis nula de que el ingreso mensual se apaga dentro del limite de 35,000 pesos de ingresos por familia. Cabe mencionar que Si rechazamos la Hipótesis Nula, concluimos que “hay suficiente evidencia estadística para inferir que la hipótesis nula es falsa” Si no rechazamos la Hipótesis Nula, concluimos que “no hay suficiente evidencia estadística para inferir que la hipótesis nula es falsa. La Estadística de Prueba es una estadística que se deriva del estimador puntual del parámetro que estemos probando y en ella basamos nuestra decisión acerca de si rechazar o no rechazar la Hipótesis Nula.

Bibliografía A.Jhonson, R. (2012). Probabilidad y estadística para ingenieros. México: Pearson. Obtenido de http://www.bibliotechnia.com.mx/portal/visor/web/visor.php

ANEXOS

Anexo 1 .Distribucion Normal Estándar