Muestras Aleatorias y Distribuciones de Muestreo

Pag. 1 MUESTRAS ALEATORIAS Y DISTRIBUCIONES DE MUESTREO Definición: Si las variables aleatorias x1.x2...........xn. tie

Views 136 Downloads 0 File size 128KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Pag. 1

MUESTRAS ALEATORIAS Y DISTRIBUCIONES DE MUESTREO Definición: Si las variables aleatorias x1.x2...........xn. tienen la misma función de densidad de probabilidad que la de la distribución de la población, y su función de distribución conjunta de probabilidad es igual al producto de las marginales, entonces x1.x2............xn forman un conjunto de n variables aleatorias independientes e idénticamente distribuidas (IID) que constituyen una muestra aleatoria de la población. Definición: Un Parámetro es una caracterización numérica de la distribución de la población de manera que describe, parcial o completamente la función de densidad de población de la característica de interés. Definición: Una estadística (un estadístico) es cualquier función de las variables aleatorias que se observaron en la muestra, de manera que esta función no contiene cantidades desconocidas. Definición: La distribución de muestreo de una estadística es la distribución de probabilidad que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes, cada una de tamaño n provenientes de la población de interés. TEOREMA : Sean x1.x2...........xn, un conjunto de variables aleatorias independientes normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) = σ i2, para i = 1.2.......n. Si Y = a1x1 + a2x2 + ......+anxn, en donde a1.a2...an son constantes, entonces “Y” es una variable aleatoria distribuida normalmente con media E(y) = a1µ 1 + a2µ 2 +......+ anµ n y varianza Var(y) = a12σ 12 + a22σ 22 +...+ an2σ n2. TEOREMA DEL LÍMITE CENTRAL : Sean x1.x2.........xn, n variables aleatorias independientes idénticamente distribuidas con media µ y varianza σ 2 ambas finitas. La suma de esas variables S n = x1+x2+ ...+ xn es una variable aleatoria con media nµ y varianza nσ 2, entonces Z=

S

n

− nµ



2

se distribuye como una normal N(0;1). En otras palabras, el teorema

expresa que cuando n crece sin límite, la variable z tiende a distribuirse normalmente. Si las variables no son idénticamente distribuidas, se podría demostrar igualmente que: z =

∑ x - ∑µ ∑σ i

2

i

se distribuye como una normal N(0;1), es decir que la suma de

i

variables independientes tiende a ser normal con media suma de medias y varianza suma de varianzas.

Estadística I Prof. Luis Ramírez

Pag. 2

DISTRIBUCIÓN DE LA MEDIA MUESTRAL X : Def. Sea x1,x2,… xn una muestra aleatoria de tamaño “n” de una población con función de densidad f(x) con media µ y varianza σ2 . La media muestral representada por x , es n

la media aritmética de los elementos de la muestra, es decir:

x=

∑x i =1

i

.

n Teorema: Sea x1,x2,…..,xn, una muestra aleatoria que consiste de n variables aleatorias independientes normalmente distribuidas con medias E(xi) = µ y varianzas Var(xi) = σ2 , i = 1,2, ……, n. Entonces la distribución de la media muestral x es normal con media µ y varianza E(x)=E(

∑x n

i

σ

)=

2

n 1 n

x

∑E ( x ) = 1/n(n.μ) ⇒ E( x ) = μ. i

 ∑ xi   Var ( x ) = Var   n  =   De aquí se tiene que

. En efecto:

∑ Var( x ) = nσ n n i

2

~N(μ,

2

2

⇒ Var ( x ) =

(

)

σ

2

.

n

x−µ .) Luego: Z = σ ~ N(0,1) n n

σ

2

Teorema: Sean x1,x2, ……..xn una muestra aleatoria de tamaño n, de una distribución 2 normal con media μ y varianza σ . Entonces zi = (xi – μ)/σ son variables aleatorias normales estándar e independientes, i = 1,2,..,n y

 xi - µ   ∑1 zi = ∑    σ  n

2

2

n

tiene una

i=1

distribución χ 2 con n grados de libertad En la tabla correspondiente a esta distribución, podemos encontrar valores de

χ

2

α

tales que P ( χ 2 >

χ

2

α

)=

α.

Estadística I Prof. Luis Ramírez

Pag. 3

χ

2

α

La distribución de muestreo de S2: Teorema: Sea X1, X 2,…, Xn, una muestra aleatoria de una distribución normal con media

(

n

μ y varianza σ2. Entonces:

∑ xi − x i =1

)

2

=

σ2

( n −1) s 2 σ2

tiene una distribución χ 2 con

(n-1) grados de libertad. x y s2 son también variables aleatorias independientes. Ejemplo: Si X1, X2,…., X10 es una muestra aleatoria de una población distribuida normalmente con media 8 y varianza 9. Calcular la probabilidad de que la varianza muestral sea mayor que 3,753 Definición: Sea Z una variable aleatoria normal estándar y sea χ 2 una aleatoria Jicuadrada con v grados de libertad. Entonces si Z y χ 2 son independientes: T=

Z

se dice que tiene una distribución t con v grados de libertad.

χ2 v

Si no se conoce σ y n < 30, se tiene sustituyendo en la expresión anterior:

T=

x - µ   x -µ σ  n  = ~ t n-1 g.l. s (n - 1)s 2 n (n - 1)σ 2

Distribución F: Supóngase que deseamos comparar las varianzas de dos poblaciones normales basados en la información contenida en muestras aleatorias independientes de las poblaciones. Supóngase que una muestra aleatoria contiene n1 variables aleatorias distribuidas normalmente con una varianza común

σ

2 1

y que la otra muestra

aleatoria contiene n2 variables aleatorias distribuidas normalmente con una varianza común

σ

2 2

. Si calculamos

es una estimación de

σ

s

2

1

2 1

de las observaciones en la muestra 1, entonces

. De manera similar

s

2 2

podríamos pensar en utilizar relativas de

σ

2 1

y

σ

2 2

s s

1 2

2

1

calculada a partir de las

observaciones de la segunda muestra es una estimación para 2

s

σ

2 2

. Así intuitivamente

para hacer inferencias con respecto a las magnitudes

2

; si dividimos cada

s

2

1

por

σ

2 1

entonces la razón siguiente:

Estadística I Prof. Luis Ramírez

Pag. 4

s

2

1

s

2 2

σ σ

2 1

σ 22 s12 = 2 2 tiene una distribución “F” con(n1-1) y (n2-1) grados de libertad. La σ 1 s2

2 2

definición general de una distribución F es como sigue: Definición: Sean

χ

2

1

y

χ

2 2

variables aleatorias independientes con v1 y v2 grados de

χ libertad respectivamente. Entonces: F =

χ

2 1

v1

2 2

se dice que tiene una distribución F

v2

con v1 grados de libertad del numerador y v2 grados de libertad del denominador. DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL: En una población binomial, dada una muestra aleatoria (con reemplazamiento), la proporción muestral se define como el cociente del número de elementos de la muestra que tienen la característica deseada, entre el número total de elementos de la muestra pˆ =

ˆ ) = E(x/n) = 1/n E(x) = E(p

ˆ ) = Var(x/n) = Var ( p

1 n

x . n

ˆ )=p np ⇒ E ( p

1 1 p.q ⇒ Var ( pˆ ) = 2 Var(x) = 2 n.p.q n n n

luego

ˆ p

~N

(p; pq/n), es decir: pˆ - p Z = pq ~ N (0,1). n

PROBLEMAS 1.- Una fábrica productora de alimentos envasa mermelada de frutas por medio de un proceso automático. EL peso neto de un frasco se considera una variable aleatoria con un promedio de 420 gr. Y una desviación estándar de 15gr. El peso neto de cada frasco no afecta ni es afectado por el peso neto de los otros. Una vez llenos los frascos se empacan en cajas de 72 frascos cada una. ¿cuál es la probabilidad de que una caja contenga menos de 30 Kg. De mermelada. Estadística I Prof. Luis Ramírez

Pag. 5

2.- Una empresa firma un contrato para la entrega de 1290 unidades de un producto en un mes. La empresa tiene 64 obreros, el número de unidades producidas por obrero por mes es una variable aleatoria con media de 20 unidades y desviación estándar de 2.. ¿Cuál es la probabilidad de que el contrato sea cumplido?. 3.- Para un nivel de ingresos, el SENIAT sabe que las cantidades declaradas por concepto de deducciones médicas, contribuciones caritativas y gastos varios son variables aleatorias independientes, normalmente distribuidas con medias $400; $800 y $100 y desviaciones estándar $100; $250 y $40 respectivamente. A) ¿Cuál es la probabilidad de que la cantidad total declarada por concepto de estas tres deducciones no sea mayor de $1600? B) Si una persona con este nivel de ingresos declara por concepto de estas deducciones un total de $2100, ¿qué tan probable es tener una cantidad igual o mayor a este monto bajo las condiciones dadas?. 4.- Se tiene una máquina de llenado para vaciar 500 gr. de cereal en una caja de cartón. Supóngase que la cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con media 500gr. Y desviación estándar igual a 20gr. Para verificar que el peso promedio de cada caja se mantiene en 500 gr., se toma una muestra aleatoria de 25 de éstas en forma periódica y se pesa el contenido de cada caja. El gerente de la planta ha decidido detener el proceso y encontrar la falla cada vez que el valor promedio de la muestra sea mayor de 510gr. o menor de 490gr. Obtener la probabilidad de detener e proceso. 5.- Supóngase que el número de barriles de petróleo crudo que produce un pozo diariamente es una variable aleatoria con una distribución no especificada. Se observa la producción en 64 días, seleccionados en forma aleatoria, y si se sabe que la desviación estándar del número de barriles por día es 16, determínese la probabilidad de que la media muestral se encuentra a no más de 4 barriles del verdadero valor de la producción por día. 6.- Un investigador desea estimar la media de una población usando una muestra suficientemente grande, para que la probabilidad de que la media muestral no difiera de la media de la población en más del 25% de la desviación estándar, sea 0,95. ¿De qué tamaño debe tomarse la muestra? 7.- Si x1.x2.........x10 es una muestra aleatoria de una población distribuida normalmente con media 8 y varianza 9. Calcular la probabilidad de que la media de la muestra sea mayor que 9. 8.- La resistencia a la tensión para cierto tipo de alambre se distribuye normalmente con una media µ y una varianza desconocida σ 2. Se seleccionaron al azar 6 segmentos de alambre de un rollo grande; encuentre la probabilidad de que la media muestral esté a lo sumo a 2,015

s de la verdadera media poblacional µ . n

9.- Si x1.x2.....x16 es una muestra aleatoria de una población binomial con p = 0,7. ¿ Cuál es la probabilidad de que la proporción muestral sea menor que 0,5?. Estadística I Prof. Luis Ramírez

Pag. 6

10.- Supóngase que quiere encontrar la proporción de los habitantes de Caracas que favorece la construcción de una línea del METRO. ¿A cuántos habitantes se le debe preguntar para que la probabilidad de que la proporción observada a favor de la construcción de la línea difiera de la verdadera proporción en menos del 5% sea 0,98?. 11.- Un fabricante de cigarrillos asegura que el contenido promedio de nicotina en una de sus marcas, es de 0,6 mg. por cigarrillo. Una organización independiente mide el contenido de nicotina de 16 cigarrillos de esta marca y, encuentra que el promedio y la desviación estándar es de 0,75 y 0,175 mg. Respectivamente de nicotina. Si se supone que la cantidad de nicotina en estos cigarrillos es una variable aleatoria normal, ¿qué tan probable es el resultado muestral dado el dato proporcionado por el fabricante?. 12.- El Departamento de Protección al Medio Ambiente asegura que, para un automóvil compacto en particular, el consumo de gasolina en carretera es de un galón por cada 45 millas. Una organización independiente de consumidores adquieren uno de estos automóviles y lo somete a prueba con el propósito de verificar la cifra proporcionada por el DPMA. El automóvil recorrió una distancia de 100 millas en 25 ocasiones. En cada recorrido se anotó el número de galones necesarios para realizar el viaje. Los 25 ensayos, el valor promedio y la desviación estándar tuvieron un valor de 43,5 y 2,5 millas por galón respectivamente. Si se supone que el número de milla que se recorre por galón es una variable aleatoria distribuida normalmente, con base en esta prueba ¿existe alguna razón para dudar de la veracidad del dato dado por el DPMA?.

Estadística I Prof. Luis Ramírez