Estadistica Inferencial

UNIVERSIDAD PRIVADA TELESUP 1 Prefacio: UNIVERSIDAD PRIVADA TELESUP E n esta asignatura se estudian herramientas,

Views 281 Downloads 1 File size 8MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD PRIVADA TELESUP

1

Prefacio:

UNIVERSIDAD PRIVADA TELESUP

E

n esta asignatura se estudian herramientas, que permitan al estudiante, analizar fenómenos que condicionan la toma de decisiones

confiables.

Estos

conocimientos

afianzar las teorías de investigación en

posibilitarán

su campo de

competencia y que tienen por finalidad la aplicación de la teoría a solucionar problemas reales, especialmente en la construcción de inferencias confiables.

Comprende Cuatro Unidades de Aprendizaje:

Unidad I: Variables Aleatorias. Unidad II: Distribución de Probabilidad. Unidad III: Distribuciones Muéstrales. Unidad IV: Estimación de Parámetros.

2

UNIVERSIDAD PRIVADA TELESUP

Estructura de los Contenidos

Variables Aleatorias Conceptos de variables aleatorias.

Variables aleatorias discretas.

Variables aleatorias continuas.

Media y varianza de una variable aleatoria.

Distribución de Probabilidad

Distribuciones Muéstrales

Estimación de Parámetros

Distribución de variables aleatorias discretas.

Muestreo aleatorio.

Intervalo de confianza.

Distribución de variables aleatorias continúas.

Aplicación de la distribución normal.

Aproximaciones a la distribución normal.

Distribución muestral de la media y proporción.

Distribución muestral de la diferencia de dos medias.

Distribución muestral de la diferencia de dos proporciones.

Intervalo de confianza para la media y proporción.

Prueba de hipótesis.

Prueba de hipótesis acerca de la media y proporción.

La competencia que el estudiante debe lograr al final de la asignatura es:

“Identifica e interpreta las principales técnicas, procedimientos, modelos estadísticos estimación y prueba de hipótesis que exige la investigación científica, los estudios de mercado y la administración de un negocio en un entorno competitivo.”

UNIVERSIDAD PRIVADA TELESUP

Índice del Contenido

I. PREFACIO II. DESARROLLO DE LOS CONTENIDOS UNIDAD DE APRENDIZAJE 1: VARIABLES ALEATORIAS 1. Introducción a. Presentación y contextualización b. Competencia c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Conceptos de Variables Aleatorias. b. Tema 02: Variables Aleatorias Discretas. c. Tema 03: Variables Aleatorias Continuas. d. Tema 04: Media y Varianza de una Variable Aleatoria. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen UNIDAD DE APRENDIZAJE 2: DISTRIBUCIÓN DE PROBABILIDAD 1. Introducción a. Presentación y contextualización b. Competencia c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Distribución de Variables Aleatorias Discretas. b. Tema 02: Distribución de Variables Aleatorias Continuas. c. Tema 03: Aplicación de la Distribución Normal. d. Tema 04: Aproximaciones a la Distribución Normal. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen UNIDAD DE APRENDIZAJE 3: DISTRIBUCIONES MUESTRALES 1. Introducción a. Presentación y contextualización b. Competencia c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Muestreo Aleatorio. b. Tema 02: Distribución Muestral de la Media y Proporción. c. Tema 03: Distribución Muestral de la Diferencia de Dos Medias. d. Tema 04: Distribución Muestral de la Diferencia de Dos Proporciones. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen UNIDAD DE APRENDIZAJE 4: ESTIMACIÓN DE PARÁMETROS 1. Introducción a. Presentación y contextualización b. Competencia c. Capacidades d. Actitudes e. Ideas básicas y contenido 2. Desarrollo de los temas a. Tema 01: Intervalo de Confianza. b. Tema 02: Intervalo de Confianza para la Media y Proporción. c. Tema 03: Prueba de Hipótesis. d. Tema 04: Prueba de Hipótesis Acerca de la Media y Proporción. 3. Lecturas recomendadas 4. Actividades 5. Autoevaluación 6. Resumen III. GLOSARIO IV. FUENTES DE INFORMACIÓN V. APÉNDICE VI. SOLUCIONARIO

02 03 - 129 05-28 06 06 06 06 06 06 07-24 07 11 16 20 25 25 26 28 29-60 30 30 30 30 30 30 31-57 31 40 49 53 58 58 59 60 61-93 62 62 62 62 62 62 63-88 63 70 79 86 89 89 91 93 94-120 95 95 95 95 95 95 96-116 96 100 104 108 117 117 118 120 121 122 123 130

4

UNIVERSIDAD PRIVADA TELESUP

5

UNIVERSIDAD PRIVADA TELESUP

Introducción

a) Presentación y contextualización Los temas que se tratan en la presente Unidad, tienen por finalidad que el estudiante desarrolle y ejecute el concepto de variables aleatorias

durante su

proceso de formación profesional y contribuyan en el logro de su perfil profesional.

b) Competencia Explica las propiedades para calcular la media y varianza de variables aleatorias.

c) Capacidades 1. Identifica una variable aleatoria. 2. Explica variables aleatorias discretas. 3. Analiza variables aleatorias continuas. 4. Aplica propiedades para calcular la media y varianza de variables aleatorias.

d) Actitudes 

Valora la importancia de los negocios internacionales para el desarrollo de la nación.  Desarrolla una actitud emprendedora mediante la toma de iniciativas, promoción de actividades y toma de decisiones en relación a la actividad asignada.  Cumple con la presentación de los trabajos encomendados con puntualidad.  Desarrolla la creatividad, la innovación, y el respeto a la honestidad intelectual.

e) Presentación de Ideas básicas y contenidos esenciales de la Unidad: La Unidad de Aprendizaje 01: Variables Aleatorias, comprende el desarrollo de los siguientes temas: TEMA 01: Conceptos de Variables Aleatorias. TEMA 02: Variables Aleatorias Discretas. TEMA 03: Variables Aleatorias Continuas. TEMA 04: Media y Varianza de una Variable Aleatoria.

6

UNIVERSIDAD PRIVADA TELESUP

Conceptos de

Variables Aleatorias

TEMA 1

Competencia: Identificar una variable aleatoria.

7

Desarrollo de los Temas

UNIVERSIDAD PRIVADA TELESUP

Tema 01: Conceptos de Variables Aleatorias Definición.- Se define Variable aleatoria, a una variable estadística cuantitativa definida en un espacio muestral  . Hemos visto que los resultados de un experimento aleatorio pueden ser cuantitativos (por ejemplo, lanzar un dado y registrar el número de la cara superior), o cualitativos (por ejemplo, lanzar dos monedas y registrar el resultado de cada una). Los eventos de mayor interés a la hora de hacer inferencia estadística son eventos numéricos. ¿Qué significa? Que, por ejemplo, estaremos más interesados en conocer el número de caras que resultan en cada repetición del experimento que en la secuencia en sí. Así, los eventos simples (C, X) y (X, C) nos brindarán la misma información, es decir, en los dos se registró 1 cara. El número de caras es una función definida sobre el espacio muestral S: Eventos Simples Numero de caras :X

CC

CX

XC

XX

2

1

1

0

Esto también se puede representar:

8

UNIVERSIDAD PRIVADA TELESUP

Esta función genera una partición del espacio muestral. Todos los eventos simples que corresponden al mismo valor de la función se encuentran en el mismo subconjunto. Estos subconjuntos son disjuntos y su unión es el espacio muestral. La función definida anteriormente se denomina variable aleatoria. Una variable aleatoria es entonces una función que asocia un número real a cada elemento de un espacio muestral.

X:S s  x  X (s) Notación: X indica la función (variable aleatoria), x representa el valor que toma la variable aleatoria al ser valuada en el elemento s. Las variables aleatorias se dividen en dos grupos: discretas y continuas. Una variable discreta puede tomar una cantidad finita o infinita numerable de valores. Una variable aleatoria continua puede tomar infinitamente muchos valores correspondientes a puntos en un intervalo de la recta real. Ejemplos 01: Sea  el espacio muestral que se obtiene al lanzar al aire una moneda tres veces consecutivas, esto es,   SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC Si X se define en  como “el número de caras obtenidas”, entonces, X es una variable aleatoria cuyo rango es el conjunto: R  0,1, 2, 3, .En efecto, X

X  0 , corresponde al evento elemental SSS 

X  1 , corresponde a los eventos elementales SSC , SCS , CSS X  2 , corresponde a los eventos elementales SCC , CSC y CCS X  3 , corresponde al evento elemental CCC

Ejemplo 02: Un profesor califica sus pruebas en una escala de 4 puntos (1, 2, 3, 4). Supongamos que en un curso de 30 alumnos los resultados ordenados fueron: 111222222333333333333444444444 Sea X = resultado de la prueba para un alumno del curso elegido al azar.

Luego R = {1, 2, 3, 4}, X es una variable aleatoria discreta X

La frecuencia de cada uno de los resultados es, 3, 6, 12 y 9 respectivamente.

Resultado (x )

1

2

3

4

Frecuencia (f )

3

6

12

9

Frecuencia. relativa (f /n)

0.1

0.2

0.4

0.3

p (x ) = p

0.1

0.2

0.4

0.3

i

i

i

X

i

i

Siguiendo con el ejemplo: ¿Cuál es la probabilidad de que un alumno elegido al azar haya tenido a lo sumo un 3? P(X ≤ 3) = p (1) + p (2) + p (3) X

X

X

= p1 + p + p = 0.1 + 0.2 + 0.4 = 0.7 2

3

CLASIFICACIÓN DE LAS VARIABLES ALEATORIAS Las variables Aleatorias se clasifican en general en discretas y continuas.

UNIVERSIDAD PRIVADA TELESUP

Variables Aleatorias

TEMA 2

Discretas Competencia: Explicar variables aleatorias discretas.

11

UNIVERSIDAD PRIVADA TELESUP

Tema 02: Variables Aleatorias Discretas Hemos definido hasta acá qué se entiende por variable aleatoria, y una vez determinada una Variable Aleatoria. Podemos conocer cuáles son los valores que puede tomar. Pero es interesante poder medir la probabilidad con que toma cada uno de esos valores.

Definición.- Una variable aleatoria discreta asume cada uno de sus valores con cierta probabilidad que denotaremos por PX (probabilidad inducida por X). Ejemplo: Consideremos el experimento aleatorio de lanzar dos monedas entonces el espacio muestral correspondiente estará dado por:   CC, CS, SC, SS Se define la variable aleatoria X de obtener caras, entonces el rango de X es RX  0,1, 2 , es decir:

X  0 , Si se obtiene sello en las dos monedas X  1 , Si se obtiene SC o CS como resultado del lanzamiento X  2 , Si se obtiene CC en las dos monedas

FUNCIÓN DE PROBABILIDAD Definición.- Sea X una variable aleatoria discreta. Se denomina función (ley o modelo o distribución) de probabilidad de X a la función f(x) definida por f ( x)  P  X  x  , para todo x número real y que satisface las siguientes condiciones: i)

f (x)  0 , x 

ii )



f ( xi )  1

La función de probabilidad de una variable aleatoria X se puede expresar por tabla: Valores xi de X Probabilidad pi  P  X  xi 

x1

x2

x3



xn

p2

p3



pn

p1

12

Notación: La función de probabilidad se puede representar de diversas maneras: 1) En una tabla: x

P(x)

0

¼

1

½

2

¼

2) En un gráfico:

3) En una fórmula:

 2 p( x)   x 0.252  

Ejemplo 01. Sea X la variable aleatoria definida como el número de caras que ocurren al lanzar dos monedas. a. Determine la distribución de probabilidad de X. b. ¿Cuál es la probabilidad de que no obtengamos ninguna cara? c. Calcular la probabilidad P 0  X  1 Solución. a) La Variable Aleatoria X. Toma el valor 0 cuando ocurre el evento (SS). Entonces P(X=0) = P({(SS)}) = ¼

También se puede notar P (0) = P(X=0) = ¼ P(X=2) = P ({(CC)}) = ¼ P(X=1) = P ({(CS), (SC)}) = ¼ + ¼ = ½ Entonces la distribución de probabilidad está dada por: E

P(E)

x

P(x)

CC

¼

2

¼

CS

¼

1

¼

SC

¼

1

¼

SS

¼

0

¼

b) La Variable Aleatoria X Toma el valor 0 cuando ocurre el evento (SS). Entonces: P(X=0) = P({(SS)}) = ¼

1 1 3 c) P 0  X  1  P  X  0  P  X  1    4 2 4 Ejemplo 02 Sea x una variable aleatoria que expresa el Nº de personas que habitan en una vivienda elegida al azar. La distribución de probabilidad de x es la siguiente: xi

1

2

3

4

5

6

7

8ó+

pi

0,230

0,322

0,177

0,155

0,067

0,024

0,015

0,010

a. Comprobar que es una distribución de probabilidad. Todas las pi son mayores o iguales que cero y además se cumple que: 8



i1

pi  0,23  0,322  0,177...0,010  1

b. Hallar la probabilidad de que el Nº de personas que viven en un hogar sea menor o igual que cuatro.

P x  4  P x  1  P x  2  P x  3  P x  4   0,23  0,322  0,177  0,155  0,884

c. Calcular la probabilidad de que al menos dos personas vivan en una vivienda.

P  x  2   P  x  2   P  x  3  ...  P  x  8 

 1  P( x  2)  1  0, 23  0, 77 FUNCIÓN DE DISTRIBUCIÓN ACUMULADA DE VARIABLE ALEATORIA DISCRETA Definición. La función de distribución acumulada (f.d.a) de probabilidades o simplemente función de distribución, F(x), de la variable aleatoria discreta X, cuya función de probabilidad de f(x), se define por:

F (x)  P   x    P(  k )   f (k X X ), kx

x

k

x

Ejemplo: Sea X = nota obtenida en una prueba de un alumno elegido al azar Nota (x)

1

2

3

4

p (x)

0.1

0.2

0.4

0.3

X

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA

si  0  0.1 si  F X( x)   0.3 si  0.7 si  1 si

x1 1x2 2x3 3x4 4x

UNIVERSIDAD PRIVADA TELESUP

Variables Aleatorias

TEMA 3

Continuas Competencia: Analizar variables aleatorias continuas.

16

UNIVERSIDAD PRIVADA TELESUP

Tema 03: Variables Aleatorias Continuas Definición.- Se dice que la función f ( x) es función de densidad (ley o distribución) de probabilidad de la variable aleatoria continua X si satisface las siguientes condiciones: i)

f ( x)  0 para todo x  

ii )



f ( x)dx



iii ) P( A)  P  x  A  A

 f ( x)dx , para cualquier intervalo

A

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA DE VARIABLE ALEATORIA CONTINÚA Definición.- La función de distribución acumulada (f.d.a), F(x) de una variable aleatoria continua X con función de densidad

F ( x)  P  X  x  

x



f ( x) , se define por:

f (t)dt, para    x  



Ejemplo 01: Clasificar como discretas o continuas las siguientes variables aleatorias: a) Nº de páginas de un libro → discreta. b) tiempo que tarda en fundirse una bombilla → continua c) Nº de preguntas en una clase de una hora → discreta. d) cantidad de agua consumida en un mes → continúa.

Ejemplo 02: f (x) una función definida en todos los números reales por: Sea

 cx , x   0, 2 f ( x)     0 , x   0, 2 2

a. Hallar el valor de la constante C para que,

f (x)

para alguna variable aleatoria X.

17

UNIVERSIDAD PRIVADA TELESUP sea una función de densidad

18

b. Calcular P  0  X  1 Solución. a) El área de la figura sombreada es igual a 1 Entonces

1





f ( x)dx 



c

2



cx2 dx  c

8

3

0

3 8

Luego

 3 2  x , x   0, 2 f ( x)   8 x   0, 2   0 , b) Para resolver esta pregunta se sigue:

 3 x 2  dx  1  0 8 8

1

P  0  X  1    

Ejemplo 03: Sea f ( x) una función de densidad de probabilidad de una variable aleatoria X, cuya grafica es la figura: a.) Determinar el valor de la constante c y luego la f.d.p. de X b.) Hallar la función de distribución acumulada F(x) de X

Solución. a) Si el área que encierra la figura con el eje X es igual a 1, entonces

C1/4

Luego la función densidad está dada por la ecuación de la recta en el intervalo dado.

,1x3  x f ( x)   4 en otro caso  0, 

b) La función de distribución acumulada , se calcula por: F (x)  1 , si x  3 F  x   0 , si x  1,

Si 1  x  3,

F ( x) 



x 1

t

dt 

4

x

2

8



1 8



0 , si x  1 2 si 1  x  3   x 1 Entonces: F ( x)  8 , 



 



1 ,

si x  1

UNIVERSIDAD PRIVADA TELESUP

Media y TEMA Varianza 4 de una Variable Aleatoria Competencia: Aplicar propiedades para calcular la media y varianza de variables aleatorias.

20

UNIVERSIDAD PRIVADA TELESUP

Tema 04: Media y Varianza de una Variable Aleatoria VALOR ESPERADO O ESPERANZA MATEMÁTICA Definición.- La media de una variable aleatoria discreta X con función de probabilidad f(x) está dado por:

  E( X )  mx 



xi f ( xi )

xi RX

Definición.- La media de una variable aleatoria continúa X con función de densidad de probabilidad f(x) es la expresión:

E( X ) 



 xf ( x)dx



Propiedades: Si X e Y son dos variables aleatorias se cumple que:

mx y  mx  my Si a y b son constantes se cumple que:

maxb  amx  b Ejemplo: Considerando la variable Aleatoria X, donde X=resultado de lanzar un dado La distribución de probabilidad de x será:

p1  P{x  1}  1 / 6 p2  P{x  2}  1 / 6 p6  P{x  6}  1 / 6 El valor esperado de X será:

1 1 1 1 1 1 mx   xi pi  1  2   3   4   5   6   i1 3,5 k

21

UNIVERSIDAD PRIVADA TELESUP 6

6 6

6

6

6

21

VARIANZA DE UNA VARIABLE ALEATORIA Definición.- Sea X una variable aleatoria con distribución de probabilidad f(x) y con media igual a  . La varianza de X es la expresión:

 X2  E   

2 X

 E 

 X   

2

 X   

2

   i x   2 f (x ) , si X es discreta i  

 

i x



2

   f i(x ) , si X es continua.

Definición.- La desviación estándar de la variable aleatoria X es la raíz cuadrada positiva de la varianza. Esto es:  X

  2X

.

Nota: Una de las propiedades de la varianza que se usa en el cálculo es:

Var( X )  E 

 X 2  

2

  E( X 2 )  

Propiedades: -

Si a y b son constantes se cumple que:

 axb  a  x 2  a 2 2x  axb -

Si x e y son dos variables aleatorias independientes se cumple que:



2 x y

  2

x

2

2

y

2

 x y   x   y

y

Nota.  La desviación típica de una variable aleatoria es una medida de dispersión de la distribución alrededor de la media. Los valores pequeños indican concentración de la distribución alrededor de la esperanza y los valores grandes corresponden a distribuciones más dispersas.  El concepto de desviación típica es equivalente en variables aleatorias discretas y continuas, aunque en estas últimas su cálculo es más complicado. Ejemplo 1 Se lanza tres veces una moneda. Sea X la variable aleatoria que expresa el nº de caras en los tres lanzamientos.

22

a) Hallar y representar la función de probabilidad de X. Solución. Se lanza 3 veces una moneda, entonces es espacio muestral es: E= {CCC,CCX,CXC,XCC,XXC,XCX,CXX,XXX}

p0  P{x  0}  1 / 8  0,125 p1  P{x  1}  3 / 8  0,375

x=0 →{XXX} x=1 →{XXC,XCX,CXX} x=2 →{CCX,CXC,XCC}

p2  P{x  2}  3 / 8  0,375

x=3 →{CCC}

p3  P{x  3}  1 / 8  0,125

b) Calcular el Nº esperado de caras al lanzar la moneda. ¿Era previsible el resultado? Solución. k

mx   xi pi  0  0,125  1  0,375  2  0,375  3  0,125  1,5 i1

Sí, ya que en cada lanzamiento P(C)=1/2 y al lanzar tres veces se tiene que

3  1 / 2  1,5. Hallar la desviación típica de X 2

(0  2  0,125  (1   0,375 2 1,5) 1,5) 2  x    xi  mx  pi   (2   0,125 0,866  0,375  (3  2 i 1 1,5) 1,5) k

o bien: x

i

k

 

2

x

p  m

2



 0,125

0  0,125...3 2

2



 1,5 2

 0,866

i 1

Ejemplo 2 Una compañía ha vendido 205 billetes para un avión de 200 plazas. Sea x la variable aleatoria que expresa el nº de viajeros que va al aeropuerto para viajar en el avión. Su distribución es: xi

198

199

200

201

202

203

204

205

pi

0,05

0,09

0,15

0,20

0,23

0,17

0,09

0,02

a) Hallar la probabilidad de que todos los viajeros que van al aeropuerto tengan plaza.

23

Solución.

P{x  200}  P{x  198}  P{x  199}  P{x  200}   0,05  0,09  0,15  0,29 b) Obtener la probabilidad de que se quede sin plaza alguna de los viajeros que va al aeropuerto.

P{x  200}  P{x  201}  P{x  202}  ...  P{x  205}  0, 2  0, 23  0,17  0, 09  0, 02  0, 71

P{x  200}  1 P{x  200}  1 0,29  0,71

c) Calcular el nº esperado de viajeros que acude al aeropuerto. k

mx   xi pi  198  0,05  199  0,09  200  0,15  201  0,2  i 1

 202  0,23  203  0,17  204  0,09  205  0,02   201,44

d) ¿Cuál es la probabilidad de que la primera persona de la lista de espera tenga sitio en el vuelo?

P{x  199}  P{x  198}  P{x  199}  0,05  0,09  0,14 Ejemplo 3 La vida útil de un objeto es una variable aleatoria X con función de densidad de probabilidad

 e f ( x)    0

, si x  0

x

si x  0

,

Calcular la varianza y la deviación estándar de X. Solución. Integrando por partes y analizando la convergencia, se tiene: 



b

x x



x e dx  Limb  xe 



 Limb  e  Y luego integrando dos veces por partes se obtiene 0



E   X    0 2

Luego, 

2

2



b

x

0

x x e dx 

2



2 2

0

2

2

 E  X     



2





1 2

La deviación estándar de X es:  



 1



2

1

0

1

 



1 



24

UNIVERSIDAD PRIVADA TELESUP

Lecturas Recomendadas



DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS. ir.pe/65jn



PROBABILIDADES Y VARIABLES ALEATORIAS. http://bit.ly/FWFKl6



VARIABLES ALEATORIAS. http://probabilidad20100.blogspot.com/p/varianza-y-desviacion-estandar.html

Actividades y Ejercicios 1) Ingresa al link “Operaciones 1” lee atentamente las indicaciones, desarróllalo y envíalo por el mismo medio. Sea X la variable aleatoria definida como el número de caras que ocurren al lanzar una moneda 4 veces. a) Determine la distribución de probabilidad de X. b) Calcular la probabilidad P 1  X  3 Sea X una variable aleatoria continua con distribución.

f ( x)   



1 , 0x3 xk 6  0

,

en otra parte

a.) Calcular k. b.) Hallar P 1  X  2 La vida útil de un objeto en miles de horas, es una variable aleatoria continua X cuya función de densidad de probabilidades:

 x , si 0  x  2  1 f ( x)   2  

0 , en otro caso

a) Calcular la esperanza. b) La varianza de vida del objeto.

25

UNIVERSIDAD PRIVADA TELESUP

Autoevaluación

1) Calcule el rango de la variable aleatoria definido como la números que aparecen al lanzar dos dados. a. b. c. d. e.

suma de los

RX  2, 4, 6, 8,10,12 RX  2, 3, 4, 5, 6, 7, 8, 9,10,11,12 RX  3, 5, 7, 9,11

RX  4, 5, 6, 7, 8, 9,10,11,12

RX  2, 3, 4, 5, 6, 7, 8, 9,10

2) El número de hijos por familia en una determinada región es una variable aleatoria X cuya función de probabilidad es: x

P  X  x

0

1

2

3

4

1/16

4/16

k

4/16

1/16

Calcular el valor de la constante k a. 11/16 b. 6/16 c. 6/16 d. 5/8 e. 4/16 3) Suponga que el número de cursos en que está matriculado un alumno es una variable aleatoria X con función de probabilidad. x

P  X  x

0

1

2

3

4

5

1/10

2/10

1/10

3/10

2/10

1/10

Determinar la media de la variable aleatoria. a. b. c. d. e.

11/10 13/5 12/5 7/10 1

26

UNIVERSIDAD PRIVADA TELESUP 4) Sea f ( x) una función definida en todos los números reales por:

 ax , si x   0, 3 f ( x)      0 , si x   0, 3 3

Hallar el valor de la constante a para que, f ( x) sea una función de densidad para alguna variable aleatoria X. a. b. c. d. e.

1/16 4/81 5/81 1/3 5/27

5) Sea f ( x) una función densidad para alguna variable aleatoria X definida por:

 4 3 x , si x   0, 3 f ( x)   81   0 , si x   0, 3 Calcular P 1  X  2 a. b. c. d. e.

5/27 5/24 4/27 2/81 4/81

27

UNIVERSIDAD PRIVADA TELESUP

Resumen

UNIDAD DE APRENDIZAJE I:

Una variable aleatoria es una variable que toma valores numéricos determinados por el resultado de un experimento aleatorio. No hay que confundir la variable aleatoria con sus posibles valores. Ejemplos: 

nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…)



nº de llamadas que recibe un teléfono en una hora



tiempo que esperan los clientes para pagar en un supermercado…

Las variables aleatorias pueden ser discretas o continuas. Es el conjunto de posibles valores, es numerable. Suelen estar asociadas a experimentos en que se mide el número de veces que sucede algo. Variable aleatoria discreta asume cada uno de sus valores con cierta probabilidad que (probabilidad inducida por X). denotaremos por PX Una variable aleatoria discreta X representa los resultados de un espacio muestral en forma tal que por P(X = x) se entenderá la probabilidad de que X tome el valor de x. Es el conjunto de posibles valores es no numerable. Puede tomar todos los |valores de un intervalo. Son el resultado de medir. f (x) es función de densidad (ley o distribución) de Se dice que la función probabilidad de la variable aleatoria continua X si satisface las siguientes condiciones: Si una función X que asigna a cada resultado posible de un experimento un número real. Si X puede asumir cualquier valor en algún intervalo I (el intervalo puede ser acotado o desacotado), se llama una variable aleatoria continua. La desviación típica de una variable aleatoria es una medida de dispersión de la distribución alrededor de la media. Los valores pequeños indican concentración de la distribución alrededor de la esperanza y los valores grandes corresponden a distribuciones más dispersas. El concepto de desviación típica es equivalente en variables aleatorias discretas y continuas, aunque en estas últimas su cálculo es más complicado.

UNIVERSIDAD PRIVADA TELESUP

29

UNIVERSIDAD PRIVADA TELESUP

Introducción

a) Presentación y contextualización Los temas que se tratan en la presente Unidad, tienen por finalidad que el estudiante desarrolle y ejecute el concepto de distribución de probabilidad durante su proceso de formación profesional y contribuyan en el logro de su perfil profesional.

b) Competencia Identifica las características y funciones del lenguaje, así como elementos e interferencias de la comunicación.

c) Capacidades 1. Resuelve problemas usando distribuciones aleatorias discretas. 2. Analiza y resuelve problemas que involucren distribuciones de variables aleatorias continuas. 3. Analiza la importancia de la distribución Normal. 4. Aplica la aproximación a la distribución Normal.

d) Actitudes  Puntualidad en la entrega de trabajo.  Respeto a las normas de convivencia.  Perseverancia en las tareas.

e) Presentación de Ideas básicas y contenidos esenciales de la Unidad: La Unidad de Aprendizaje 02: Distribución de Probabilidad, comprende el desarrollo de los siguientes temas: TEMA 01: Distribución de Variables Aleatorias Discretas. TEMA 02: Distribución de Variables Aleatorias Continúas. TEMA 03: Aplicación de la Distribución Normal. TEMA 04: Aproximaciones a la Distribución Normal.

30

UNIVERSIDAD PRIVADA TELESUP

Distribución de Variables Aleatorias Discretas

TEMA 1

Competencia: Resolver problemas aleatorias discretas.

usando

distribuciones

31

Desarrollo de los Temas

UNIVERSIDAD PRIVADA TELESUP

Tema 01: Distribución de Variables Aleatorias Discretas Como complemento al capítulo anterior en el que definimos todos los conceptos relativos a variables aleatorias, describimos en éste las principales leyes de probabilidad que encontramos en las aplicaciones del cálculo de probabilidades. Atendiendo a la clasificación de las variables aleatorias en discretas y continuas describiremos las principales leyes de probabilidad de cada una de ellas, las cuales constituirán el soporte subyacente de la inferencia estadística y a las que será necesario hacer referencia en el estudio de dicho bloque. Iniciamos este capítulo con el estudio de las distribuciones para variables aleatorias discretas.

DISTRIBUCIONES DISCRETAS: Distribución de Bernoulli. Definición.- La variable aleatoria X definida de  de manera que atribuye a E el valor de 1 y a F el valor 0, se denomina variable aleatoria de Bernoulli.. La distribución de Bernoulli de parámetro p es: f ( x)  P  X  x   p q x

1

x

Teorema.- Si X tiene distribución de Bernoulli de parámetro p, entonces: a.)

E( X )  p

b.) Var( X )  pq

Distribución Binomial. Definición.- Se dice que la variable aleatoria X definida como el número de éxitos que ocurren en las n pruebas de Bernoulli, tiene distribución binomial con parámetros n y p y se escribe,

si su función de probabilidad es:

 n  k n k k  0,1, 2, 3,..., n f ( x)  P  X  k     p q k ,   32

UNIVERSIDAD PRIVADA TELESUP

Teorema.- Si a.)

, entonces:

E( X )  np

b.) Var( X )  npq

EJEMPLO: En una tienda de alquiler de Autos, cada vez que un cliente alquile un automóvil debe pagar como mínimo $ 4. Si alquila un auto de tipo A debe pagar $ 15 más, y si alquila un auto no A debe pagar $ 5 más. Se sabe que la probabilidad de que un cliente alquile un auto tipo A es de 0.7. De cinco clientes que alquilan autos en esa tienda: a) Determine la distribución de probabilidades de los clientes que alquilan automóviles tipo A. b) Determine la utilidad y la utilidad esperada que producen a la tienda los 5 clientes que alquilan automóviles.

Solución: a) Sea X el número de clientes que alquilan automóviles tipo A. Entonces, los valores posibles de X son: 0,1,2,3,4,5. La probabilidad del evento A: “un cliente alquila un automóvil tipo A” es . La distribución de probabilidad de X es: C

P E 0.7

 

y P E 0.3

 5 f k   P  X  k     k 5 k  0.5 ,  

 0.7 

k

k  0,1, 2, 3, 4, 5

b) La utilidad U que producen los cinco clientes es:

U  20 15X  (5  X ) x  0,1, 2, 3, 4, 5. 5,

Dado que E  X   np  5 0.7  3.5 La utilidad esperada es:

E U   45 10E  X   45 10  3.5  80

DISTRIBUCIÓN GEOMÉTRICA Definición.-

UNIVERSIDAD PRIVADA TELESUP

Se dice que la variable aleatoria X que se define como el número de repeticiones independientes de un ensayo de Bernoulli hasta que ocurra el primer éxito, tiene distribución de probabilidad geométrica con parámetro p y se escribe X función de probabilidad es:

G( p) , si su

f (x)  P  X  x   q

x 1

p x  1, 2,..., etc.

;

Teorema.Si X es una variable aleatoria con distribución geométrica

de parámetro

p , entonces

a.)   b.) 

2

1 p



q 2 p

Ejemplo Un vendedor a domicilio hace llamadas telefónicas a clientes potenciales, La probabilidad de vender en cada llamada es 0.02. a) Calcule la probabilidad de que la sexta llamada sea su primera venta. b) Calcule el esperado del número de llamadas hasta obtener su primera venta. c) ¿Qué probabilidad hay de que su primera venta ocurra después de más de 5 llamadas si ya se hizo 3 llamadas sin éxito?

Solución Sea X el número de llamadas hasta conseguir una venta . Sus posibles valores son: 1,2,3,4….etc. El modelo de probabilidad de X es geométrica de parámetro p  0.02 , esto es:

P  X  k    0.02 0.98k k  1, 2, 3,... 1

,

a) Luego, la probabilidad de que la sexta llamada sea su primera venta es:

P  X  6   0.02  0.985  0.018

34

UNIVERSIDAD PRIVADA TELESUP

b)

1 E X  50 . A la larga en la llamada N° 50 obtiene su primera venta. 0.02

c) El evento “ya hizo 3 llamadas sin éxito” es equivalente al evento “requiere hacer más de 3 llamadas hasta que obtenga un éxito”. Entonces,

P X 3 X 5

P  X  5 / X  3  0.98

P  X  3



P X 5

P X  3

5



  0.98 

2

 0.983

DISTRIBUCIÓN DE PASCAL O BINOMIAL NEGATIVA Definición.Si se repite en forma independiente un ensayo de Bernoulli , donde cada resultado , se dice puede ser un éxito con probabilidad p o un fracaso con probabilidad q  1  p que la variable aleatorias que se define como el numero de intentos hasta que ocurran r éxitos, tiene una distribución Binomial negativa o Pascal con parámetros r y p y se escribe X

P(r, p) , si su función de probabilidad es: k 1 r k  r k  r, r  1, r  2,..., etc f (k )  P Y  k   C p q r 1

,

Teorema.Si X es una variable aleatoria con distribución de pascal con parámetros r y p, entonces: a) r b) 

2

1 p

r

q 2 p

Ejemplo. Una maquina produce artículos de uno en uno y de manera independiente. Se considera que el 10% de ellos son defectuosos. Si la maquina se detiene apenas produce el cuarto artículo defectuoso:

35

UNIVERSIDAD PRIVADA TELESUP a) ¿Cuál es el número esperado de artículos producidos hasta que se detiene la maquina? b) ¿Cuál es la probabilidad de que la maquina se detenga en el decimo articulo producido?

36

c) ¿Cuál es la probabilidad de que produzca al menos 10 artículos para que la maquina se detenga?

Solución Sea X el número de artículos producidos hasta tener 4 defectuosos. La ley de y p  0.1 . Esto es, probabilidad de X es Pascal con parámetros r  4

P Y  k   3C

p 1 p k 4 k  4, 5, 6....

k 1 4

, b)

a)

E( X )  r 

1

4

p

1

P X

 40

 10  C3 P 1 P  9

4

6

0.1

c) 9

P  X  10  1 P 4  X  9  k 4 1

k 4

C3 P 1 P  k 1 4

DISTRIBUCIÓN HIPERGEOMÉTRICA. .

Definición.-

Se dice que la variable aleatoria X que se define como el numero de éxitos en una muestra de tamaño n que se selecciona al azar uno por uno sin reposición de N elementos o resultados posibles, de los cuales r son clasificados como éxitos y los restantes N-r como fracasos, tiene distribución hipergeométrica y se escribe X

H (N , n,r) , si su función de probabilidad es:

f ( x)  P  X  k   ;

Ckr CnNrk CnN

k  0,1, 2,..., n

Teorema.Sea X una variable aleatoria con distribución hipergeométrica H ( N , n, r) , y sean, p  r / N ; q  1  p , entonces E( X )  np a.) b.) Var( X )  npq

N n N 1

c.) H (N , n, r)  B(n, p) , Esto es, si N tiende a  o N es grande con respecto a n, entonces la distribución hipergeométrica se aproxima a una distribución binomial.

DISTRIBUCIÓN DE POISSON. Se dice que la variable aleatoria discreta X, cuyos valores posibles

Definición

son: 0, 1, 2, 3,.., tiene distribución de Poisson con parámetro y se escribe X P( ) , si su función de probabilidad  (  0) es:

e   ( x) f ( x)  P  X  x    ,

x  0,1, 2,...

x!

Nota: La distribución de Poisson se aplica a problemas donde la variable aleatoria es el número de eventos independientes que ocurren en un intervalo de tiempo, o una región plana (con un promedio dado), por ejemplo: 

Número de llamadas que recibe una central telefónica en el periodo de un minuto.



Número de accidentes de trabajo que ocurren en una fábrica durante una semana.



Numero de fallas en la superficie de una pintura rectangular.



Numero de bacterias en un volumen de un metro cúbico de agua.

Ejemplo. Una empresa textil produce un tipo de tela en rolos de 100 metros. El numero de defectos que se encuentra al desenrollar la tela es una variable aleatoria de Poisson que tiene en promedio 4 defectos por cada 20 metros de tela.

a) ¿Qué probabilidad hay de que al desenrollar la tela se encuentre menos de tres defectos en los primeros 50 metros?

b) Hallar la probabilidad de que al desenrollar la tela no se encuentre defectos en el primer segmento de 5 metros de tela.

c) Si se desenrollan 5 rollos de la tela escogidos al azar, ¿Cuál es la probabilidad de que no se encuentre defectos en el primer segmento de 5 metros de tela en al menos dos de ellos?

Solución. Sea X el número de defectos encontrados en un segmento de 20

  4 . La probabilidad de

metros de tela que ocurre con promedio

encontrar k defectos en el segmento de 20 

metros de tela es:

t

t

P X k 

Donde

k    

k  0,1, 2,...

,

k!

t es el promedio de defectos en el segmento de 20  metros de tela, t

a)

El promedio de defectos en los primeros 50 metros de tela es t  4 2.5  10 Aumenta la longitud de 20 a 50 metros) y la probabilidad de que se

( t  2.5

encuentren menos de tres defectos en los primeros 50 metros es: 0

P  X  3  P  X  2   10

e 0!

1

10



e

10 1!

2

10



e

10 

 0.00277

2!

38

b) El promedio de defectos en los primeros 5 metros de tela es t  4  1 / 4   1 entonces la probabilidad de no encontrar defectos en los primeros 5 metros de tela es:

0 P X   

e1 1 



0

 0.3679

0!

c)

Sea Y el numero de rollos que no tienen defectos en el primer segmento de 5 metros de tela de 5 rollos de tela escogidos al azar. la variable Y cuyos valores posibles son: o,1,2,3,5 se distribuye según la ley binomial B  5, p  donde

p  P  X  0  0.3679 .luego, P Y  2  1  P Y  1  1 

1



k 0

Ck5 P k 1  P 5k  1 0.3946  0.6054

UNIVERSIDAD PRIVADA TELESUP

Dis tribución de Variables Aleatorias Continuas

TEMA 2

Competencia: Analizar y resolver problemas que involucren distribuciones de variables aleatorias continuas.

40

UNIVERSIDAD PRIVADA TELESUP

Tema 02: Distribución de Variables Aleatorias Continúas En esta sección estudiaremos las distribuciones más importantes de variables aleatorias continuas unidimensionales. El soporte de una v.a. continua se define como aquella región de

donde su densidad es no nula, f ( x)  0 . Para las

distribuciones que enunciaremos, podrá ser bien todo, un segmento de la forma

o bien

.

DISTRIBUCIÓN UNIFORME Se dice que la variable aleatoria X tiene distribución uniforme (o rectangular) en el intervalo  a, b , a  b , y se describe por

X

U  a, b, si su función de densidad de

probabilidad es:

 1  f ( x)  b 

,

a

, en otros casos

0

si a  x  b

Ejemplo: Dos gerentes A y B deben encontrarse en cierto lugar entre las 7 p.m. y 8 p.m. para firmar un contrato. Cada uno espera al otro a lo más 10 minutos, ¿Cuál es la probabilidad de que no se encuentren sabiendo que A llega a las 7.30 p.m.?

Solución. Sea la variable aleatoria X el tiempo de llegada de B, que puede hacerlo en cualquier instante aleatorio entre las 7 p.m. y las 8 p.m. o entre 0 y 60 minutos.

 y su función de densidad de probabilidad es:

Entonces, X

 

1

,

si 0  x  60

f ( x)  60  0 , en otros casos 

41

U 0,

Puesto que A llega a las 7.30 p.m. o a los 30 minutos después de las 7 p.m. y espera a lo más 10 minutos, B no se encontrara con A si B llega de 7 p.m. a menos de 7.20 p.m. o si llega después de las 7.40 p.m. , Luego , la probabilidad de que A y B no se encuentran es:

P 0  X  20 o

40  X  60 

20



0

1

dx 

60



60

40

1 60

20

dx 

60



20

 60 3

2

Teorema.Si la variable aleatoria X tiene distribución uniforme en el intervalo  a, b  , entonces,

a b 2

a)

E( X ) 

b)

Var( X ) 

(b  a) 12

2

DISTRIBUCIÓN NORMAL Definición.- Se dice que la variable aleatoria continúa X, que toma los valores

reales   x   , se distribuye normalmente (o más brevemente es normal)

con parámetros  y  y se describe por X

N (  , 2

) , si su función de

densidad es:

f (x)  ,

1



2

exp  

 2

1  x  

   x  

    2    

Teorema.Si la variable aleatoria X tiene distribución normal N (  ,  2 ) , entonces,

a)

E( X )  

b)

Var( X )   2

Tabulación de la Distribución Normal z

Las áreas ( z)  P  Z  z 



z

  (t)dt  





1 e

dt que se representan en la parte

2

sombreada de la grafica en la tabla, tiene las siguientes propiedades:

P  a  Z  b  (b)  (a) (z)  1  ( z) P  a  x  a   (a)  (a)  (a)  (1  (a))  2(a)  1

Ejemplos: Encuentre el valor de z para un nivel de confianza del 95%.

Solución Se utilizará la tabla que tiene el área bajo la curva de -

hasta z. Si lo vemos

gráficamente sería:

El nivel de confianza bilateral está dividido en partes iguales bajo la curva:

En base a la tabla que se está utilizando, se tendrá que buscar el área de 0.975, ya que cada extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96.

DISTRIBUCIONES GAMMA, EXPONENCIAL Función Gamma Definición.- La función Gamma denotada por,  , se define por:

     x



  1

0

Donde





e x dx

es un número real positivo.

Propiedades:

1) 2)

Si   1       1   1 

 1   e x dx  1 0 

3) 4)

2  e dx    1   x 1/ x   2  0

Si   n  1    n    n 1!

Distribución Gamma Definición.Se dice que la variable aleatoria continua X tiene distribución Gamma, con parámetros  , si su función de densidad es:  y  y se representa por X   1   x , si x  0   x e  f ( x)       si x  0 ,  0

  , 

Teorema: Si X

a

  , 



b



2

 

 2





Distribución Exponencial Definición.Se dice que la variable aleatoria continua X tiene distribución exponencial con , si su función de densidad de parámetro  (   0) , y se describe probabilidades es:

  e  x , si x  0 f ( x)   , si x  0  0

Nota. La distribución exponencial es un caso particular de la distribución gamma   1 . Luego, si la variable aleatoria X tiene distribución exponencial con cuando

parámetro  o X

 1,  , entonces tiene,



a)  

1



b)  2 

1



2

Por otra parte, su función distribución acumulada en el intervalo  0,  es: x F (x)  P  X  x   e e



0

x

dt  1x  , 0  x  

Observar también que: P  X  x  1 P  X  x  e  x , 0  x   Además, para números reales positivos s y t cualesquiera, se verifica: P  X  s  t / X  s  P  X  t



En efecto,



P X s t



P X st/X  s



P  X  s

e

 (st)

 e

s

 e

t



P X t

DISTRIBUCIÓN CHI-CUADRADO Definición.Se dice que la variable aleatoria continua X tiene distribución chi-cuadrado con r

 2 (r) , si su función de densidad es:

grados de libertad, y se representa por X 

 2 r / 2 r / 21  x / 2 , si x  0 x e f ( x)    (r / 2)  si x  0 ,  0 Propiedades 2  2 (1) a ) Si Z N (0,1), entonces , Z b ) Si Z1 , Z2 ,..., son r variables aleatorias independientes tales que Zi Zr

para cada i  1, 2, 3,.., r

entonces

r

Z i 1

2 i

N (0,1)

 (1) 2

Uso de la tabla Chi-cuadrado Si la variable aleatoria X se distribuye como una chi-cuadrado con r grados de libertad, esto es, si X

 2 (r) , entonces en la tabla de probabilidades chi-cuadrado

se puede encontrar una probabilidad 1 

o un valor c  12 ,r mediante la relación



P  X  12 ,   1     r

DISTRIBUCIÓN T DE STUDENT Definición.Se dice que una variable aleatoria continua T se distribuye según t-student (mas brevemente según t) con r grados de libertad y se representa por T

t(r) , si su

función de densidad es,

  r1   ( r 1) / 2    2 2   t          f (t )  ,    x   ,  1 r r        r ( )  2 Donde r es un entero positivo.

Propiedades. i)

Si X tiene distribución t-student con r grados de libertad, entonces su media y su varianza son respectivamente,

ii )



0



 

2

r ,r2 r2

Su grafica tiene forma de campana de Gauss, simétrica en cero

iii )

La varianza de la distribución t es mayor que de la distribución N(0,1). Pero cuando r   , la varianza de la t tiende a 1

iv )

La distribución t se aproxima a una distribución N(0,1), cuando r   . La aproximación es buena, si r  0 .

Uso de la Tabla t-Student. Si la variable aleatoria T tiene distribución t-Student con r grados de libertad, o T

t(r) , en la tabla de probabilidades t-Student se puede encontrar una probabilidad

1   o un valor c  t1 ,r mediante la relación: P   T  t1 ,r    1   .

DISTRIBUCIÓN F Definición.- Se dice que una variable aleatoria continua X se distribuye según F con r1 y r2 grados de libertad y se representa por X F (r1 , r2, si su función de densidad ) es,  r1  r1 / 2  r1 r2      r 2    2  f ( x)  . r1   r2         2 2     

x

1

(r

r x r2  

/ 2) 1

; 0x

( r1  r2 ) / 2

Donde r1 y r2 son números enteros positivos.

USO DE LA TABLA F F (r1 , r2 , en la tabla de probabilidad F se puede encontrar , mediante la relación: o un )valor c  F

Si la variable aleatoria X una probabilidad 1 



1 ,r1 ,r2

P  X  c  1 



Teorema- Si X tiene distribución F con grados de libertad r1 y r2 , entonces 1/ X tiene distribución F con grados de libertad r y r , esto es: 2 1

F1 ,r1 ,r2 

1 F ,r2 ,r1

UNIVERSIDAD PRIVADA TELESUP

plicación

A

de la

TEMA 3

Distribución Normal Competencia: Analizar la importancia de la distribución normal.

49

UNIVERSIDAD PRIVADA TELESUP

Tema 03: Aplicación de la Distribución Normal Como se ha mencionado anteriormente, la ley de probabilidad gaussiana la encontramos en la mayoría de los fenómenos que observamos en la naturaleza, por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a la de las distribuciones asociadas a ella. Sin embargo, a pesar de su utilidad, hay que apuntar un hecho negativo para esta ley de probabilidad: La función

e x

2

no posee primitiva

Las consecuencias desde el punto de vista práctico son importantes, ya que eso impide el que podamos escribir de modo sencillo la función de distribución de la normal, y nos tenemos que limitar a decir que:

F  x   P  X  x 

x

 

SA se

f  t  dt 

1

x

e



1 t   



2 

2

2

dt 



(din poder hacer uso de ninguna expresión que la simplifique. cáfortunadamente esto no impide que para un valor de x fijo, F(x) pueda pr r calculado. De hecho puede ser calculado con tanta precisión ecimales) como se quiera, pero para esto se necesita usar técnicas de lculo numérico y ordenadores. Para la utilización en problemas ácticos de la función de distribución F, existen ciertas tablas donde se ofrecen (con varios decimales de precisión) los valores F(x) para una serie limitada de valores xi dados. Normalmente F se encuentra tabulada para una distribución Z, normal de media 0 y varianza 1 que se denomina distribución normal tipificada:

50

En el caso de que tengamos una distribución diferente,

se obtiene Z

haciendo el siguiente cambio:

Ejemplo 1: Las alturas de las mujeres jóvenes argentinas están aproximadamente distribuidas normalmente con μ = 160 cm σ = 4 cm. Sea X = altura de una mujer argentina joven, elegida al azar, X es una variable aleatoria continua y su función de densidad de probabilidad está dada por:

1

f X ( x) 

e

2

( x 2  )  2 2

En General, si la función de densidad de probabilidad de una variable aleatoria X está dada por la expresión anterior, decimos que X tiene distribución normal de 2

parámetros con μ y σ :

X



N  , 2



PROPIEDADES DE LA DISTRIBUCIÓN NORMAL





N  , , entonces

Sea X

2

X  a) z  

N  0,1

r. distribución Normal Estánda

2 2 b) ax  b N  a  b, a  

Siguiendo con el ejemplo: ¿Cuál es la probabilidad de que una mujer joven elegida al azar tenga una altura entre 160 cm y 168 cm? Recordemos que X = altura de una mujer argentina joven, elegida al azar entonces

X



N  , 2



con μ = 160 cm y σ = 4 cm

51

P 160  X  168   P 

 160 160 X  168 160     4  4 

 P 0  z  2    2     0  0.9772  0.500  0.4772

Ejemplo 2: Supongamos que cierto fenómeno pueda ser representado mediante una variable aleatoria X

N  45, 1 , y queremos calcular la probabilidad de que X tome un 8

valor entre 39 y 48, es decir,

Comenzamos haciendo el cambio de variable

de modo que :

52

UNIVERSIDAD PRIVADA TELESUP

Aproximaciones a la

Distribución Normal

TEMA 4

Competencia: Aplicar la aproximación a la distribución normal.

53

UNIVERSIDAD PRIVADA TELESUP

Tema 04: Aproximaciones a la Distribución Normal Se puede demostrar (teorema central del límite) que una v.a. discreta con distribución binomial,

se puede aproximar mediante una distribución

normal si n es suficientemente grande y p no está ni muy próximo a 0 ni a 1. Como el valor esperado y la varianza de X son respectivamente np y npq, la aproximación consiste en decir que

. El convenio que se suele

utilizar para poder realizar esta aproximación es:

aunque en realidad esta no da resultados muy precisos a menos que realmente n sea un valor muy grande o .

TEOREMA DEL LÍMITE CENTRAL El teorema del límite central establece que si se tienen n variables aleatorias, X1, X2, ..., Xn, independientes y con idéntica distribución de media m y varianza s2, a medida que crece n, la suma (y la media) de estas variables tiende a seguir una distribución normal. El teorema del límite central, explicado de forma intuitiva, afirma que cualquiera que sea la distribución común de un conjunto de variables aleatorias, suponiendo que su varianza sea finita, la suma y la media de un número elevado de estas variables tenderán a distribuirse de manera similar a una variable normal.

54

Ejemplo: Durante cierta epidemia de gripe, enferma el 30% de la población. En un aula con 200 estudiantes de Medicina, ¿cuál es la probabilidad de que al menos 40 padezcan la enfermedad? Calcular la probabilidad de que haya 60 estudiantes con gripe.

Solución: La variable aleatoria. Que contabiliza el número de alumnos que padece la gripe es

Cuya media es

  n. p 

y su varianza es

  npq  42 . 2

Realizar los

60 cálculos con la ley binomial es muy engorroso, ya que intervienen números combinatorios de gran tamaño, y potencias muy elevadas. Por ello utilizamos la aproximación normal de X, teniendo en cuenta que se verifican las condiciones necesarias para que el error sea aceptable:

55

Así aproximando la v.a. discreta binomial X, mediante la v.a. continua normal XN tenemos:

También es necesario calcular

p  x  60

. Esta probabilidad se calcula

exactamente como:

Dada la dificultad numérica para calcular esa cantidad, y como la distribución binomial no está habitualmente tabulada hasta valores tan altos, vamos a utilizar su aproximación normal, XN. Pero hay que prestar atención al hecho de que XN es una v.a. continua, y por tanto la probabilidad de cualquier punto es cero. En particular,

UNIVERSIDAD PRIVADA TELESUP

lo que ha de ser interpretado como un error de aproximación. Hay métodos más aproximados para calcular la probabilidad buscada. Por ejemplo, por el valor de la función de densidad de XN podemos aproximar p x 

 60

en ese punto (es en el único sentido en que se puede entender la función de densidad de la normal como una aproximación de una probabilidad).

Así:

Por último, otra posibilidad es considerar un intervalo de longitud 1 centrado en el valor 60 del que deseamos hallar su probabilidad y hacer:

Lecturas Recomendadas

UNIVERSIDAD PRIVADA TELESUP



DISTRIBUCIÓN NORMAL http://www.uca.es/uca/dpto/C146/pag_personal/f_alvarez/documentos/CC%20Tra bajo%20Tema%205.pdf



DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS http://www.itapizaco.edu.mx/~joseluis/apuntes/estadistica/distribuciones%20disc retas.pdf



VARIABLES ALEATORIAS CONTINUAS http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2011/1/PyEC06.pdf

Actividades y Ejercicios

1) Ingresa al link “Distribución” lee atentamente desarróllalo y envíalo por el mismo medio.

las

indicaciones,

Hacer uso de la distribución normal en los problemas de casos reales.  Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una media de 650 kilogramos y una desviación estándar de 100 kg. ¿Qué probabilidad hay de que la demanda no supere los 500 kg?  El porcentaje del ingreso ahorrado por las familias tiene distribución normal con una media del 10%. Determine la desviación estándar P  X  t  , si el 2.28% de los ahorros son mayores que 12.4%  Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media $600 y desviación estándar $100. Calcular la probabilidad de que el ingreso de una familia escogida al azar sea menor que $400.

UNIVERSIDAD PRIVADA TELESUP

Autoevaluación

1) La probabilidad de que cierto tipo de objeto pase con éxito una determinada prueba es 5/6. Se prueban 10 de tales objetos. Si X es la variable aleatoria que se define como el número de objetos que no pasan la prueba. Calcular la media de esta distribución. a. 3.2456 b. 0.5000 c. 1.667 d. 2.5 e. 1.1777 2) Supóngase que la temperatura T durante junio está distribuida normalmente con media 68º y desviación estándar 6º. Hallar la probabilidad p de que la temperatura este entre 70º y 80º. a. b. c. d. e.

0,347 0,456 0,567 0,234 0,789

3) Los pesos de 2 000 soldados presentan una distribución normal de media 65 kg y desviación típica 8 kg. Calcula la probabilidad de que un soldado elegido al azar pese Más de 61 kg. a. b. c. d. e.

0.6915 0.5000 0.3333 1.0000 0.2222

4) La duración de un láser semiconductor a potencia constante tiene una distribución normal con media 7.000 horas y desviación típica de 600 horas. ¿Cuál es la probabilidad de que el láser falle antes de 5.000 horas? a. 0.8765 b. 0.0004 c. 0.2456 d. 0.5321 e. 0.3456 5) Suponga que la duración X de los focos que produce una compañía se distribuye normalmente. si el 18.41 % de estos focos duran menos de 8.2 meses y el 6.68% duran al menos 13 meses. ¿calcular la media y la varianza de la duración de los focos?   10 ,   2 a. b.   12 ,   2 c.   8 ,   1 d.   12 ,   1, 5 e.   8 ,   2

UNIVERSIDAD PRIVADA TELESUP

Resumen

UNIDAD DE APRENDIZAJE II:

Sea un espacio probabilístico y sea X una variable aleatoria discreta que toma como posibles valores x ,x ,.....x , se define la distribución de probabilidad de X como el 1

2

n

conjunto de pares (xi , pi ) que a cada valor de la variable le asocia una probabilidad, donde pi = P(X=xi ), tal que la suma de todas las probabilidades es igual a la unidad. En la distribución de variables discretas encontramos Distribución de Bernoulli, Distribución Binomial, Distribución Geométrica, Distribución de Pascal o Binomial negativa, Distribución hipergeométrica.

Si la variable aleatoria es continua, hay infinitos valores posibles de la variable y entra cada dos de ellos se podrían definir infinitos valores. En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable como se puede hacer en el caso de las variables discretas. Pero sí es posible calcular la probabilidad acumulada hasta un cierto valor (función de distribución) y cómo cambia esa probabilidad acumulada en cada punto (densidad de probabilidad). Por tanto, cuando la variable aleatoria sea continua hablaremos de función de densidad.

Puede tomar cualquier valor  ,   Hay más probabilidad para los valores cercanos a la media  Conforme nos separamos de  , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica). Conforme nos separamos de  , la probabilidad va decreciendo dependiendo la desviación típica s.

El teorema del límite central establece que si se tienen n variables aleatorias, X1, X2,..., Xn, independientes y con idéntica distribución de media m y varianza s2, a medida que crece n, la suma (y la media) de estas variables tiende a seguir una distribución normal. Explicado de forma intuitiva, afirma que cualquiera que sea la distribución común de un conjunto de variables aleatorias, suponiendo que su varianza sea finita, la suma y la media de un número elevado de estas variables tenderán a distribuirse de manera similar a una variable normal.

UNIVERSIDAD PRIVADA TELESUP

61

UNIVERSIDAD PRIVADA TELESUP

Introducción

a) Presentación y contextualización Los temas que se tratan en la presente unidad, tienen por finalidad que el estudiante desarrolle y ejecute el concepto de distribución muestral durante su proceso de formación profesional y contribuyan en el logro de su perfil profesional.

b) Competencia Interpreta las características y funciones del muestreo aleatorio así como sus aplicaciones.

c) Capacidades 1. Reconoce la importancia del concepto de muestreo aleatorio. 2. Resuelve problemas que involucren distribuciones muestrales de la media y proporción. 3. Analiza la importancia de la distribución muestral de la diferencia de dos medias. 4. Analiza la importancia de la distribución muestral de la diferencia de dos proporciones.

d) Actitudes  Aprecia críticamente las diferentes ventajas y desventajas del muestreo aleatorio.  Valora el las etapas de la distribución muestral de la media y proporción.  Toma una actitud con capacidad crítica para la ddistribución muestral de la diferencia de dos medias.  Valora a la distribución muestral de la diferencia de dos proporciones.

e) Presentación de ideas básicas y contenidos esenciales de la unidad: La Unidad de Aprendizaje 03: Distribuciones Muestrales, comprende el desarrollo de los siguientes temas: TEMA 01: Muestreo Aleatorio. TEMA 02: Distribución Muestral de la Media y Proporción. TEMA 03: Distribución Muestral de la Diferencia de Dos Medias. TEMA 04: Distribución Muestral de la Diferencia de Dos Proporciones.

62

UNIVERSIDAD PRIVADA TELESUP

Muestreo

TEMA 1

Aleatorio Competencia: Reconocer la importancia del concepto de muestreo aleatorio.

63

UNIVERSIDAD PRIVADA TELESUP

Desarrollo de los Temas

Tema 01: Muestreo Aleatorio MUESTREO Se llama muestreo al procedimiento mediante el cual obtenemos una ó más muestras. Entonces la técnica de elegir la muestra se llama muestreo, el objetivo principal de un diseño

de

muestreo

Procedimientos muestra

que

para sea

la

es

proporcionar

selección

de

la

representativa

de

la

población en estudio. La utilización de las técnicas de muestreo es muy amplia se usa en agricultura, ganadería, industria. Comercio, servicios y en las diferentes áreas del conocimiento humano como biología, medicina. Ingeniería, psicología. Sociología, mercadotecnia, antropología etc.

Ventajas: Un costo más bajo, es la razón principal en la utilización del muestreo en lugar de una enumeración completa. Los datos pueden ser recolectados con mayor rapidez cuando se trabaja con una muestra que con toda la población. Una muestra exigiría menos personal por lo tanto se podría seleccionar y adiestrar mejores empleados y el trabajo podría ser supervisado más estrechamente. La recolección de datos de una muestra conducen a datos más precisos que los que podrían ser obtenidos reuniendo datos de todas las unidades. Cuando la población es infinita o tan grande de tal manera que el censo exceda las posibilidades del investigador. Cuando la población es suficientemente uniforme. Cuando el proceso de medida o investigación de las características de cada elemento sea destructivo.

64

UNIVERSIDAD PRIVADA TELESUP

Definición de la Población en Estudio El primer problema es definir la población bajo estudio. La poblaciones el conjunto de unidades que el investigador desea estudiar de las cuales planea generalizar y debe ser preciso al definir la población. Ejemplo 1: La población puede consistir en todas las universidades en Lima metropolitana. Ejemplo 2: La población puede ser todos los establecimientos de comestibles ubicados en el distrito de la Victoria.

Definición de las Variables Que se Estudian El segundo problema a considerar es la definición de las variables que se van a estudiar. Ejemplo:

Supongamos

que

una

embotelladora

desea determinar si los establecimientos de víveres de Lima metropolitana vende una marca específica de refresco, en este caso sólo se está estudiando una variable y puede dar una definición estricta; una tienda tiene en existencia el refresco o no la tiene.

DISEÑO DE MUESTRAS El diseño de la muestra es la tercera dificultad suscitada en cualquier operación de muestreo y puede ser dividida en: La determinación de las unidades de muestreo. La selección de los elementos de la muestra y determinación del

tamaño de la muestra.

Estimación de las características de la población con los datos de la muestra.

Selección de las Unidades de Muestreo Se llama unidad de muestreo a las colecciones disjuntas de la población, en algunos casos una unidad muestral está constituida por un solo elemento. Ejemplo: Considérese el problema de hallar la proporción de establecimientos de comestibles en la Victoria que venden Pepsi cola. Aquí el establecimiento de comestibles sería la unidad observada y por lo tanto sería razonable considerar un procedimiento de muestreo directo. Dada una lista de todos los establecimientos de comestibles de dicha área sería relativamente fácil escoger una muestra.

Selección de la Muestra Otra parte del problema del diseño muestra es el método de escoger los componentes de muestra. Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo y del dinero y habilidad para tomar una muestra y la naturaleza de los elementos individuales de la población.

Los métodos más comunes podemos dividirlos de la siguiente manera: Por el número de muestras tomadas de una población. por la manera usada en seleccionar los elementos incluidos en la Muestra.

a) Métodos en Función del Número de Muestras: i. Muestreo Simple El muestreo es simple sí sólo se toma una muestra de la población en este caso, la muestra debe ser lo suficiente grande para extraer una conclusión. Una muestra grande generalmente cuesta mucho dinero. ii. Muestreo Doble Cuando el resultado del estudio de la primera muestra no es decisivo, una segunda es extraída de la misma población y las dos muestras son combinadas para analizar los resultados.

66

b) Muestreo en Función a la Manera de Selección de los Elementos Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes: i. Muestreo de Juicio (no probabilística) Llamado así porque sus elementos son seleccionados mediante el juicio personal. La persona que selecciona los elementos de la muestra visualmente es un experto en la materia dada. Una muestra de juicio es llamada muestra no probabilística. Puesto que éste método está basado en los puntos de vista subjetivos de una persona ii. Muestreo Aleatorio Una muestra se dice que es aleatoria cuando la manera de seleccionar es tal que cada elemento de la población tiene igual oportunidad de ser seleccionado a esta muestra también se le conoce como probabilística puesto que cada elemento tiene una probabilidad conocida. La aplicación de este método naturalmente presupone la disponibilidad de una lista de todas las unidades de muestreo en la población, llamándose marco y proporciona la base para la selección de la muestra. Es deseable que este marco contenga todas las unidades muéstrales que son de interés y que no incluya unidades falsas ni tampoco elementos repetidos.

Los tipos más comunes de muestreo aleatorio son: Muestreo aleatorio simple Muestreo estratificado Muestreo sistemático Muestreo por conglomerado.

Error de Muestreo Cualquiera que sea el método de selección una estimación por muestra diferirá de la que se obtenga utilizando todos los elementos de la población, a esta diferencia entre

67

el valor de la muestra y el valor de la población se llama error de muestreo. Muestreo Aleatorio Simple Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Un método simple para obtener los elementos de la muestra aleatoria simple es utilizando las tablas de números al azar y puede ser resumido de la siguiente manera: Numérese cada componente de la población desde el 1 hasta N (número total de la población. Comenzando en algún lugar previamente seleccionado en una tabla de números al azar, precédase sistemáticamente a través de la tabla utilizando tantas cifras como sean necesarias. Por ejemplo: Si la población tiene 90 elementos tómese 2 dígitos cada vez y así sucesivamente.

Distribución Normal: Esta distribución es

frecuentemente utilizada en las

aplicaciones Estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a Parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de campana". En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p. ej. tallas, pesos, envergaduras, diámetros, peri metros,.. . Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.

68

Caracteres psicológicos, por ejemplo: coeficiente intelectual, -grado de adaptación a un medio. Definición.- Se denomina estadística a cualquier función de las variables aleatorias que constituyen la muestra.

Y  H ( X1 , X 2 ,..., X n ) , cuyo valor es el

Una estadística es una variable aleatoria número real

y  H (x1 , x2 ,..., xn ) . El término estadística se usa para referirse tanto a la

función de la muestra, como al valor de esta función.

En

general

para

cada

parámetro

poblacional

hay

una

estadística

correspondiente a calcularse a partir de la muestra. Algunas características importantes y sus valores calculados a partir de una muestra aleatoria son: a) La media muestral

X 

1

valor

n

b) La varianza muestral S

2

n



x

X i , con

1 n xi n i 1

i 1

1

 X  X 



n

i i 1

c) La desviación estándar muestral S 

, con valor

s2 

1 n

S

2

n

2

n

 xi

x



i 1

2

d) La proporción muestral (porcentaje de éxitos en la muestra) P o P  donde X i también ,

1 n Xi, n i n

B(1, p) (el parámetro p es el porcentaje de éxitos de la población). P

X , donde X n

B(n, p)

69

UNIVERSIDAD PRIVADA TELESUP

Distribución Muestral de Media y Proporción

la

TEMA 2

Competencia: Resolver problemas que involucren distribuciones muestrales de la media y proporción.

70

UNIVERSIDAD PRIVADA TELESUP

Tema 02: Distribución Muestral de la Media y Proporción DEFINICIÓN.- Se denomina distribución muestral de una estadística a su distribución de probabilidad

Distribución Muestral de la Media X

X1 , X 2 ,..., X n , una muestra aleatoria de tamaño n escogida

Teorema.- Sea

de una población f(x) con media  y con varianza  2 . Si X es la media muestral, entonces, a) E

 X 

b ) Var

2 

 X  n

c ) para n suficientemente grande , la variable aleatoria ,

Z

X 

/ n

Tiene distribución aproximadamente normal N (0,1) .

Notas. a ) La aproximación de X a la normal N (  ,  / n) es buena si n  30 , sin 2

importar si la población es discreta o continua. b ) Si la muestra aleatoria es escogida de una población normal N (  ,  ) , 2

entonces, la distribución de X es exactamente normal N (  ,  / n) , para 2

cualquier tamaño de muestra, n  2 c ) La varianza de la media: Var

2 

 X  n

es válida, si el muestreo es con o sin

reemplazo en una población infinita, o es con reemplazo en una población finita de tamaño N.

71

Si el muestreo es sin reemplazo en una población finita de tamaño N, entonces,



la varianza de la distribución de X es: 2 N n   N n el coeficiente se denomina factor de 2

X



  n  N1

N 1

corrección para población finita. Observar que cuando N   el factor de corrección tiende a uno. d ) La desviación estándar de una estadística es conocida como error estándar.

Ejemplo 01 La altura media de 400 alumnos de un plantel de secundaria es de 1.50 metros y su desviación típica es de 0.25 metros. Determinar la probabilidad de que en una muestra de 36 alumnos, la media sea superior a 1.60 metros. Solución.

P

 X  1.60  ?

z

1.60 1.50 0.25 / 36

 2.40

z  2.40  A  0.4918 P  0.5000  0.4918  0.0082  0.82%

Ejemplo 02 Se tiene para la venta un lote de 1000 pollos, con un peso promedio de 3.5 kg y una desviación estándar de 0.18 kg. ¿Cuál es la probabilidad de que en una muestra aleatoria, 100 pollos de esta población, pesen entre 3.53 y 3.56 kg?

Solución.



  3.5 ,   0.18 , n  100 , P 3.53 

z

X 

/ n



3.56 3.5 0.18 / 100



X  3.56  ?

 3.33

z  3.33  A  0.4996  z

3.53 3.5 0.18 / 100

 1.66

z  1.66  A  0.4515





Entonces P 3.53  X  3.56  0.4996  0.4515  0.0481  4.81%

Ejemplo 03: Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solución:

73

Este valor se busca en la tabla de z

La interpretación sería que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

Ejemplo 04: Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine: a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros. b. El número de medias muestrales que caen por debajo de 172 centímetros. Solución: Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en cada inciso.

a.

(0.7607)(200)=152 medias muestrales b.

(0.0336)(200)= 7 medias muestrales

Distribución Muestral de la Proporción Sea

X1 , X 2 ,..., X una muestra aleatoria de tamaño n extraída de la población n

de Bernoulli

B(1, p) , donde p es el porcentaje de éxitos en la población y sea

P

X 1 X 2 ... X n X  n n X  X1  X 2  ...  X una

La proporción de éxitos en la muestra, siendo,

n

B(n, p) , entonces,

variable binomial

1(np)  p  X 1  E( X )   n n  n

a )  p  E(P)  E 

2

1 1 p(1 p)  X  n 2 V ( X ) n2  np(1  p)  n  n

b )  p  V (P)  V

c ) Si n es suficientemente grande , entonces la variable aleatoria

Z

P p p(1  p) / n 75

Tiene aproximadamente distribución N (0,1) Notas: 1). El error de P es : p 

p(1  p) n

2). Si la población es finita de tamaño N y el muestreo es sin reposición el error estándar (desviación estándar de la hipergeométrica) es :

p(1  p) N  n n N1

 p

Observar que si N es grande con respecto a n el factor de corrección

N n se N 1

aproxima a la unidad.

3). Si n es suficientemente grande n  30 ,

 c p  p(P  c)  p  Z   p   Sin embargo aproximaciones satisfactorias se obtienen si se introduce el factor de corrección por continuidad

1 . Luego, 2n

1      c  2n      p(P  c)  p  Z  p  

p  

 

4). Observar que las dos expresiones de Z

Z

X np np(1  p)



P p p(1  p)

Donde X es binomial y P es el porcentaje de éxitos en la muestra, tiene . distribución N (0,1)

Ejemplos: 1). Se tiene que el 4% de las piezas producidas por cierta maquina son defectuosas, ¿Cuál es la probabilidad de que un grupo de 200 piezas, el 3% o más sean defectuosas? Solución.

 p  p  0.04 , P^  p  0.03

P 

PQ  n

 0.04   0.96  200

 0.014

Se desea determinar la probabilidad P  p  0.03

z

p  p PQ n



0.03 0.04

 0.04   0.96 

 0.71

200

z  0.71  A  0.2612 

p  0.2612  0.5000  0.7612 Entonces

P  p  0.03  0.7612  76.12% 2). Se desea estudiar una muestra de 49 personas para saber la proporción de las mayores de 40 años; sabiendo que la proporción en la población es 0.4. ¿Cuál es la probabilidad de que la proporción en la muestra sea menor de 0.5? Solución.

n  49 ,

z

P  0.4 ,

p p  PQ n

P

 p  0.5  ?

0.5 0.4  1.43  0.4   0.6 49

z  1.43  A  0.4236 

P  0.5000  0.4236  0.9236 Entonces

…… P



p  0.5



 0.9236  92.36%

3). 46% de los sindicatos del país están en contra de comerciar con china continental; ¿Cuál es la probabilidad de que una encuesta a 100 sindicatos muestre que más del 52% tengan la misma posición? 4). La probabilidad de que un paciente se recupere de una rara enfermedad es 0.4. ¿Cuál es la probabilidad de que en una muestra de 100 pacientes seleccionados de una población de 1000 que sufren la enfermedad, más del 30% sobrevivan? 5). Se ha determinado que el 65% de los estudiantes universitarios de Lima prefieren los cuadernos marca profesional. ¿Cuál es la probabilidad de que en una muestra de 100 universitarios de dicha ciudad?, encontremos que: a ) Como máximo el 68% sean usuarios de ese tipo de cuaderno b ) Exactamente

66%

sean

usuarios

(utilizar medio punto de porcentaje para los límites).

UNIVERSIDAD PRIVADA TELESUP

Distribución Muestral de la Diferencia de Dos Medias

TEMA 3

Competencia: Analizar la importancia de la distribución muestral de la diferencia de dos medias.

79

UNIVERSIDAD PRIVADA TELESUP

Tema 03: Distribución Muestral de la Diferencia de Dos Medias DISTRIBUCIÓN DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES Se tienen dos poblaciones independientes identificadas la primera por X y la segunda N1 y N2 , cuyas medias se simbolizan por  x y  y , y sus por Y, de tamaño desviaciones típicas son  x y  y . Se obtiene un numero (M) de pares de muestras. Las medias muestrales de la primera población se identifican por X 1 ; X 2 ;....; X M . Y las muestras de la segunda variable por Y 1 ;Y 2 ;....;Y M . La media de las diferencias de todos los pares o medias muestrales posibles, es igual a la diferencia entre las medias poblacionales:

x  y   x   y

La desviación típica de las diferencias entre los pares de medias muestrales se simboliza por: 2

2

n1

n2

x xy    y

Suponiendo que la distribución de diferencias entre las medias muestrales tenga un comportamiento similar a la distribución normal, la variante estadística estará dada por:

Z

x y 

x y

x  y

Entonces Z 

 xy  

x

y

2

 x2  y  n1 n2

80

Se puede aplicar esta distribución cuando no se conoce n las varianzas poblacionales

 2x y  2y , las cuales pueden ser sustituidas por varianzas muestrales s2x y s 2y siempre y cuando que n1 y n2 sean mayores que 30. Algunos autores consideran si

n1  n2  30 . Siendo su fórmula:

Z

 x  y   

x

y

2

sx2 sy  n1 n2

Ejemplo 01: Se tienen dos poblaciones normales e independientes, donde la media de la segunda población es 0.65 menor que la de la primera; si se obtienen muestras de tamaño 110 y 120 y si las respectivas desviaciones típicas poblacionales son 12 y 8, se pide determinar la probabilidad de que, en un par de muestras, la diferencia entre ambas medias muestrales sea superior a 1 en valor absoluto. Solución.

x   y  0.65 , Se pide P

n1  100 n2  120 ,  x  12,  y  8 ,

 xy 1

Entonces

x  y 



2



x

n1



y

z

y

n2

 x  y   

x

1.40



64

  1.40 100 120





x  y 1 0.65 z  0.25 ,

144

2

z

1 0.65

 1.18

1.40

z  0.25  A  0.0987  , z  1.18  A  0.3810  Entonces P  1 0.0987  0.3810  0.5203

Ejemplo 2 En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar es de 12.247 libras. Si de 20 niños y

representa el promedio de los pesos

es el promedio de los pesos de una muestra de 25 niñas, encuentre

la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas. Solución: Datos: 1=

2

100 libras

= 85 libras

1=

14.142 libras

2=

12.247 libras

n1 = 20 niños n2 = 25 niñas =?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056.

82

Entonces

p   x A  x B  20   P  z  1.25  1 P  z  1.25  1  1.25  1 0.8944  0.1056

Ejemplo 03: Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B. Solución: Datos: A

= 7.2 años

B

= 6.7 años

A= B=

0.8 años 0.7 años

nA = 34 tubos nB = 40 tubos =?

p x

Entonces  p



A

x

B

  1 



x

A



x B  A

B    2A 2B    nA nB 

 

1 7.2 6.7   

 0.82 0.7    2

34

40



 P  z  2.84  1 P  z  2.84  1   2.84   1 0.9977  0.0023

Ejemplo 04: Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?

Solución: En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que se supondrán que son iguales.

84

Datos: 1=

1.23 Km/Lto

2=

1.37 Km/Lto

n1 = 35 autos n2 = 42 autos a.

b.

=?

?

La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117.

85

UNIVERSIDAD PRIVADA TELESUP

Distribución Muestral de la Diferencia de dos Proporciones

TEMA 4

Competencia: Analizar la importancia de la distribución muestral de la diferencia de dos proporciones.

86

UNIVERSIDAD PRIVADA TELESUP

Tema 04: Distribución Muestral de la Diferencia de Dos Proporciones En el caso de dos poblaciones independientes de tamaño N1 y N 2 , distribuidas binomialmente, con parámetros, medias proporcionales P1 y P2 (también se pueden representar las medias por

P 

y  P2 

1

P 1Q 1

P y P ) y desviaciones proporcionales  P y  P , siendo: 2

1

1

2

P2 Q2 , el error estándar de las diferencias entre las dos

medias proporcionales estará dada por: P Q P2 Q2 Cuando son valores poblacionales.

 PP  1

1

1

n

2



n

1

2

Cuando n1 y n2 corresponden a muestras grandes, es decir, ambas superiores a 30.

sP1  P2 

p1 q1 p2 q2  n1 n2

La media de las diferencias entre dos medias proporcionales, se simboliza; indistintamente por:

P  P  P P  P1  P2 1

2

1

2

La variante estadística Z, estará dada en la misma forma que fue representada para diferencias entre dos medias muestrales:

Z

 p1  p2    P  P  1

P1Q1 n1



2

P2 Q 2 n2

Ejemplos: 1). Consideremos dos maquinas que producen un determinado articulo; la primera produce por término medio un 14% de artículos defectuosos, en tanto que otra, produce el 20% de artículos defectuosos; si se obtienen muestras de 200 unidades en la primera y 100 unidades en la segunda, ¿Cuál es la probabilidad de que difiera A de B en 8% o más?

87

UNIVERSIDAD PRIVADA TELESUP

Solución Datos: P  p  p  0.08  ? 1 2 ,

n1  200 , n2  100 , p1  14% , p2  20%

 p   p  0.14  0.20  0.06 1

2

p1 p2  p  p

0.08  0.06 

 z

1



2

P1Q1 P2Q2  n1 n2

 0.14   0.86  0.2  0.8  

200

 2.98

100

z  2.98  A  0.4986 

Entonces

P  p1  p2  0.08  0.5000  0.4986  0.0014  0.14%

2). Dos fabricas A y B, producen artículos similares. La producción de A contiene 7% de defectuosos, y la de B contiene, 5%. Si se extrae una muestra aleatoria de 2000 de cada una de las producciones de las fábricas, ¿Cuál es la probabilidad de que las dos muestras revelen una diferencia en el número de los defectuosos del 1 % o más? Solución Datos: P  p1  p2  0.01

 ?

n1  200 0 , n2  2000 , p1  0.07 , p2  0.05

,

p1 p2  p



z

0.01   0.02 

2 p 

P1Q1 P2Q2 n1

z

1

n2

0.01 0.02

 0.07   0.93  0.05  0.9  2000



4 0.0075 Luego z  1.33  A  0.4082  z  4  A  0.5000 

2000

5

 1.33

UNIVERSIDAD PRIVADA TELESUP Entonces

P  0.5000  0.4082  0.9082 P  p1  p2  0.01

  90.82% 88

Lecturas Recomendadas

UNIVERSIDAD PRIVADA TELESUP



MUESTREO ALEATORIO http://www.fao.org/docrep/x5684s/x5684s04.htm



DISTRIBUCIÓN MUESTRA DE LA PROPORCIÓN http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r76020.PDF



DISTRIBUCIÓN MUESTRAL DE LA MEDIA www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r14681.DOC

Actividades y Ejercicios

1) Ingresa al link “Distribución Muestral” lee atentamente las indicaciones, desarróllalo y envíalo por el mismo medio. Hacer uso de las distintas formulas correspondientes a las distribuciones muestrales. 

Las estaturas de los estudiantes de la Universidad Privada Telesup se distribuyen normalmente con media de 170 centímetros y desviación típica de 10 centímetros. Si se toma una muestra de 81 estudiantes, ¿Cuál es la probabilidad de que tengan una estatura superior a 175 centímetros?



46% de los sindicatos del país están en contra de comerciar con china continental; ¿Cuál es la probabilidad de que una encuesta a 100 sindicatos muestre que más del 52% tengan la misma posición?

89

UNIVERSIDAD PRIVADA TELESUP



Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las mujeres de cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen ese leve desorden sanguíneo sea de Menos de 0.035 a favor de los hombres. a. Menos de 0.035 a favor de los hombres. b. Entre 0.01 y 0.04 a favor de los hombres.



Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.

90

UNIVERSIDAD PRIVADA TELESUP

Autoevaluación

1) En una población normal, con media 72,1 y desviación estándar 3,1, encuentre la probabilidad de que en una muestra de 90 observaciones, la media sea menor que 71,7. a. 0.1093 b. 0.587 c. 0.4931 d. 0.4568 e. 1.0000 2) Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye 2

normalmente con media de 2000 libras y una varianza de 25,000 lbs . Si se selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidad de que en esa muestra la resistencia media encontrada sea de por lo menos 1958 libras. a. 0.9960 b. 0.5555 c. 0.2345 d. 0.6478 e. 1.0000 3) Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la compañía a tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la b tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía a tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía b. a. 0.3421 b. 0.5444 c. 0.2345 d. 0.0023 e. 0.7865

91

UNIVERSIDAD PRIVADA TELESUP

4) Se prueba el rendimiento en km/l de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/l para la primera gasolina y una desviación estándar de 1.37km/l para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. ¿cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/l que la segunda gasolina? a. 0.1234 b. 0.0645 c. 0.2455 d. 0.3333 e. 0.9899 5) Consideremos dos maquinas que producen un determinado articulo; la primera produce por término medio un 14 % de artículos defectuosos, en tanto que otra, produce el 20% de artículos defectuosos; si se tiene muestras de 200 unidades en la primera y 100 unidades en la segunda, ¿cuál es la probabilidad de que difiera a de b en 8% o más? a. 0.3245 b. 0.8787 c. 0.9986 d. 0.2222 e. 0.0014

92

UNIVERSIDAD PRIVADA TELESUP

Resumen

UNIDAD DE APRENDIZAJE III:

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población. Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos.

Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias. En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal

.

Para conocer la distribución muestral de las diferencias entre las medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de estos tres casos se analizará por separado. La media de las diferencias de todos los pares o medias muestrales posibles, es igual a la diferencia entre las medias poblacionales:    xy

x

y

Este método se utiliza para comparar las proporciones o porcentajes de dos distribuciones muestrales distintas y formula una inferencia con respecto a la diferencia de estas. La media de las diferencias entre dos medias proporcionales, se simboliza; indistintamente por: P  P  P P  P1  P2 1

2

1

2

La variante estadística Z, estará dada en la misma forma que fue representada para diferencias entre dos medias muestrales: p1  p2   P1  P2   Z P1 Q 1 P2 Q 2  n1 n2

UNIVERSIDAD PRIVADA TELESUP

94

UNIVERSIDAD PRIVADA TELESUP

Introducción

a) Presentación y contextualización Los temas que se tratan en la presente Unidad, tienen por finalidad que el estudiante desarrolle y ejecute la Estimación de parámetros y Prueba de Hipótesis. Haciendo que pueda desenvolverse en el

ámbito internacional, también

haciéndolo un profesional de primera categoría.

b) Competencia Analiza e interpreta las técnicas de estimación de parámetros y prueba de hipótesis.

c) Capacidades 1. Reconoce la importancia del intervalo de confianza. 2. Analiza el intervalo de confianza para la media y proporción. 3. Conoce la importancia de la prueba de hipótesis. 4. Identifica la prueba de hipótesis para la media y proporción.

d) Actitudes  Promueve actividades y toma decisiones pertinentes.  Respeta y cumple las normas de convivencia en el ámbito universitario.  Asume responsabilidad para desarrollar todos los problemas y actividades que se asignan.

e) Presentación de Ideas básicas y contenidos esenciales de la Unidad: La Unidad de Aprendizaje 04: Estimación de Parámetros, comprende el desarrollo de los siguientes temas: TEMA 01: Intervalo de Confianza. TEMA 02: Intervalo de Confianza para la Media y Proporción. TEMA 03: Prueba de Hipótesis. TEMA 04: Prueba de Hipótesis Acerca de la Media y Proporción.

95

UNIVERSIDAD PRIVADA TELESUP

Intervalo de

TEMA 1

Confianza Competencia: Reconocer la importancia del intervalo de confianza.

96

Desarrollo de los Temas

UNIVERSIDAD PRIVADA TELESUP

Tema 01: Intervalo de Confianza

La "estimación por intervalo" consiste en determinar un par de valores a y b, tales que constituidos en intervalo [a, b]; y para una probabilidad 1-



prefijada (nivel de

confianza) se verifique en relación al parámetro

 a estimar se cumpla:

P( [a, b])  1  ó en otros términos: P(a    b)  1  .

Podemos considerar el nivel de confianza (1-



) que hemos prefijado para la

expresión anterior como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partir de la muestra incluya el verdadero valor del parámetro a estimar. Refleja la "confianza" en la "construcción" del intervalo y de que éste tras concretar la muestra contendrá el valor a estimar. De ahí que en términos numéricos dicho nivel o probabilidad haya de tomar un valor alto (0.9, 0.95, 0.99).

Evidentemente el complementario al nivel de confianza; es

decir

 , nivel de significación supondrá las probabilidades de cometer el error de no dar por incluido el verdadero valor del parámetro a estimar en un intervalo en el que realmente si está. De ahí y dado que se trata de un error posible a cometer, su cuantificación en términos de probabilidad sea muy pequeña (0.1,

0.05, 0.005,..).

97

UNIVERSIDAD PRIVADA TELESUP

En relación a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza prefijado la amplitud del intervalo de estimación será también mayor y por tanto la estimación será menos precisa.

La siguiente tabla presenta las diferentes fórmulas que ayudaran a crear los intervalos.

Para la distribución Normal utilice la siguiente tabla:

Nivel de confianza





Z

2

90%





1.645

95%





1.96

99%





2.576

UNIVERSIDAD PRIVADA TELESUP

Intervalo

de

Confianza para la Media y Proporción

TEMA 2

Competencia: Analizar el intervalo de confianza para la media y proporción.

100

UNIVERSIDAD PRIVADA TELESUP

Tema 02: Intervalo de Confianza para la Media y Proporción DISTRIBUCIÓN DE MEDIAS MUESTRALES Con las siguientes formulas se pueden determinar los límites de confianza para cada caso, dependiendo de la desviación típica y del tamaño de la muestra, son:

 s  x  Z  Cuando se da  l

n

s Se tiene s y n  30

s  x  Z l

n s

 xt s

l

se tiene s (corregida) y

n

n  30

s

s xt l

se tiene s (sin corregir) y n  30 , donde t1 / 2,n1 se encuentra en

n

la tabla t-student con n-1 grados de libertad.

Ejemplo Nº 1

En población cuya distribución se desconoce se obtiene una muestra (m.a.s.) de 2000 valores de la que resulta una media de 225 y una desviación típica de 10. Suponiendo que la varianza muestral coincide con la poblacional, estimar un intervalo para la media de la población con un nivel de confianza del 95%. Tendríamos



1-

(muestra grande n>30); n=2000,

para una población

normal.



P( x  Z 0.95





)



n 2 confianza. El resultado sería: µ  [224,56, 225,44] con el 95 % de 2

n

uxZ

101

Ejemplo Nº 2

Las ventas diarias de cierta oficina comercial se supone que siguen una distribución normal. Para estimar el volumen medio de ventas por día se realiza una muestra de 10 días escogidos al azar, resultando que la media de las ventas de esos 10 días es S/. 100 con una desviación típica de S/. 4. Dar un intervalo de estimación para el volumen medio de ventas por día con una confianza del 95 %.

Conocemos que

según la información que poseemos, estamos ante:

Distribución normal; n=10 (muestra pequeña); S=4(poblacional desconocida); media muestral=100; Para 1-  =0.95, luego

P( x  t  2



=0.05 con lo que t (9gl)  2.26 (según tabla T) 2

S S )  0.95  u  x  t n n 2

El resultado sería: µ  [S/.96, 99; S/.103, 01] con el 95 % de confianza.

Ejemplo Nº 3

Se quiere obtener un intervalo de confianza para el valor de las ventas medias por hora que se producen en un kiosco. Para ello realizamos una muestra consistente en elegir al azar las ventas que se realizaron durante 1000 horas distintas; muestra cuyos resultados fueron: 2

ventas medias por hora S/. 4000, y varianza de dicha muestra S /. 4000. Obtener dicho intervalo con un nivel de confianza del 95.5 %.

Queremos construir un intervalo para la media con las siguientes características: Tamaño

muestral=n=1000,

con

muestreo

aleatorio

simple, la población no es normal ni conocemos su varianza. El resultado de la muestra es

x  4000 , S2=4000.

Si bien se trata de un intervalo para la media con varianza desconocida y población no normal, dado que el tamaño muestral es grande podemos suponer normalidad y tomar como varianza poblacional a la muestral así:

P( x  z  2

   u  x  z  n )  0.95 n 2

El resultado sería: µ  [S/.399, 08; S/.4003, 92] con el 95 % de confianza.

UNIVERSIDAD PRIVADA TELESUP

Prueba de

TEMA 3

Hipótesis Competencia: Conocer la importancia de la prueba de hipótesis.

104

UNIVERSIDAD PRIVADA TELESUP

Tema 03: Prueba de Hipótesis La prueba de hipótesis, denominada también prueba de significación tiene como objeto principal evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población, denominados parámetros.

DEFINICIÓN.- Se denomina hipótesis nula y se representa por H 0 , a la hipótesis que es aceptada provisionalmente como verdadera y cuya validez será sometida a comprobación experimental.

Los

resultados

experimentales

nos

permitirán seguir aceptándola como verdadera o si, por el contrario, debemos rechazarla como tal. Toda hipótesis nula va acompañada de otra hipótesis alternativa

DEFINICIÓN.- Se denomina hipótesis alternativa y se representa por H1 o H A , a la hipótesis que se acepta en caso de que la hipótesis nula

H 0 sea

rechazada. La hipótesis alternativa H , es pues una suposición contraria a la A hipótesis nula.

Prueba de una Hipótesis Estadística Para tomar decisiones estadísticas, se requieren de las dos hipótesis: la hipótesis nula y la hipótesis alternativa referida a un parámetro. La prueba de una hipótesis estadística es un proceso que nos conduce a tomar la H 0 , en contraposición de la decisión de aceptar o rechazar la hipótesis nula hipótesis alternativa H y en base a los resultados de una muestra aleatoria 1 seleccionada de la población de estudio.

105

La hipótesis nula H 0 es la primera que se plantea, y debe ser establecida de del parámetro  en estudio. manera que especifique un valor  0 Nota: la aceptación de una hipótesis significa que los datos de la muestra no proporcionan evidencia suficiente para refutarla. El rechazo significa que los datos de la muestra lo refutan.

Tipos de Prueba de Hipótesis. El tipo de prueba depende básicamente de la hipótesis alternativa H1 . Se denomina prueba de una cola a toda prueba de hipótesis donde la alternativa

H1 es unilateral. Si la alternativa es bilateral, la prueba se denomina prueba de dos colas. contra H :    , se denomina prueba 1 0  La prueba de hipótesis H 0 :   0 bilateral o de dos colas.

  0 contra H1 :   0 , se denomina prueba  La prueba de hipótesis H 0 : unilateral de cola a la derecha.   0 contra H1 :   0 , se denomina prueba  La prueba de hipótesis H 0 : unilateral de cola a la izquierda.

Tipos de Error: Definición.- Se denomina error tipo I, al error que se comete al rechazar una hipótesis nula

H 0 cuando esta es realmente verdadera

Definición.- Se denomina error tipo II, al error que se comete al aceptar una hipótesis nula

H 0 cuando en realidad es falsa.

H0

Decisión

H0

Verdadera

Falsa

A

D

Err

Aceptar

Decisión

Error

H0

correcta

ReR

Error tipo I

Rechazar

tipo II Decisión C

H0

Correcta

Definición.-Se denomina nivel de significación de una prueba de hipótesis a la probabilidad de cometer un error de tipo I.

REGIÓN CRÍTICA Y REGLA DE DECISIÓN La regla de decisión implica la división de la distribución muestral del estadístico  de la prueba en dos partes mutuamente excluyentes: la región de rechazo o región critica (R.C.) de H

0

y la región de

aceptación (R.A.) o no rechazo de H 0 . Esta división depende de la hipótesis alternativa H1 , del nivel de significación



y la distribución

muestral del estadístico.

Procedimientos a Seguir en las Pruebas de Hipótesis 1) Formular la hipótesis nula y la alternativa. 2) Seleccionar el nivel de significación. 3) Conocer o estimar la varianza. 4) Determinar la técnica y la prueba estadística. 5) Determinar los valores críticos y sus regiones de rechazo. 6) Calcular los datos muestrales, utilizando las formulas correspondientes. 7) Tomar las decisiones estadísticas.

107

UNIVERSIDAD PRIVADA TELESUP

Prueba de Hipótesis Acerca de la Media y Proporción

TEMA 4

Competencia: Identificar la prueba de hipótesis para la media y proporción.

108

UNIVERSIDAD PRIVADA TELESUP

Tema 04: Prueba de Hipótesis Acerca de la Media y Proporción PRUEBA DE HIPÓTESIS SOBRE LA MEDIA POBLACIONAL Caso A: Cuando la varianza poblacional es conocida. Deseamos contrastar la hipótesis de que el parámetro poblacional  un determinado valor  Conocemos que la población se distribuye normalmente y conocemos también su varianza, o bien si nos es desconocida, el tamaño muestral es lo suficientemente grande cómo para poder utilizar la muestral cómo poblacional. Hemos determinado un nivel de significación para la realización del contraste y vamos a plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.



Así: conocemos que x  N u,



que



 de lo que deducimos n 

x u  N[0,1] de forma que la hipótesis nula es:  n

H0: 0. El estadístico está dado por: Z 

x  u0 .  n

Ejemplo Nº 1 De 100 observaciones de una población normal se obtiene que x = 5 y que S=2. Contrastar con un nivel de significación del 5% la hipótesis de que la media de la población sea 7.

109

Aplicando el procedimiento para probar una hipótesis tenemos: 1. H0: =7 H1:    2. El nivel de significancia es del 5%. (=5%)

x  u0 3. Z 



n

4. Establecemos la región de aceptación y de rechazo:

5. Realizamos la prueba estadística: Z 

5  7  10 2 100

6. Dado que Z=-10 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa:   7.

Ejemplo Nº 2 Un empresario está considerando la posibilidad de ampliar su negocio mediante la adquisición de un pequeño bar. El dueño actual del bar afirma que el ingreso diario del establecimiento sigue una distribución normal de media 675 soles y una desviación estándar de 75 soles. Para comprobar si decía la verdad, tomó una muestra de treinta días y ésta reveló un ingreso diario promedio de 625 soles. Utilizando un nivel de significación del 10 %. ¿Hay evidencia de que el ingreso diario promedio sea menor del que afirma el presente dueño?

UNIVERSIDAD PRIVADA TELESUP

Aplicando el procedimiento para probar una hipótesis tenemos: 1. H0:   675  H1:  3. El nivel de significancia es del 10%. (=10%)

x  u0 4. Z 



n

5. Establecemos la región de aceptación y de rechazo:

6. Realizamos la prueba estadística: Z 

625  675  3.65 75 30

7. Dado que Z=-3.65 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa: 7.

Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequeña.

Deseamos contrastar la hipótesis de que el parámetro poblacional 



Desconocemos la varianza de la población y, dado que el tamaño muestral es pequeño, no podemos utilizar la muestral en su lugar.

Hemos determinado un nivel de significación para la realización del contraste y vamos a plantearlo en el supuesto de realizar una muestra aleatoria de tamaño n.

x   t n1 de forma que la hipótesis nula es: H0: 0. us n x  u0 El estadístico está dado por: t  . s n Así: conocemos que

Ejemplo Nro. 3 . Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71 metros con desviación típica de 0,02 .Contrastar la hipótesis de que la estatura media nacional sea de 1.75 metros si utilizamos un nivel del significación del 5%. Se supone normalidad. Aplicando el procedimiento para probar una hipótesis tenemos: 1. H0:  =1.75 H 1:    2. El nivel de significancia es del 5%. (=5%).

x  u0 3. t  s

n

4. Establecemos la región de aceptación y de rechazo: Utilizamos la tabla T.

UNIVERSIDAD PRIVADA TELESUP

5. Realizamos la prueba estadística: t 

1.71  1.75 0.02

 8.25 17

6. Dado que t=-8.25 y no pertenece a la región de aceptación estamos en condiciones de rechazar la hipótesis nula, luego aceptar la alternativa: .

PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL: p Se trata de efectuar una prueba de hipótesis acerca de la proporción

de

elementos con cierto atributo en una población, hipótesis de la forma: H0: p=p0.

H1: p>p0.

H1: p  p0.

H0: p  p0.

H0: p  p0. H1: p