Estadística Descriptiva.docx

ESTADÍSTICA DESCRIPTIVA Frecuencia Relativa y Relativa Acumulada Los datos o mediciones en un experimento: primero se or

Views 90 Downloads 4 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADÍSTICA DESCRIPTIVA Frecuencia Relativa y Relativa Acumulada Los datos o mediciones en un experimento: primero se organizan de tal manera que se pueda observar la frecuencia con que se repite cada uno de los posibles resultados del experimento; segundo, se observa si tienden a agruparse alrededor de algún valor y tercero, que tanto se dispersan alrededor del valor central La frecuencia absoluta o frecuencia es simplemente el número de veces que se repite el valor de cada dato. Si dividimos el número de veces que se repite el valor de un dato entre el número total de datos se tiene la frecuencia relativa, (relativa al total de datos). La frecuencia relativa siempre será un número entre cero y uno y se relaciona con el concepto de probabilidad. Distinguimos dos casos para representar la frecuencia: valores discretos o datos enteros y valores o datos continuos. En cualquier caso el concepto de frecuencia absoluta y relativa es el mismo.

Valores discretos. En la siguiente tabla 1 se muestran los resultados de un estudio de calidad de un servicio:

Frecuencia

Frecuencia

Absoluta

Relativa

Muy Bueno

24

24/92 = 0.2609

26.09

Bueno

38

38/92 = 0.413

41.3

Regular

16

0.1739

17.39

Malo

9

0.0978

9.78

Muy Malo

5

0.0543

5.43

TOTAL

92

1

100

Porcentaje

Observe que la frecuencia relativa se obtiene dividiendo el valor de la frecuencia absoluta para cada categoría entre el total de mediciones, en este caso entre 92. El porcentaje es, simplemente, la frecuencia relativa multiplicada por 100

~ 1~

La frecuencia relativa acumulada se refiere a la suma de frecuencias relativas en diferentes intervalos de los resultados posibles. En general se habla de “al menos” (cota inferior), “cuando mucho” (cota superior) o “entre”, suma de frecuencias entre dos valores. Ejemplo: De acuerdo a la tabla 1 anterior: a)

La frecuencia relativa de “al menos bueno” es la suma de las frecuencias relativas de muy bueno y bueno, 0.2609 + 0.413 = 0.6739.

b) La frecuencia relativa de “cuando mucho regular” es la suma de las frecuencias relativas de muy malo, malo y regular, 0.1739 + 0.0978 + 0.0543 = 0.3261.

Ejemplo: Se ha lanzado una moneda con cara (c) y escudo (x) y se han obtenido los siguientes resultados: c, c, c, x, c, x, x, x, c, x, c, x, c, c, x. Efectúa el recuento y forma la tabla estadística de las frecuencias absolutas y relativas. Solución: Lado de la moneda

Recuento

Frecuencia absoluta

Frecuencia relativa

C

//// ///

8

8 15

X

//// //

7

7 15

15

1

~ 2~

Ejemplo: Ruth y Esther han lanzado un dado varias veces cada una. Elabora la tabla de frecuencias absolutas y relativas de cada una. ¿Quién ha sacado más veces el número 3? Razona tu respuesta. Ruth Esther Solución: Ruth

Frecuencia

Frecuencia relativa

absoluta 1

3

3/12

2

1

1/12

3

4

4/12

4

1

1/12

5

2

2/12

6

1

1/12

Total Esther

12 Frecuencia

Frecuencia relativa

absoluta 1

1

1/14

2

2

2/14

3

5

5/14

4

1

1/14

5

4

4/14

6

1

1/14

Total

14

- Esther ha sacado más veces el nº. 3, pero también ha efectuado más lanzamientos. Comparamos sus frecuencias relativas:

4 5  , por lo que Ruth tiene mejor proporción entre el nº. de lanzamientos y el nº. de "treses". 12 14

~ 3~

Ejemplo: Se ha hecho una encuesta sobre la materia preferido en la carrera de ingeniería por los alumnos de una clase, y se ha obtenido la siguiente tabla: Tipo

Nº de alumnos

Algebra

22

Calculo

8

Trigonometría

6

a) Forma la tabla estadística de las frecuencias absolutas y relativas. b) Representa los datos en un diagrama de barras.

Solución: a) Tipo

Frecuencia absoluta Frecuencia relativa

Algebra

22

22 36

Calculo

8

8 36

Trigonometría 6

6 36

36

Algebra 25 Calculo 20 Trigonometria 15

1

22 8 6

Series1

10

5 0

Algebra

Calculo

Trigonometria

~ 4~

Ejemplo: Se ha hecho una encuesta sobre el tipo de vacaciones preferidas por los alumnos de una clase y se ha obtenido: Tipo Nº de alumnos

a) b)

Playa

20

Montaña

8

Viaje cultural

4

Forma la tabla estadística con frecuencias absolutas y relativas. Representa la situación en un diagrama de sectores.

Solución: a) Tipo

Frecuencia absoluta

Frecuencia relativa

Playa

20

20 32

Montaña

8

8 32

Viaje cultural

4

4 32

32

1

b)

Viaje cultural 13%

Montaña 25%

Playa 62%

~ 5~

Ejemplo: En un día de feria han hecho un estudio sobre el tipo de refrescos vendidos en un día y se ha obtenido: Tipo Nº de botes vendidos Fanta

150

Sprite

200

Coca Cola

400

Otros

50

a) Forma la tabla estadística b) Representa la situación en un diagrama de sectores. Solución: a) Tipo

Frecuencia absoluta

Frecuencia relativa

Fanta

150

150 800

Sprite

200

200 800

Coca Cola

400

400 800

Otros

50

50 800

800

1

b)

Frecuencia absoluta

25 Otros 6%

20

Fanta 19%

15

10 Coca Cola 50% 5

Sprite 25%

0 15

16

~ 6~

17 Edad

18

19

Valores continuos La tabla 2 representa la variación en la temperatura de un horno industrial

Temperatura en un

Frecuencia relativa

horno (°C) 500 – 525

0.08

525.5 - 550

0.14

550.5 - 575

0.32

575.5 - 600

0.26

600.5 - 625

0.2

De acuerdo a la tabla 2 anterior: a) El porcentaje de valores de “al menos 575.5 °C”, es: Observe que la tabla reporta la frecuencia relativa y al menos es el límite inferior, por lo que se deben sumar las frecuencias relativas del cuarto y quinto intervalo. 0.26 + 0.2 = 0.28. Como se pide porcentaje, multiplicamos por 100 y la respuesta es 28 % b) La frecuencia relativa acumulada de “cuando mucho 550°C”, es: Cuando mucho, es cota superior por lo que se suman las frecuencias relativas del primero y segundo intervalo 0.08 + 0.14 = 0.22

~ 7~

MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son medidas de posición que tratan de establecer un valor que pueda considerarse el centro de los datos en algún sentido.

La media.El promedio aritmético de un conjunto de valores ()es: n

x x=

i 1

i

n

Esta medida es la más común dentro de las de tendencia central y corresponde al centro de gravedad de los datos. Ejemplo: El promedio de una muestra de observaciones de ciertos análisis de aguas, cuyos valores son 8, 3, 5, 12, 10, es:

8  3  5  12  10 5 38 x =  7.6 5 x=

La mediana.Sea un conjunto de datos de una variable cuantitativa, . Ordenemos la muestra de menor a mayor, (1)(). La mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. El cálculo de la mediana dependerá de si el número de datos, , es par o impar: Si es impar, la mediana es el valor que ocupa la posición +1/2 una vez que los datos han sido ordenados

 n 1    2 

(en orden creciente o decreciente), porque éste es el valor central. Es decir: M e  x  Si 



datos que están en el centro de la muestra ocupan las posiciones:

xn xn  ( ) ( 1) n n  2 y  1 es decir: M e   2   2 2 2     La mediana corresponde exactamente con la idea de valor central de los datos. De hecho, puede ser un valor más representativo de éstos que la media, ya que es más robusta que la media.

~ 8~

Ejemplo. Consideremos los datos siguientes: 0 0 1 2 3 4 5 Su media es 0+0+1+2+3+4+5/7 = 21429, y su mediana 2. Pero imaginemos que por error o por casualidad obtenemos un nuevo dato enormemente grande en relación al resto de datos, 80. En ese caso, la media sería 0 + 0 + 1 + 2 + 3 + 4 + 5 + 80/8= 11.875 y la mediana 2.5. Es decir, un solo dato puede desplazar enormemente la media, hasta convertirla en una medida poco representativa, pero sólo desplazará ligeramente la mediana. Ese es el motivo por el que se dice que la mediana es una medida robusta.

La moda.En principio la moda se define como el valor más frecuente de los datos. Lo que ocurre es que si éstos son datos de una variable continua o discreta con muchos valores, puede que los datos apenas se repitan. En ese caso, en el que, como vimos en las representaciones gráficas, se debe agrupar por intervalos, no debe darse un valor como moda, sino un intervalo modal, aquél con mayor frecuencia asociada.

Ejemplo: Sean los siguientes datos: 22, 21, 26, 24, 22, 25, 26, 23, 27, 29. Determine la moda, mediana y media.

a)

Tiene dos modas, el número 22 y el 26

b) Mediana. Ordenamos los datos: 21, 22, 22, 23, 24, 25, 26, 26, 27, 29. Los valores de los datos que se encuentran a la mitad son el 24 y el 25, la mediana es (24 + 25)/2 = 24.5 c)

La media o promedio es:

10

x

x i 1

10

i



21  22  22  23  24  25  26  26  27  29 223   22.3 10 10

~ 9~

Ejemplo: Este es el tiempo corre cada día una chica, para estar en forma: Lunes = 23 minutos

Jueves = 21 minutos

Martes = 19 minutos

Viernes = 22 minutos

Miércoles = 24 minutos

Sábado = 23 minutos

Calcula el tiempo medio que corre cada semana. Solución: 23 + 19 + 24 + 21 + 22 + 23 = 132

132  22 6 El tiempo medio es de 22 minutos. Ejemplo: Calcula la media y la moda de los siguientes valores: a) 4, 15, 8, 3,14 b) 2, 2, 3, 5, 5, 8, 9, 9, 9, 12 Solución: a)

Se ordenan los datos: Media =

3, 4, 8, 14, 15

3  4  8  14  15 =8,8 5

Moda no tiene b) Ya están ordenados los datos: Media =

2, 2, 3, 5, 5, 8, 9, 9, 9, 12

2  2  3  5  5  8  9  9  9  12 =6,4 10

Moda = 9

Ejemplo: Calcula la media y la moda de los siguientes valores: 4,4, 6, 5, 8, 5, 8, 11, 3, 8, 6, 8, 3, 5, 2 Solución: Se ordenan los datos: 2, 3, 3, 4, 4, 5, 5, 5, 6, 6, 8, 8, 8, 8, 11 Media =

2  2  3  2  4  3  5  2  6  4  8  11 86  =5,7 15 15

Moda =8 Ejemplo: Calcula la media y la moda de los siguientes valores:

~ 10 ~

6, 2, 9, 5, 5, 8, 9, 7, 9, 8, 1, 7, 2, 9, 10, 11

Solución: Se ordenan los datos: Media =

1, 2, 2, 5, 5, 6, 7, 7, 8, 8, 9, 9, 9, 9, 10, 11

1  2  2  2  5  6  2  7  2  8  4  9  10  11 108  =6,75 16 16

Moda = 9

Ejemplo: Se ha lanzado un dado con las caras numeradas del 1 al 6 y se han obtenido los siguientes resultados: 3, 3, 4, 3, 4, 3, 2, 5, 6, 4, 2, 2, 1, 5, 1, 6, 3, 3, 6, 4, 1, 5, 2, 4, 5 a) Haz el recuento y la tabla de las frecuencias absolutas. b) Calcula la media y la moda. Solución: a) Puntuación

Recuento

Frecuencia absoluta

Frecuencia absoluta acumulada

Puntuación x Frecuencia absoluta

1

///

3

3

3

2

////

4

7

8

3

//// /

6

13

18

4

////

5

18

20

5

////

4

22

20

6

///

3

25

18

25

b) Media =

87

87 = 3,48 25

Moda = 3

Medidas de Dispersión

~ 11 ~

Las medidas de dispersión son: 

Varianza, promedio de las desviaciones respecto del valor central;



Desviación estándar, raíz cuadrada de la varianza, tiene la ventaja de tener las mismas unidades de la variable;

 x  x 

2

La desviación estándar de una muestra se calcula como:



s

n 1

Rango. Diferencia entre los valores extremos de los datos

Ejemplo: Determine la varianza, la desviación estándar y el rango para los datos: 22, 21, 26, 24, 22, 25, 26, 23, 27, 29. Varianza: 10

x

x i 1

10

i



21  22  22  23  24  25  26  26  27  29 223   22.3 10 10

 x  x 

2

s

2

n 1

s2 

a)



(21  22.3) 2  (22  22.3) 2  (22  22.3) 2    (27  22.3) 2  (29  22.3) 2 10  1

1.69  0.09  0.49  2.89    22.09  44.89 106.81   11.87 9 9

Desviación estándar:

s  s 2  11 .87  3.45

b) Rango, diferencia entre los valores extremos. El rango para los datos anteriores es: 29 – 21 = 8

~ 12 ~

PROBABILIDADES Enfoques conceptuales En el desarrollo de las probabilidades se presentan 3 enfoques para definir la probabilidad y determinar los valores:

1.- El enfoque Clásico: Se basa en la suposición de que cada resultado sea igualmente posible se le determina “Enfoque a priori”, porque permite calcular el valor de la probabilidad antes de observar cualquier evento de la muestra. Si hay h posibilidades xxx favorables a la ocurrencia de un evento A y n posibilidades de resultados desfavorables a la ocurrencia de A y todos los resultados son igualmente posibles y mutuamente excluyentes (no pueden ocurrir al mismo tiempo), entonces la probabilidad de que ocurra A, viene dado por:

P  A 

h hn

Ejemplo: Si tenemos una caja con 15 bolas rojas y 10 blancas. La probabilidad de sacar una bola blanca en un evento es:

P  A 

h 10 10    0.40  40 % hn 10  15 25

2.- Enfoque de frecuencia relativa Denominado también “Enfoque Empírico”, se basa en determinar la probabilidad sobre la perspectiva de la proporción de veces que ocurre un evento favorable en un numero favorable de observaciones y en la recopilación de datos.

Ejemplo: Se ha observado que 12 de cada 50 conductores de Nohas que pasan por una determinada vía no llevan puesto el casco; si un guardia de Transito se para en la vía ¿Cuál es la posibilidad de que detenga a un para hacerle un parte por esta infracción de no llevar puesto el cinturón de seguridad?.

P  A 

h 12   0.24  24 % hn 50

3.- El enfoque subjetivo

~ 13 ~

Establece la probabilidad de ocurrencia de un evento, es el grado de creencia por parte de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta premisa se puede decir, que el evento ocurrirá o no ocurrirá esta sola vez. El valor de probabilidad bajo este enfoque es un juicio personal.

Concepto de probabilidad Se define como cálculo de probabilidad al conjunto de reglas que permiten determinar si un fenómeno ha de producirse fundado en la suposición en el cálculo, las estadísticas y la teoría.

El valor de la probabilidad El valor más pequeño que puede tener la probabilidad de ocurrencia de un evento, es igual a “0”, el cual indica que el evento es imposible y el valor mayor es “1”, que indica que el evento ocurrirá con certeza. Ahora, si P(A) es la probabilidad de ocurrencia de un evento A y P(A´) la probabilidad de no ocurrencia de A, se tiene que:

0 P ( A)  1 P A  P( A´)  1

Sucesos mutuamente excluyentes Se dice que dos o más sucesos son mutuamente excluyentes cuando solamente la ocurrencia de uno de ellos se puede dar en un solo ensayo. Supongamos la posibilidad de n sucesos mutuamente excluyente con probabilidades respectivas de P 1, P2, P3, P4, … , Pn, por lo tanto, la probabilidad de que estos sucesos se presenten en un solo ensayo viene dado por:

P  P1  P2  P3  ...  Pn Ejemplo: ¿Cuál es la probabilidad de obtener un AS o una reina, sacando una sola carta en un baraja de 40 cartas?

P A  

4 1  40 10

P AO R   PA  PR  a.

P R  

4 1  40 10

1 1 2 1    10 10 10 5

La probabilidad de obtener un UNO o un TRES en el lanzamiento de un dado

PU  

1 6

PT  

PU O T   PU  PT 

1 6

1 1 2 1    6 6 6 3 ~ 14 ~

Ejemplo: Queremos sacar una bola blanca. Escribe el cartel que corresponde a cada una de estas bolsas:

Solución:

Ejemplo: Se lanza un dado con las caras numeradas del 1 al 6. Halla la probabilidad de obtener: a) Un 4. b) Un número par. c) Un número múltiplo de 3. Solución:

a)

p (4) =

1 6

b) p (número par) =

3 1  6 2

c) p (múltiplo de 3) =

2 1  6 3

Ejemplo: Una urna contiene 5 bolas blancas, 8 verdes y 7 rojas. Se extrae una bola al azar; halla la probabilidad de que: a) Sea roja.

~ 15 ~

b) Sea verde. c) Sea blanca. Solución:

a) p (roja) =

5 1 7 8  b) p (verde) = c) p (blanca) = 20 20 20 4

Ejemplo: Calcula qué es mayor: a) b)

La probabilidad de obtener cara en el lanzamiento de una moneda La probabilidad de obtener múltiplo de 3 en el lanzamiento de un dado con las caras numeradas del 1 al 6.

Solución: a) p(cara) =

1 2  0,5 b) p(múltiplo de 3) =  0,3333.... 2 6

Es mayor la probabilidad de obtener cara al lanzar una moneda

~ 16 ~

Sucesos Compatibles Dos sucesos son compatibles cuando la posibilidad de ocurrencia de uno no impide la ocurrencia del otro. La probabilidad de uno de los eventos se calcula mediante la fórmula:

P AUB   P( A )  P( C )  P A B  En Teoría de Conjuntos se puede ilustrar en Diagrama de Venn de la siguiente forma:

Ejemplo: 1.

Se extrae una carta de una baraja de 40 cartas. Hallar la probabilidad de la carta extraída sea AS o una carta numeral trebol.

P A  

4 40

P B  

10 40

P A B  

1 40

P AUB   P( A)  P( B )  P A B   2.

4 40



10 40

1 40





13  0.325  32.50% 40

Al lanzar un dado, usted apuesta $us 5.000 a que el numero obtenido debe ser par o divisible por 3. ¿Cuál es la probabilidad de que usted gane la apuesta?

A   2, 4, 6 P A  

3 1  6 2

B P B  

 3, 6

2 1  6 3

~ 17 ~

A  B   6 P A B  

1 6

P AUB  P( A)  P( B )  P A B  

3 6



2 6



1 6



4 2   0.6667  66.67% 6 3

Sucesos Independientes Se dice que dos sucesos son independientes cuando la probabilidad de ocurrencia de una no afecta la probabilidad de ocurrencia de los otros, por lo tanto, se debe efectuar la multiplicación de la probabilidad de cada suceso.

P  P1 x P2 x P3 x... x Pn

Ley de la multiplicación

Ejemplos: 1.

¿Cuál es la probabilidad de sacar dos caballos, tomando una carta de una baraja y la otra de una segunda baraja?

PC  

P  P1 x P2  2.

4 40

4 4 16 1 x   40 40 1600 100

Al lanzar dos dados, ¿Cuál es la probabilidad de sacar decenas.

1 (Sacar un seis en el primer dado) 6 1 (Sacar un seis en el segundo dado) P2  6 P1 

P  P1 x P2 

1 1 1 x  6 6 36

~ 18 ~

SUCESOS COMPATIBLES

SUCESOS INDEPENDIENTES



Se cuenta con un solo dado o baraja.



Se cuenta con más de dos dados o barajas.



Se extrae una carta y se observa una sola cara.



Se espera la ocurrencia de más de dos sucesos.



En la redacción se utiliza la disyunción “O”



En la redacción se utiliza la conjunción “Y”.

P AUB   P( A)  P( C )  P A B 

P  P1 x P2 x P3 x... x Pn

~ 19 ~

Probabilidad y Estadística MIN 105 Variables Aleatorias y Distribuciones de Probabilidad

Introducción.Para introducir el concepto de variable aleatoria, veamos primero algunos ejemplos, al arrojar dos dados, sabemos que la suma X de los puntos que caen hacia arriba debe ser un número entero entre 2 y 12, pero no podemos predecir que valor de X aparecerá en el siguiente ensayo, por lo que decimos que X depende del azar, por lo tanto es una variable aleatoria que toma valores entre 2 y 12. El tiempo de vida de un foco que se extrae aleatoriamente de un lote de focos depende también del azar, este constituye otro ejemplo de una variable aleatoria que varía entre el tiempo 0 y un valor indeterminado, ya que no sabemos exactamente cuánto tiempo va durar. El número de varones de una familia con 5 hijos también es una variable aleatoria que varía de 0 a 5, ya que en una familia de cinco hijos puede que no haya ningún varón, uno, dos, tres, cuatro o cinco varones. Si las observaciones no se dan en términos numéricos, podemos asignarles números y reducir las observaciones cualitativas al caso cuantitativo; así tenemos que la función que asigna valores numéricos a cada uno de los elementos del espacio muestra con una probabilidad definida, se denomina "variable aleatoria". Por ejemplo, si se lanza una moneda 3 veces, el número de escudos X es una variable aleatoria que toma los valores 0, 1, 2, ó 3; es decir puede que ninguna vez, una sola, dos o tres veces salga escudo como resultado; la probabilidad de que (dos escudos) es 3/8 ya que el espacio muestral S={eee, eec ,ece, ecc, cec, cce, cee, ccc}. Y de estos ocho resultados hay tres en los cuales hay dos escudos. Con esto podemos ver que el espacio muestral es el dominio de la función y el conjunto de valores que la variable puede tomar es el rango o recorrido de la función, que es un subconjunto de los reales

.

Fig. Variable aleatoria Si el conjunto de valores de X es un conjunto finito o infinito numerable, es decir, si se pueden enlistar o enumerar, se dice que la variable aleatoria es discreta, y si el conjunto de valores de X es no numerable, la variable aleatoria se llama variable aleatoria continua. Son ejemplos de variables aleatorias continuas: la estatura, el peso, la edad, el volumen, el pH, etc. Algunos ejemplos de variables discretas aleatorias son: el número de alumnos que asisten diariamente durante un semestre, el número de accidentes automovilísticos en una ciudad por día, el número de piezas defectuosas por lote, el número de alumnos aprobados por grupo en un examen, etc.

~ 20 ~

Probabilidad y Estadística MIN 105 Definición.Una variable aleatoria X es una función cuyo dominio es el espacio muestral S y cuyo rango es un subconjunto de los números reales probabilidad.

que tiene asociada a su conjunto de valores una función de

Matemáticamente, decimos: Dado un espacio de probabilidad (  ,  ,Pr), una variable aleatoria es cualquier función, X,

X :  w  X ( w) que asocia a cada suceso elemental un número real, verificando que

PrX (B)  Pr[ X  B]  Pr w  / X (w)  B B  El conjunto

  S es el espacio muestral y  es la colección de todos los subconjuntos de  .

Identificación de una variable aleatoria discreta X: es preciso conocer el conjunto de los posibles resultados de X: {x1, x2, …,xk, …}, donde los xi no necesariamente son todos enteros, pero si se pueden contar o numerar. El conjunto de las probabilidades siguientes: p1 = P(X = x1) p2 = P(X = x2) ... Pk = P(X = xk)

...

Propiedades importantes de la función de probabilidad: a) pi ≥0 para todo i b) ∑pi = 1 para todo i La representación gráfica de la función de probabilidad de una variable aleatoria discreta es análoga al diagrama de barras de frecuencias relativas de una variable estadística discreta. La función de distribución de una variable aleatoria discreta X es:

FX (t )  P( X  t )   Pr( xi ) para todo t  xi t

La representación gráfica de la función de distribución de una variable aleatoria discreta es análoga al gráfico de frecuencias relativas acumuladas de una variable estadística discreta.

~ 21 ~

Probabilidad y Estadística MIN 105 La media de una variable aleatoria discreta X es:

µ = E(X) = ∑xi pi , para todo i. La varianza de una variable aleatoria discreta X es: σ2= Var(X) = ∑(xi-µ)2pi,

para todo i

La desviación típica de una variable aleatoria discreta X es: σ = (Var(X))1/2 Ejemplo. Supongamos que la Secretaría del Medio Ambiente inspecciona una vez al mes la cantidad de un contaminante que descarga una compañía de productos químicos. Si la cantidad del contaminante excede el nivel máximo permitido, se multa a la compañía y se le obliga a corregir el problema. Consideremos las siguientes dos variables aleatorias asociadas a este problema: Primero digamos que X es el número de meses antes de que la compañía excede los límites permitidos del contaminante. Esta variable toma valores 1, 2, 3, … pero no conocemos donde termina, ya que quizás nunca exceda estos límites permitidos, por lo tanto, el conjunto de valores de X es el conjunto de los números enteros positivos. Como podemos enlistar o numerar el conjunto (es un conjunto numerable) de valores de la variable X, decimos que la variable aleatoria X es una variable aleatoria discreta.

Ejemplo. Supongamos que nos interesamos por el número de varones X en el experimento de observar al azar dos niños recién nacidos (Sea H = hombre y M = mujer). Entonces, el espacio muestra, los valores de la variable aleatoria X que cuenta el número de varones y su función de probabilidad se dan en la siguiente tabla:

S

Valores de X: xi

MM

0

MH , HM

1

HH

2

~ 22 ~

Probabilidad y Estadística MIN 105 Ejemplo. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores al lanzar dos dados, Determine el espacio muestral, el conjunto de valores de X y las probabilidades respectivas. Solución: El espacio muestral S es el conjunto de los 36 pares ordenados que se indican a continuación:

Este conjunto se puede visualizar como el conjunto de puntos del plano cartesiano que se muestra a continuación

Fig. Diagrama del Espacio Muestral del lanzamiento de dos dados La variable aleatoria es la suma de los elementos de cada par, por lo tanto, toma los valores del 2 al 12, y las probabilidades para cada uno de los valores de la variable se indican en la siguiente tabla: S

Valores de X : xi

(1,1)

2

(1,2) (2,1)

3

(1,3) (3,1) (2,2)

4

(1,4) (4,1) (2,3) (3,2)

5

(1,5) (5,1) (2,4) (4,2) (3,3)

6

(1,6) (6,1) (2,5) (5,2) (3,4) (4,3)

7

(2,6) (6,2) (3,5) (5,3) (4,4)

8

(3,6) (6,3) (4,5) (5,4)

9

~ 23 ~

Probabilidad y Estadística MIN 105 (4,6) (6,4) (5,5)

10

(5,6) (6,5)

11

(6,6)

12

Total:

La gráfica de líneas para este ejemplo es:

Fig. Gráfico de probabilidad

Distribución de probabilidad binomial La distribución binomial es típica de las variables que proceden de un experimento que cumple las siguientes condiciones:

1)

El experimento está compuesto de n pruebas iguales, siendo n un número natural fijo.

2)

Cada prueba resulta en un suceso que cumple las propiedades de la variable binómica o de Bernouilli, es decir, sólo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como éxito y fracaso.

3)

La probabilidad del éxito (o del fracaso) es constante en todas las pruebas. P(éxito) = p ; P(fracaso) = 1 p=q

4)

Las pruebas son estadísticamente independientes.

~ 24 ~

Probabilidad y Estadística MIN 105 En estas condiciones, la variable aleatoria X que cuenta el número de éxitos en las n pruebas se llama variable binomial. Evidentemente, el espacio muestral está compuesto por los números enteros del 0 al n. Se suele decir que una variable binómica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento. La función de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el número de pruebas y p la probabilidad del éxito, n y p son los parámetros de la distribución. La función de probabilidad de una variable Binomial es:

La media y la varianza de la variable binomial se calculan como: Media = μ = n p Varianza = σ2 = n p q Gráficamente el aspecto de la distribución depende de n y de p. Por ejemplo, si p=0.5 y n cualquiera es simétrica; si p n es 0.5, la binomial no es simétrica. El siguiente gráfico lo ilustra para n=4. ASPECTO DE LA BINOMIAL PARA n=4 Y p=0.5 Y p=0.25.

Fig. Gráficos de probabilidad binomial.

Ejemplo. Se sabe que el 5% de los libros que se prestan en una biblioteca se devuelven con retraso. Se realiza el experimento que consiste en observar si la devolución de 5 libros se hacen con retraso o no. a) Determinar la función de probabilidad y hacer su representación gráfica. b) Calcular la función de distribución y hacer su representación gráfica. c) Hallar la media y la varianza.

~ 25 ~

Probabilidad y Estadística MIN 105 Solución: X= Variable aleatoria = Número de devoluciones con retrazo. X=0,1,2,3,4,5. a) El Modelo o función de probabilidad es

5  b( x, n  5, p  0.05)    0.04 x (1  0.05)5 x , x  0,1, 2,3, 4,5  x 0, t  0 0.7738, 0  t  1  0.9774, 1  t  2  b) FX (t )  0.9988, 2  t  3 1 , 3t 4  , 4t5 1 1 , t5 

Gráfico de la función de distribución

Fig. Gráfico de la Función de distribución

c)

  E[ X ]  np  5(0.05)  0.25  2  V [ X ]  npq  5(0.05)(0.95)  0.2375

~ 26 ~