Practica 6

UNIVERSIDAD NACIONAL DE TRUJILLO Facultad de Ingeniería Escuela Profesional de Ingeniería Mecánica TEMA: Distribución D

Views 371 Downloads 4 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL DE TRUJILLO Facultad de Ingeniería Escuela Profesional de Ingeniería Mecánica

TEMA: Distribución De Probabilidad Continua

Estadística Aplicada a la Ingeniería Mecánica AUTORES

:

Saavedra Valle, José Sánchez Olivares, César Josseph Gutierrez Villanueva, Claudio Armando Cruzado Muños, Cristhian Jair Leyva Bartolo, Miguel Nícolas Ibañez Velasquez Julio Enrique Rafael Tiglia, Joseph Jhanner

DOCENTE

:

Ing. RODRIGUEZ OCHOA, Jairo Javier

CICLO

:

III

Trujillo, Perú 2019

I.

INTRODUCCIÓN: Toda distribución de probabilidad es generada por una variable aleatoria x, la que puede ser de dos tipos: Variable aleatoria discreta (x): Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque el valor tomado es totalmente al azar y discreta porque solo puede tomar valores enteros y un número finito de ellos. Ejemplos: •

Variable que nos define el número de burbujas por envase de vidrio que son generadas en un proceso dado: 0, 1, 2, 3, 4, 5, etc, etc. burbujas por envase



Variable que nos define el número de productos defectuosos en un lote de 25 productos.: 0, 1, 2, 3,....,25 productos defectuosos en el lote



Variable que nos define el número de alumnos aprobados en la materia de probabilidad en un grupo de 40 alumnos: 0, 1, 2, 3, 4, 5,....,40 alumnos aprobados en probabilidad

Con los ejemplos anteriores nos damos cuenta claramente que los valores de la variable x siempre serán enteros, nunca fraccionarios.

Variable aleatoria continua (x). Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque los valores que toma son totalmente al azar y continua porque puede tomar tanto valores enteros como fraccionarios y un número infinito de ellos. Ejemplos: •

Variable que nos define el diámetro de un engrane en pulgadas: 5.0”, 4.99, 4.98, 5.0, 5.01, 5.0, 4.96



Variable que nos define la longitud de un cable o circuito utilizado en un arnés de auto: 20.5 cm, 20.1, 20.0, 19.8, 20,6, 20.0, 20.0



Variable que nos define la concentración en gramos de plata de algunas muestras de mineral: 14.8gramos, 12.0, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8

Como se observa en los ejemplos anteriores, una variable continua puede tomar cualquier valor, entero o fraccionario, una forma de distinguir cuando se trata de una variable continua es que esta variable nos permite medirla o evaluarla, mientras que una variable discreta no es medible, es una variable de tipo atributo, cuando se inspecciona un producto este puede ser defectuoso o no, blanco o negro, cumple con las especificaciones o no cumple, etc.

OTROS TIPOS DE DISTRIBUCIONES: DISTRIBUCIÓN BETA: En estadística la distribución beta es una distribución de probabilidad continua con dos parámetros 𝛽 y 𝛼 cuya función de densidad para valores 0 < 𝑥 < 1 es:

Aquí 𝑇 es la función gamma. El valor esperado y la varianza de una variable aleatoria X con distribución beta son:

Un caso especial de la distribución beta es cuando 𝛽 = 1 y 𝛼 = 1 que coincide con la distribución uniforme en el intervalo [0, 1].

DISTRIBUCIÓN EXPONENCIAL: En estadística la distribución exponencial es una distribución de probabilidad continua con un parámetro λ > 0 cuya función de densidad es:

Su función de distribución acumulada es:

Donde 𝑒 representa el número e. De forma adicional esta distribución presenta una función adicional que es función Supervivencia (S), que representa el complemento de Función de distribución.

El valor esperado y la varianza de una variable aleatoria X con distribución exponencial son:

La distribución exponencial es un caso particular de distribución gamma con k = 1. Además, la suma de variables aleatorias que siguen una misma distribución exponencial es una variable aleatoria expresable en términos de la distribución gamma.

DISTRIBUCIÓN F: Usada en teoría de probabilidad y estadística, la distribución F es una distribución de probabilidad continua. También se le conoce como distribución F de Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor (por Ronald Fisher). Una variable aleatoria de distribución F se construye como el siguiente cociente:

Donde:  U1 y U2 siguen

una distribución

chi-cuadrado con d1 y d2 grados

de

libertad

respectivamente, y  U1 y U2 son estadísticamente independientes. La distribución F aparece frecuentemente como la distribución nula de una prueba estadística, especialmente en el análisis de varianza. Véase el test F. La función de densidad de una F(d1, d2) viene dada por:

para todo número real x ≥ 0, donde d1 y d2 son enteros positivos, y B es la función beta. La función de distribución es:

donde I es la función beta incompleta regularizada.

DISTRIBUCIÓN GAMMA: En estadística la distribución gamma es una distribución de probabilidad continua con dos parámetros 𝐾 y λ cuya función de densidad para valores 𝑥 > 0 es:

Aquí 𝑒 es el número e y 𝑇 es la función gamma. Para valores 𝑘 ∈ 𝑁 la función gamma es: 𝑇(𝑘) = (1 − 𝑘)! (el factorial de 𝑘 − 1). En este caso - por ejemplo para describir un proceso 1

de Poisson - se llaman la distribución Erlang con un parámetro 𝜃 = λ .

El valor esperado y la varianza de una variable aleatoria X de distribución gamma son:

DISTRIBUCIÓN 𝑋 2 : En estadística,

la distribución

de

Pearson,

llamada

también ji

cuadrada(o) o chi

cuadrado(a) (χ²), es una distribución de probabilidad continua con un parámetro 𝐾 que representa los grados de libertad de la variable aleatoria:

Donde

𝑍𝑖

son

variables

aleatorias normales independientes de media “cero”

y varianza “uno”. El que la variable aleatoria 𝑋 tenga esta distribución se representa habitualmente así: 𝑋 ~𝑋 2 𝑘. DISTRIBUCIÓN T DE STUDENT: En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeña. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas muestrales y para la construcción del intervalo de confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta debe ser estimada a partir de los datos de una muestra. Fue desarrollada por William Sealy Gosset, bajo el seudónimo Student.

II.

DESARROLLO DE LA PRÁCTICA: Para esta parte se tomará como modelo el desarrollo del ejercicio 6, también resuelto en la parte de Evaluación: La empresa PHIPLIPS instala en una ciudad 20 000 focos para su iluminación. La duración de una distribución normal con media de 300 días y desviación típica de 35 días. Calcular: ¿Cuántas duraran más de 350 días? 6.1.Del problema se pueden extraer los siguientes datos: 

Desviación Estándar (σ): 35

 Media (µ): 300  X: 350 6.2.Primero desarrollaremos el cálculo de z manualmente:

𝑧=

𝑥 − 𝑢 350 − 300 = = 1.428571428571429 σ 35

6.3.Luego realizaremos el cálculo del área con el software Excel y haremos una gráfica con Geogebra: 6.3.1. Cálculo del área en Excel: A. Ordenamos los datos del en Excel a través de una tabla

B. Para hallar el área usaremos la fórmula estadística de Excel: “DISTR.NORM. N” dicha ecuación se puede localizar de la siguiente manera:

Ubicamos en la barra de herramientas la parte que dice Fórmulas y luego seleccionamos “Estadísticas”

 Finalmente seleccionamos lo solicitado

Seleccionamos la función estadística “DISTR.NORM. N”

C. Al dar clic en la pantalla saldrá una tabla en la que llenaremos los valores ordenados en el punto (A). Hay que resaltar que se seleccionan las casillas, no los valores. En la parte de acumulado pondremos (Verdadero):

D. El valor del área obtenido es:

 Sin embargo, esta respuesta es incorrecta, ya que se nos pide que el área sea una porción mayor a 350, con lo que implica que no es el total, sino una parte. Así que se restará esta cantidad a 1:

 Con lo que la respuesta obtenida es:

E. Realizaremos el cálculo de esta función también en el programa Geogebra, para poder verificar nuestra respuesta.  Datos introducidos al software y respuesta:

 Gráfica obtenida:

III.

EVALUACIÓN 3.1.DESARROLLO DE EJERCICIOS EJERCICIO 1: Los ingresos de los ingenieros en una empresa están distribuidos normalmente con una desviación estándar de S/. 1 200. Se piensa hacer un recorte de personal, por lo que los empleados que ganan menos de S/. 28 000 serán despedidos. Si el despido

representa al 10% de tales ingenieros. ¿Cuál es el salario medio actual del grupo de ingenieros? Identificamos nuestras variables. 𝑧=

𝑥−𝑢 𝜎

𝜎 = 1200 𝑥 = 28000

𝑓(𝑥) = 10% = 0.1

Buscamos este valor para hallar ‘’Z’’ y nos dimos cuenta que el valor se encuentra entre: 0.1003 y 0.0985

Hacemos una interpolación para hallar el valor de Z respectivamente. -1.29 0.0985

𝑧=

z

-1.28

0.10

0.1003

(0.1 − 0.0985)(−1.28 + 1.29) − 1.29 (0.1003 − 0.0985) 𝑧 = −1.28166666667 𝑧=

𝑥−𝑢 𝜎

−1.28166666667 =

28000 − 𝑢 1200

𝑢 = (−1.28166666667)(1200) − 28000 𝑢 = 𝑠/ .29538

EJERCICIO 2: El tiempo de espera 𝑥 del banco “INTERBANK” tiene una distribución normal con una media de 3,7 minutos y una desviación estándar de 1,4. Encuentre la probabilidad de que un cliente elegido de forma aleatoria haya tenido que esperar menos de 2,0 minutos SOLUCION: De los datos brindados reemplazamos cada uno de ellos en la misma fórmula del ejercicio anterior Donde: 𝑥:2 𝜇 : 3,7

𝜎 : 1,4

𝑧=

𝑥 − 𝜇 2 − 3,7 = 𝑧 = −1,21 𝜎 1,4

Ahora con el uso de la tabla hallamos la probabilidad 𝑃(𝑧 < −1,21)

Entonces la probabilidad de que un cliente elegido de forma aleatoria espere menos de minutos es 𝑃(𝑧 < −1,21) = 0.1131 Solución en Excel: Para la solución en Excel utilizaremos la función estadística DIST.NORM.ESTAND.N, al seleccionar esta función, nos aparecerá la siguiente ventana:

Donde: 𝑍 : -1.21 Y como observamos, será acumulado, por lo tanto deberíamos llenar la ventana de la siguiente mansera:

Por lo tanto, el resultado para este problema es: 0.11313945

EJERCICIO 3: Dada una distribución normal basada en 2100 casos sobre el peso de un electrodoméstico en TIENDAS EFE, con una media de 51 kilogramos y una varianza de 60,84 𝐾𝑔2 . Determinar la proporción del área y el número de casos entre la media y la calificación 69Kg.  Primero tenemos que encontrar la desviación estándar, lo hallaremos a partir de la varianza: 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟  Desviación estándar: 7.8Kg  Media: 51Kg  x: 69Kg  Calculo de “z”: 𝑧=

𝑥 − 𝑢 69 − 51 = = 2.307692308 σ 7.8

SOLUCION EN EXCEL: A. Colocamos los datos en una tabla de Excel:

B. Luego calculamos la porción de área:

C. Nos dirigimos a la parte superior de Excel donde se encuentra en un cuadro escrito “Fórmulas” damos “CLIC”.

D. Nos aparecerá más cuadros de los cuales buscamos el que dice “Más Funciones” y damos “CLIC”.

E. Se observará que aparecerán más opciones y escogemos la que dice “Estadística”.

F. Aparecerá

un

cuadro

con

más

opciones

“DISTR.NORM.ESTAND. N”, damos “CLIC”.

y

buscamos

la

que

dice

G. Y aparecerá un cuadro donde colocaremos los datos a calcular.

NOTA: En la parte donde dice “Acumulación” colocaremos “VERDADERO”. H. Colocamos los datos a calcular, pero antes seleccionamos el cuadro donde queremos que baya el resultado.  Datos a colocar para el problema y obtener la porción de área: “z = 2.307692308”

Calculo de la porción de área:

I. Una vez colocados los datos damos en “Aceptar”; nos aparecerá el resultado en el cuadro seleccionado.

J. El resultado obtenido para “2.307692308 ≤ z”, no es el correcto ya que Excel solo calcula valores “z ≤ (un número real)”; así que seleccionamos la respuesta y nos dirigimos a la parte superior donde encontramos el símbolo “f(x)”.

K. Ahora da “CLIC” en “=DISTR.NORM. ESTAND.N(2.307692308; VERDADERO)” y coloca adelante “1-“; ya que “(2.307692308 ≤ z) = 1 – (2.307692308 > z)”.

L. Presionamos “ENTER” y aparecerá el resultado.

M. Transformamos a porcentaje.

RESPUESTAS:  La porción de área entre la media y la calificación 69Kg es de “1.05%”.  El número de casos entre la media y la calificación 69Kg es de “2100 ∗ (1.05%) = 22.05”. EJERCICIO 4:

1. Se ha determinado que la vida útil de la marca de llantas GOODYEAR PERU tiene una distribución normal con media de 35 000 Km y una desviación estándar de 2 500 Km. Si un distribuidor hace un pedido de 400 llantas, ¿aproximadamente cuántas llantas durarán más de 41 000 Km?

SOLUCION:

 Datos del problema:

Total, de llantas pedido: 400 Media: 35000 km Desviación estándar: 2500 km Variable (x) ≥ 41000 km  En Excel calculamos para el limite inferior el valor de z

 En centraremos la probabilidad por complemento:

P(x≥41000) =1-P(x≤40999)

complemento

 Podemos decir, en Excel encontraremos la probabilidad del complemento tipo acumulado.

 En porcentaje seria: 0.82% Para hallar la cantidad de llantas, obtenemos el 0.82% de 400(pedido de llantas) =3.28 equivalente a 3 llantas. Entonces son 3 llantas que duraran más de 41000 km de recorrido.

EJERCICIO 5: Las calificaciones de 10 aspirantes presentados a un examen para contratación laboral, se distribuye normalmente con media 6,55 y varianza 4. a. Calcule la probabilidad de que un aspirante obtenga más de 8 puntos. b. Determine la proporción de aspirantes con calificaciones inferiores a 5 puntos. c. ¿Cuál es la probabilidad de los aspirantes que obtuvieron calificaciones comprendidas entre 5 y 7,5 puntos? DESARROLLO USANDO EXEL: Si la varianza es 4, entonces la desviación estándar es 2. Para “a”: Nos pide que la probabilidad de que un aspirante obtenga más de 8 puntos: 𝑃(𝑧 ≥ 8) = 1 − 𝑃(𝑧 < 8). Entonces calculamos la probabilidad que tengan menos de 8 puntos, conociendo de antemano la media y la desviación estándar. Para ello encontraremos primero el valor de Z utilizando la siguiente formula:

Entonces z es igual a: 𝑍 = 0,725, una vez conocido el valor de z calculamos el valor de 𝑃(𝑧 < 8), utilizando la formula proporcionada por el programa Excel.

Obtenemos que la probabilidad 𝑃(𝑧 < 8) es igual a:

Entonces la probabilidad 𝑃(𝑧 ≥ 8) = 1 − 𝑃(𝑧 < 8) es: 0,234226 = 23,42%

Para “b”: Nos piden calcular la probabilidad de que un aspirante obtenga menos de 5 puntos: 𝑃(𝑧 < 5). Entonces calculamos la probabilidad que tengan menos de 5 puntos, conociendo de antemano

la media y la desviación estándar. Para ello encontraremos primero el valor de Z utilizando la siguiente formula, siguiendo los pasos seguidos en el ejercicio “a”:

Entonces la probabilidad 𝑃(𝑧 < 5) es: 0,21917 = 21,92% Para “c”: Nos piden calcular la probabilidad de que un aspirante obtenga menos de 7,5 puntos y más de 5 puntos : 𝑃(𝑧 < 7,5) − 𝑃(𝑧 < 5). Entonces calculamos primero la probabilidad que tengan menos de 7,5 puntos, luego restamos la probabilidad de tenga un puntaje sea menor que tenga menos de 5 puntos, conociendo de antemano la media y la desviación estándar. Para ello encontraremos primero el valor de Z para (𝑧 < 7,5) luego hallamos el valor de Z para (𝑧 < 5) por ultimo calculamos 𝑃(𝑧 < 7,5) − 𝑃(𝑧 < 5).

Utilizaremos el mismo

procedimiento que utilizamos en el ejercicio “a”:

Entonces la probabilidad de 𝑃(𝑧 < 7,5) − 𝑃(𝑧 < 5) es igual a: 0.463437 = 46,3437%

EJERCICIO 6 La empresa PHIPLIPS instala en una ciudad 20 000 focos para su iluminación. La duración de una distribución normal con media de 300 días y desviación típica de 35 días. Calcular: ¿Cuántas duraran más de 350 días? 6.4.Del problema se pueden extraer los siguientes datos: 

Desviación Estándar (σ): 35

 Media (µ): 300  X: 350 6.5.Primero desarrollaremos el cálculo de z manualmente:

𝑧=

𝑥 − 𝑢 350 − 300 = = 1.428571428571429 σ 35

6.6.Luego realizaremos el cálculo del área con el software Excel y haremos una gráfica con Geogebra: 6.6.1. Cálculo del área en Excel: F. Ordenamos los datos del en Excel a través de una tabla

G. Para hallar el área usaremos la fórmula estadística de Excel: “DISTR.NORM. N” dicha ecuación se puede localizar de la siguiente manera:

Ubicamos en la barra de herramientas la parte que dice Fórmulas y luego seleccionamos “Estadísticas”

 Finalmente seleccionamos lo solicitado

Seleccionamos la función estadística “DISTR.NORM. N”

H. Al dar clic en la pantalla saldrá una tabla en la que llenaremos los valores ordenados en el punto (A). Hay que resaltar que se seleccionan las casillas, no los valores. En la parte de acumulado pondremos (Verdadero):

I. El valor del área obtenido es:

 Sin embargo, esta respuesta es incorrecta, ya que se nos pide que el área sea una porción mayor a 350, con lo que implica que no es el total, sino una parte. Así que se restará esta cantidad a 1:

 Con lo que la respuesta obtenida es:

J. Realizaremos el cálculo de esta función también en el programa Geogebra, para poder verificar nuestra respuesta.  Datos introducidos al software y respuesta:

 Gráfica obtenida:

EJERCICIO 7

Las precipitaciones anuales en una región alcanzan, de media, los 1500 mm, con una desviación típica de 200mm. Calcula, suponiendo que siguen una distribución normal, la probabilidad de que en un año determinado la lluvia: a. No supere los 1200 mm b. Supere los 1500 mm. c. Esté entre 1700 y 2300 mm. d. Deseamos seleccionar el 25% de los años más lluviosos, ¿A partir de qué cantidad de hemos de escogerlos? ¿Y si deseáramos seleccionar los menos lluviosos?

 Para la parte a) tenemos lo siguiente: P(X≤1200)

𝑧=

1200 − 1500 = −1,5 200

P(𝑧 ≤ −1.5) = 1- P(𝑧 > −1.5) = 1- P(𝑧 < 1,5) = 0.0668  Para la parte b) tenemos lo siguiente: P(X>1500)

𝑧=

1500 − 1500 =0 200

P(𝑧 > 0) = 1- P(𝑧 < 0) = 0,5  Para la parte c) tenemos lo siguiente: P(1700