Cuaderno de Trabajo 201701

PRE GRADO PROFESORES : LINEA DE ESTADÍSTICA TÍTULO : CUADERNO DE TRABAJO FECHA : Marzo de 2017 CURSO : ESTAD

Views 305 Downloads 146 File size 7MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

PRE GRADO

PROFESORES

:

LINEA DE ESTADÍSTICA

TÍTULO

:

CUADERNO DE TRABAJO

FECHA

:

Marzo de 2017

CURSO

:

ESTADÍSTICA

CÓDIGO

:

MA444

ÁREA

:

CIENCIAS

CICLO

:

2017-01

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

3

Unidad 1. Organización de datos Logro de la unidad Al finalizar la unidad el alumno organiza adecuadamente las observaciones o datos para facilitar la comprensión de los mismos, con ayuda del programa Minitab.

1.1 Definiciones Estadística Es la ciencia de los datos, implica la colección, clasificación, síntesis, organización, análisis e interpretación de los datos.

1.2 Clasificación Estadística descriptiva Es la rama de la Estadística que se dedica al análisis, descripción y representación de un conjunto de datos. Obteniéndose conclusiones sobre las características de dicho conjunto.

Estadística inferencial Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de hipótesis de un conjunto de datos extraídos de una muestra, con el propósito de llegar a tener conclusiones acerca de una población.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

4

Elemento o unidad elemental Es cada una de las entidades acerca de las cuales se reúnen los datos. Ejemplo Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como elemento a un estudiante de ingeniería de la UPC matriculado en el semestre 2014-2.

Población Es un conjunto de elementos, (personas, objetos, etc.), que tienen una o más características observables que se pueden medir en ellos. Ejemplo Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como población a todos los estudiantes de ingeniería de la UPC matriculados en el semestre 2016-2.

Muestra Se denomina muestra a una parte de la población. Ejemplo Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el Centro de Información, se puede considerar como muestra a un subconjunto de estudiantes de ingeniería de la UPC matriculados en el semestre 2016-2.

Ejercicio Se realizó un estudio para determinar la temperatura diaria promedio en la UPC al medio día durante los meses de enero, febrero y marzo. Determine la población, muestra y elemento.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

5

Ejercicio El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento de Lima y las consecuencias que éste podría generar en el Cercado de Lima. Por esta razón, Defensa Civil ha decidido realizar un diagnóstico de la situación de las viviendas en éste distrito encuestando a 1200 viviendas seleccionadas al azar. Parte de la encuesta se presenta a continuación: Encuesta de vivienda 1.

Tiempo de antigüedad de la vivienda  Menos de 10 años  Entre 10 y 20 años  Más de 20 años

2.

Material de construcción de la vivienda:  Cemento  Adobe  Quincha  Prefabricado

3.

Número de habitaciones: ____________

4.

Área de terreno: __________ m2

5.

La vivienda se encuentra en:  Buen estado de conservación  Regular estado de conservación  Mal estado de conservación

Complete la siguiente Ficha técnica: Fecha: Del 02 al 15 de marzo del 2015 Población: ____________________________________________________________________________________ Muestra: _____________________________________________________________________________________ Unidad elemental: ______________________________________________________________________________ Con 95% de confianza y 3% de margen de error.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

6

1.3 Tipos de datos Cuantitativos, son los que representan la cantidad o el número de algo. Cualitativos o categóricos, son los que no tienen una interpretación cuantitativa; sólo pueden clasificarse en categorías.

1.4 Variables Variable es una característica de interés de los elementos.

Clasificación de variables Variable cualitativa Es la característica cuyos valores se expresan en escala nominal u ordinal. Por ejemplo, carreras universitarias, materiales de construcción y tipos de resistencias.

Variable cuantitativa Es la característica cuyos valores se expresan en escala de intervalo o de razón. Se dividen en:  Discretas  Continuas

Variable cuantitativa discreta Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable de valores. Estos valores surgen de un proceso de conteo. Por ejemplo, número de artículos defectuosos producidos diariamente o número de columnas de concreto necesarias en la construcción de un puente.

Variable cuantitativa continua Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores cualesquiera. Estos valores surgen de un proceso de medición. Por ejemplo, temperatura de ignición de un gas, resistencia del concreto a la compresión o tiempo de corte de un torno corriente.

Estadística (Civil/Electrónica/Telecomunicaciones)

7

UPC

Ejercicio La Corporación Aceros Perú es una empresa que se dedica a la industria del acero. Actualmente, la empresa está fabricando hierro esponja, palanquillas de acero, barras helicoidales, alambrón y barras de construcción y tiene una capacidad de 680,000 toneladas al año. Uno de los mercados a los que más se orientan los productos es el mercado de la construcción de Lima. Al departamento de control de calidad se le ha encargado realizar un estudio sobre las varillas devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80 barras de aceros de la sección de devoluciones del almacén, se midieron algunas características de acuerdo a la siguiente ficha técnica: N° de barra:___________ 1.- Tipo de barra de acero:    

Corrugado ASTM Corrugado Grado60 Corrugado NBR7480 Corrugado 4.7 mm

2.- El destino de uso de la barra de acero    

Columnas Vigas Cimentación Concreto armado

3.- Resistencia a la tracción:________________ Kg/cm2 4.- Número de protuberancias:________________ 5.- Categoría del límite a afluencia   

Alta Regular Baja

6.- Tipo de defecto  Escamas  Pliegues  Grietas

 Marcas mecánicas  Fisuras  Porosidad



a. ¿Cuál es la población en estudio? b. ¿Cuál es la muestra? c. ¿Qué características medibles y observables surgen en este estudio?

Corrosión

Estadística (Civil/Electrónica/Telecomunicaciones)

8

UPC

Escalas de medición de las variables La escala de medición, permite determinar la cantidad de información que contienen los datos e indica el resumen de estos y el análisis estadístico más apropiado.

Nominal Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que se emplean para definir un atributo del elemento. Por ejemplo: el género de las personas, el estado civil, el número del celular, etc.

Ordinal Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo a algún criterio. Se pueden ordenar en forma ascendente o descendente. También, pueden registrarse por medio de un código numérico. Por ejemplo: el orden de mérito de los alumnos en el curso de Estadística, el grado de instrucción de los clientes de un banco, nivel socioeconómico de los alumnos de la universidad.

Intervalo Una variable está medida en escala de intervalo, si los datos tienen propiedades de datos ordinales y el intervalo entre observaciones, se expresa en términos de una unidad fija de medida. Los datos de intervalo siempre son numéricos. En esta escala, el cero es relativo, es decir, no indica la ausencia de la característica medida. Por ejemplo: las temperaturas en grados centígrados o en grados Fahrenheit.

Razón Una variable está medida en escala de razón si los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo. En esta escala, el cero indica la ausencia de característica de la medida. Por ejemplo: el sueldo de los empleados de una empresa, el peso de los alumnos de la UPC.

Ejercicio 1. Con la ficha de la Corporación Aceros Perú complete lo solicitado: Variable

Tipo de variable

Escala de medición

Estadística (Civil/Electrónica/Telecomunicaciones)

9

UPC

Ejercicios propuestos 1.

El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el departamento de Lima y por las consecuencias que esto podría generar, especialmente en algunos distritos como el Cercado de Lima. Por esta razón Defensa Civil realizó un diagnóstico de la situación de las viviendas en el mencionado distrito a través de una muestra de 1200 viviendas seleccionadas al azar. Se registraron las siguientes variables: I. Años de construcción. II. Tipo de vivienda(1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material prefabricado) III. Número de habitaciones por vivienda. IV. Área del terreno en donde se construyó la vivienda. a. De acuerdo al enunciado anterior identifique la población y la muestra. b. Identifique el tipo y escala de medición de las variables mencionadas.

2.

ComputerSoft es una compañía dedicada a brindar servicios informáticos a empresas que desean tener una presencia firme y contundente en la red. Esta compañía se dedica al tendido de redes LAN, instalación de equipos, servidores y toda una gama de productos tecnológicos que puedan resultar imprescindibles para una empresa. Como parte de un estudio realizado por ComputerSoft se analizó la información correspondiente a una muestra de 30 empresas en la ciudad de Lima a las que se les brindó los servicios informáticos.

Identifique el tipo y escala de medición de las variables consideradas en dicho estudio. Variable

Tipo de variable

Escala de medición

Lenguajes de programación (Cobol, Java, etc) Cantidad de servidores por empresa Costo de las licencias de software (en dólares) Año de instalación del software

3. La empresa de investigación de mercados AlphaDatum S.A. realizó un estudio para evaluar el

efecto de la caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos de pensiones (AFP). En este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años en Lima seleccionados al azar. Se registraron las siguientes variables: I. AFP a la que pertenece el afiliado (1 = Futuro Sólido, 2 = Siempre Contigo, 3 = Forever) II. Monto del fondo del afiliado (en soles) III. Edad del afiliado (en años) IV. Tipo de fondo según riesgo (1 = Bajo riesgo, 2 = Riesgo moderado, 3 = Alto riesgo) a. De acuerdo al enunciado anterior identifique la población y la muestra. b. Identifique el tipo y escala de medición de las variables mencionadas.

Estadística (Civil/Electrónica/Telecomunicaciones)

4.

UPC

10

Indique el tipo y la escala de medición de las características observadas en una muestra de secciones de tuberías de agua. Variable

Tipo de variable

Escala de medición

Diámetro de la tubería (pulgadas)

Material de la tubería

Año de instalación

Ubicación (subterránea, aérea)

Longitud de la tubería (pies)

Estabilidad del suelo circundante (inestable, moderadamente estable o estable) Corrosividad del suelo circundante (corrosivo o no corrosivo)

1.5 Organización de datos cualitativos Frecuencia absoluta (fi) de la categoría La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las observaciones que presenta esta categoría.

Frecuencia relativa (hi) de la categoría La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de observaciones que caen en esa categoría

Frecuencia relativa acumulada (Hi) de una categoría La frecuencia relativa acumulada de una categoría, está dada por la proporción del número total de observaciones que caen hasta esa categoría.

Estadística (Civil/Electrónica/Telecomunicaciones)

11

UPC

Ejemplo La siguiente información muestra la distribución de una muestra de viviendas de un determinado distrito de Lima según material con el cual fue construido. Distribución de viviendas según material de construcción Material de construcción

fi

hi

Cemento

48

0,160

Adobe

100

0,333

Quincha

108

0,360

Material pre fabricado

44

0,167

Total

300

1,000

Interprete:

f2

h2

Ejemplo Se tiene información para una muestra de instituciones peruanas sobre los dominios de segundo nivel registrados bajo la categoría .pe. Título: …………………………………………………………………………………………….. Dominio

f

h

p

com.pe

285

0.570

57.0

org.pe

106

0.212

21.2

edu.pe

64

0.128

12.8

gob.pe

26

0.052

5.2

net.pe

3

0.006

0.6

Otros

16

0.032

3.2

Total

500

Estadística (Civil/Electrónica/Telecomunicaciones)

12

UPC

Interprete:

f2

h2

Gráfico de barras y sector circular Para representar gráficamente la distribución de frecuencias de una variable cualitativa se utilizan las barras y los sectores circulares. Si trabajamos con variables nominales las categorías pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categorías deberán ser colocadas en orden. Ejemplo La siguiente información muestra la distribución de una muestra de viviendas de un determinado distrito de Lima según material con el cual fue construido. Distribución de viviendas según material de construcción Material de construcción

fi

hi

Cemento

48

0,160

Adobe

100

0,333

Quincha

108

0,360

Material pre fabricado

44

0,167

Total

300

1,00

El gráfico circular se presenta a continuación:

Fuente: Propia

Estadística (Civil/Electrónica/Telecomunicaciones)

13

UPC

Elabore el gráfico de barras para el ejercicio anterior.

Ejercicio

La empresa “PC Review – Perú” está interesada en conocer cuál es el programa de Microsoft Office que más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo se seleccionó una muestra de 500 empleados y se les pidió que indicaran el programa que más usaba. La información se presenta a continuación: Distribución de empleados según tipo de programa de Microsoft que usan Tipo de programa de Microsoft

Número de empleados (fi)

Access

50

MS Excel

101

MS Power Point

90

MS Word

113

Outlook

101

Otros

45

Total

500

Fuente: PC-Review-Perú

hi

pi% = hi *100%

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

14

Complete los siguientes gráficos:

120

Categoría Access Ms Excel Ms Power Point Ms Word Otros Outlook

100

80

60

40

20

0

Access

Ms Excel Ms Power Point Ms Word

Otros

Outlook

Fuente:

Fuente:

Gráfico de Pareto El diagrama de Pareto es un gráfico de barras ordenado por frecuencia, en orden descendente, también se dice, ordenado por orden de prioridad. Permite mostrar gráficamente el principio de Pareto: “el 80% de los problemas se pueden solucionar, si se eliminan el 20% de las causas que los originan” (pocos vitales, muchos triviales). Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos surgen de un número pequeño de causas. Este diagrama es un caso particular de gráfico de barras, que es utilizado básicamente para: i) Conocer cuál es el factor o factores más importantes en un problema. ii) Determinar las causas principales del problema. iii) Decidir el objetivo de mejora y los elementos que se deben mejorar. Pasos para realizar el gráfico de Pareto: i) Recolectar datos y clasificarlos por categorías. ii) Ordenar las categorías de mayor a menor, según la frecuencia fi, indicando el número de veces que se ha producido.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

15

iii) La categoría “Otros” debe ser colocada en la última posición, no importando cuán grande sea esta categoría. iv) Dibuje dos ejes verticales y uno horizontal. En el eje vertical derecho marque con una escala de 0% a 100%; en el eje vertical izquierdo, marque una escala de 0 hasta el número total de observaciones o de 0% a 100%; en el eje Horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las categorías, incluida la categoría “otros”. v) Calcular los porcentajes individuales y acumulados de cada categoría. vi) Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto) en función de los datos obtenidos anteriormente. Ejemplo La siguiente tabla muestra información sobre los defectos observados con mayor frecuencia en los puentes vecinales construidos en estructura de madera de cierta localidad del interior del país: Distribución de puentes vecinales según defectos observados Defectos observados

fi

Pandeos y rajaduras

40

Pudrimiento de las piezas de madera

30

Efectos del desgaste mecánico

20

Otros

5

Deformaciones

15

Ataques de insectos y crustáceos

10

Acción de fuego

5

Complete el diagrama de Pareto obtenido por Minitab para poder identificar los principales defectos en este tipo de puentes. ¿Qué defectos deberán priorizarse?

Estadística (Civil/Electrónica/Telecomunicaciones)

16

UPC

Diagrama de Pareto de Defectos 140

Frecuencia

100

80

80

60

60

40

40

20

20 Defectos

0

o de n Pa Frecuencia Porcentaje % acumulado

Porcentaje

100

120

s

y

j ra im dr Pu

o nt ie

40 32.0 32.0

s C te y ne as o i g os c s t a c De rm se In fo e D

30 24.0 56.0

20 16.0 72.0

15 12.0 84.0

o eg Fu

10 8.0 92.0

5 4.0 96.0

ro Ot

0

5 4.0 100.0

Ejercicio 1. El jefe de control de calidad de la empresa “Mundo” está interesado en conocer cuáles son las principales causas que están afectando la producción. Al seleccionar una muestra de 450 artículos fallados obtuvo los siguientes resultados: Causas

Cantidad

Inestabilidad máquina

56

Cambios ambientales

191

Rotura máquina

35

Cansancio operador

11

Desgaste del equipo

3

Desviación del material

5

Fluctuación energía

9

Error de medición

10

Partida fría

8

Rotura de operador

122

Total

450

Estadística (Civil/Electrónica/Telecomunicaciones)

17

UPC

Distribución de ………………………….…………. según principales causas que afectan la producción Causas

fi

hi

Cambios ambientales

191

0,424

Rotura de operador

122

0,271

Inestabilidad máquina

56

0,124

Rotura máquina

35

0,078

Cansancio operador

11

0,024

Error de medición

10

0,022

Fluctuación energía

9

0,020

Partida fría

8

0,018

Desviación del material

5

0,011

Desgaste del equipo

3

0,007

450

1,000

Total

Fi

Hi

Fuente: Departamento de producción

Complete el diagrama de Pareto agrupando en la categoría “Otros” las categorías cuyos porcentajes sean menores al 10%. Identifique las principales causas que resuelvan el 80% de los problemas de producción.

500 100 80

300 200

60 191 40 122

100

11

35

20

Inestabilidad máquina

Rotura máquina

Cansancio operador

Otro

0

Rotura de operador

C onteo Porcentaje % acumulado

35

Cambios ambientales

0

C ausas

56

191 42.4 42.4

122 27.1 69.6

56 12.4 82.0

35 7.8 89.8

11 2.4 92.2

35 7.8 100.0

Fuente: ……………………………………………..….

Porcentaje

400

Estadística (Civil/Electrónica/Telecomunicaciones)

18

UPC

1.6 Tabulaciones cruzadas También llamadas tablas de contingencia o de doble entrada. Se usan para resumir de manera simultánea los datos para dos variables.

Ejercicio Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las excavaciones de zanjas y tipo de terreno, arrojó los siguientes resultados en base a una muestra de 500 obras de construcción: Distribución de las obras de construcción según tipo de terreno y riesgo más importante Tipo de terreno

Tipo de riesgo más importante Atrapamiento

Caída de personal

Derrumbe

Inundaciones

Otros

Total

Roca blanda

27

66

51

9

25

178

Roca dura

15

53

38

3

9

118

Tierra arcillosa

9

31

17

1

10

68

Tierra fuerte

17

55

36

10

18

136

68

205

142

23

62

500

Total Fuente: Consultores A&C

Complete los espacios en blanco. El número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo de derrumbe es: ………………… Del total de obras que presentan riesgo de atrapamiento, el ………….…….% son de tierra fuerte.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

19

¿Cuál es el porcentaje de obras de construcción con riesgo de inundación y roca dura? ……………….

Gráfico de barras agrupadas Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

Gráfico de barras apiladas Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

Estadística (Civil/Electrónica/Telecomunicaciones)

20

UPC

Gráfico de barras apiladas al 100% Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada categoría. El alto de cada barra es el mismo para cada categoría.

Ejercicio A continuación, se muestra la información de una tabla de contingencia y un gráfico incompleto para las variables lugar de destino y nacionalidad. Distribución de pasajeros según su lugar de destino y nacionalidad Nacionalidad Lugar de destino Total Peruana Extranjero Arequipa

8

8

16

Cuzco

15

20

35

Miami

20

10

30

México D.F

22

10

32

Piura

2

7

9

Río de Janeiro

23

5

28

90

60

150

Total Fuente: Wayra S.A

Estadística (Civil/Electrónica/Telecomunicaciones)

21

UPC

Complete todos los elementos del siguiente gráfico. Distribución de pasajeros según su lugar de destino y nacionalidad 18% 16% 14% 12% 10% Peruano

8%

Extranjero

6% 4% 2% 0% Arequipa

Cuzco

Miami

México D.F

Piura

Río de Janeiro

Complete todos los elementos del siguiente gráfico.

100% 17.9%

90% 33.3%

80% 70%

31.3%

50.0% 77.8%

60% 50%

Extranjero

40%

Peruana

30% 20% 10% 0% Arequipa

Cuzco

Miami

México D.F

Piura

Río de Janeiro

Estadística (Civil/Electrónica/Telecomunicaciones)

22

UPC

Complete todos los elementos del siguiente gráfico.

100% 90%

25.6%

80% 2.2%

70%

Río de Janeiro

24.4%

60%

Piura México D.F

50% 40%

Miami

22.2%

Cuzco

30% 20%

Arequipa

16.7%

10%

13.3%

8.9%

0% Peruana

Extranjero

Estadística (Civil/Electrónica/Telecomunicaciones)

23

UPC

Ejercicios propuestos 1.

La empresa “PC Review Perú” realizó un estudio a una muestra a 500 directores de empresas de la ciudad de Lima. Los resultados obtenidos a la pregunta ¿cuál de los programas de Office usaba con mayor frecuencia? se resumen a continuación: Programa de Microsoft de uso más frecuente

Cantidad de directores de empresas

Access

30

MS Excel

80

MS Power Point

75

MS Word

250

Outlook

55

Otros

10 Total

500

Construya el diagrama de barras y sector circular para la información anterior.

Distribución porcentual de monitores según marca

2.

BetaSystems S.A. es una empresa dedicada a la importación y venta de monitores. Suponga que usted es el encargado de analizar los datos registrados correspondientes a las marcas de los monitores vendidos. La información procesada se muestra en el siguiente gráfico: Construya el diagrama de Pareto para poder identificar la estrategia de ventas más conveniente para la empresa. Comente sus resultados.

3. En la siguiente tabla se muestran los resultados obtenidos en un estudio realizado en la ciudad

de Ica por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las fallas estructurales en las edificaciones debido al último sismo que tuvo como epicentro la ciudad de Nazca. Fallas estructurales

Porcentaje

Columnas cortas

10%

Configuración del edificio

45%

Problemas geotécnicos

30%

Otros

10%

Piso blando

5%

Estadística (Civil/Electrónica/Telecomunicaciones)

24

UPC

Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado. 4.

La siguiente tabla muestra la distribución de clientes de la empresa de telefonía según sus principales quejas. Distribución de clientes según principales quejas Principales Quejas

Frecuencia

Cambios sin consentimiento

246

Tarifas y servicios

106

Forzamiento al cambio

29

Marketing

74

Llamadas internacionales

14.5

Maltratos

12.5

Servicio de operadora

hi

Fi

Hi

18

Construya el diagrama de Pareto para la variable en estudio. Considere un acumulado de menos de 8% para la categoría Otros. ¿Cuáles son las quejas que deberán priorizarse? 5.

A una muestra de 95 hombres y 155 mujeres se formuló la siguiente pregunta: ¿Por qué usa el servicio de taxi mediante una aplicación? Los resultados obtenidos se muestran en los siguientes gráficos: Gráfico 2

Gráfico 3

1.0

100%

0.9

0.32

0.8

0.36

80%

59%

0.7

A

0.6 0.5

60%

0.15

65% Masculino

Reunión Estudio

0.4

D

Femenino

40%

Trabajo

0.3

0.56

0.2

B

20%

C

33%

E

Estudio

Reunión

0%

0.1

Trabajo

0.0 Masculino

a. b. c. d.

Femenino

Indique el título del gráfico 2 y el título del gráfico 3 Complete los elementos faltantes de los gráficos 2 y 3. Del total de encuestados que usan la aplicación de taxi por trabajo, ¿cuántos son mujeres? Del total de hombres, ¿cuántos prefieren usar el servicio de taxi por reuniones?

Estadística (Civil/Electrónica/Telecomunicaciones)

6.

25

UPC

Dos preguntas realizadas fueron: ¿Qué tipo de viaje realiza usualmente? ¿Qué opinión tiene del servicio de hotel de los lugares que visitó? Los resultados se muestran en la tabla siguiente. Tabla 2: ……………………………………………………………………………………..… Opinión

Tipo de viaje

Total

Descanso

Diversión

Nuevos lugares

Bueno

13

15

23

51

Malo

10

7

22

39

Muy bueno

8

5

12

25

Muy malo

6

11

18

35

Regular

7

8

15

30

44

46

90

180

Total

Fuente: “Perú País de culturas S.R.L.”

a. En la tabla 2, interprete la celda sombreada por fila, por columna y por el total general. b. Presente la tabla relativa con respecto al total de columna y elabore el gráfico apropiado. c. Complete el siguiente gráfico:

Estadística (Civil/Electrónica/Telecomunicaciones)

26

UPC

1.7 Organización de datos cuantitativos discretos Frecuencia acumulada (Fi) Representa el número de observaciones que caen hasta esa categoría. Tabla de distribución de frecuencias: Título

Fuente:

Variable

fi

hi

Fi

Hi

0

f1

h1

F1

H1

1

f2

h2

F2

H2

2

f3

h3

F3

H3

.

.

.

.

.

k

fk

hk

n

1

Total

n

1

………………………………..…………..

Gráfico de bastones Es un gráfico para variable cuantitativa discreta donde se representan los valores de la variable y sus respectivas frecuencias absolutas o relativas. Título: ...........................................................................................................................................................

Estadística (Civil/Electrónica/Telecomunicaciones)

27

UPC

Ejercicio El jefe de Recursos Humanos desea información de la cantidad de faltas que han tenido los trabajadores en el mes anterior. Por tal razón seleccionó al azar a 30 trabajadores y registró el número de faltas. 0

0

0

0

1

1

1

1

1

1

1

1

2

2

2

2

2

2

2

2

2

2

3

3

3

3

3

3

4

4

Título: …………………………………………………………………………………………………………… Número de faltas

fi

hi

Fi

Hi

0

4

0,133

4

0,133

1

8

0,267

12

0,400

2

10

0,333

22

0,733

3

6

0,200

28

0,933

4

2

0,067

30

1,000

Total

30

1,000

Fuente: ………………………………………….………..

a.   

b.

Con la información anterior, complete los espacios en blanco: El porcentaje de trabajadores que asisten es: ____________________ El número de trabajadores que tienen a lo más dos faltas es:______________ Los trabajadores con problemas son aquellos con 3 o más faltas, ¿qué porcentaje de trabajadores tienen problemas?__________

Presente el gráfico adecuado para variable en estudio.

Estadística (Civil/Electrónica/Telecomunicaciones)

28

UPC

1.8 Organización de datos cuantitativos continuos Distribución de frecuencias para datos continuos 1) El rango (R) o recorrido. R = dato máximo – dato mínimo 2) El número de intervalos k  1 3.322 log10 n . (redondeado al entero más próximo). 3) La amplitud del intervalo w = R/k. (redondeado por exceso y con el mismo número de decimales que tienen los datos). 4) Obtenga las frecuencias absolutas y relativas. 5) Obtenga la marca de clase: xi/ 

Lím Inf i  Lím Sup i 2

Ejercicio Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador de una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de presión y las válvulas de control. Para ello se eligieron al azar 30 de ellos. 0.08

0.15

0.19

0.71

0.75

0.82

0.84

0.92

0.96

1.16

1.17

1.19

1.23

1.4

1.47

1.59

1.61

2.01

2.16

2.38

2.42

3.07

3.22

3.53

3.76

3.94

4.5

4.59

4.75

5.41

 Calcule el rango (R) o recorrido R=  Determine el número de intervalos (k) k=  Determine el tamaño del intervalo de clase (w) w= Título: …………………………………………………………………………………………………………………..……………….. i

x’i

Intervalo

1

[



[

2

[



[

3

[



[

4

[



[

5

[



[

6

[



]

Fuente: …………………………………………………

fi

hi

Fi

Hi

Estadística (Civil/Electrónica/Telecomunicaciones)

29

UPC

Gráficos: Histograma, polígono y ojiva Son gráficas que representan las observaciones obtenidas de las variables cuantitativas continuas.

HISTOGRAMA Es una gráfica de barras cuyas categorías son los intervalos de clase. Además, la altura de las barras está determinada por las frecuencias relativas de los intervalos de clase. Según el interés del estudio se pueden considerar también, las frecuencias absolutas.

POLÍGONO

OJIVA

Estadística (Civil/Electrónica/Telecomunicaciones)

30

UPC

Ejercicio 1. Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de venta diario, en cientos de soles, de la empresa Beta Systems S.A. 52.0

94.7

95.1

97.5

102.5

104.1

106.0

125.2

125.6

146.0

146.8

158.6

158.7

162.6

166.2

166.2

166.2

166.2

168.2

169.7

196.0

204.9

204.9

204.9

204.9

208.3

215.2

217.5

218.1

218.1

218.1

218.1

220.9

226.2

235.0

239.7

242.2

259.6

261.6

277.2

286.5

287.0

297.8

313.9

315.0

316.2

338.6

359.9

363.1

398.3

Cálculos:

Título: ………………………………………………………………………………………………… Lim Inf

Fuente:

Lim Sup

x´i

fi

hi

Fi

Hi

…………………………………………

a) El porcentaje de días que la empresa vende por lo menos 151,0 cientos de soles o menos de 200,5 cientos de soles es: _______________________ b) El número de días que venden menos de 299,5 cientos de soles es:_____________ c) La empresa estaría en superávit cuando su venta es de 299,5 cientos de soles o más ¿qué porcentaje de los días se tiene superávit?_________________ d) Cuando la venta supera 324,25 se considera un “buen día” para la empresa. ¿Qué porcentaje de días son considerados como “buen día”? ____________________

Estadística (Civil/Electrónica/Telecomunicaciones)

31

UPC

Ejercicios propuestos 7.

Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100 kilómetros. Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el número de exposiciones de imagen espectral independiente para cada observación. Aquí se presentan los datos de 40 observaciones de asteroides obtenidas de Science (9 de abril de 1993). Número de exposiciones de imagen espectral independientes para 40 observaciones de asteroides 3

4

3

3

1

4

1

3

2

3

1

1

4

2

3

3

2

6

1

1

3

3

2

2

2

2

1

3

2

1

6

3

1

2

2

3

2

2

4

2

Construir un gráfico de bastones para el número de exposiciones de imagen espectral. 8.

Complete la tabla y elabore un gráfico apropiado, usando las frecuencias porcentuales, para representar la información de la tabla siguiente. Luego interprete en términos del enunciado f2 y H3. Título: ……………………………………………………………………………… Número de monitores con fallas

fi

0

30

1

10

2

5

3

3

4

2

hi

Hi

Estadística (Civil/Electrónica/Telecomunicaciones)

32

UPC

Unidad 2 Medidas de Resumen Logro de la unidad Al finalizar la unidad el alumno será capaz de describir el comportamiento de un conjunto de datos a través de las medidas estadísticas de centro, posición, variabilidad y forma aplicado a problemas de su especialidad.

2.1 Métodos numéricos para describir datos cuantitativos Definiciones Parámetro Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace necesario contar con toda la información que brinda los elementos de una población. Por ejemplo, el promedio poblacional (µ), varianza poblacional (σ2).

Estadístico Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la información muestral. A los valores obtenidos de un estimador se conoce como estimación. Por ejemplo: el promedio muestral (𝑥̅ ), varianza muestral (s2). Los parámetros y estadísticos de mayor uso son: Nombre

Parámetro

Estadístico

N

Promedio

μ

 Xi i 1

N

n

X

N

Varianza

σ2 

.

i 1

p

i 1

S2 

X i 1

i

X



2

n-1

N

Nº de éxitos N

i

n

n

σ

Desviación estándar

Proporción

 (X i  μ) 2

X

S pˆ 

Nº de éxitos n

Estadística (Civil/Electrónica/Telecomunicaciones)

33

UPC

2.2 Medidas de tendencia central Son aquellas que localizan el “centro” de una distribución, indicando el valor alrededor del cual tienden a concentrarse ó distribuirse las demás observaciones. Lo que se persigue es conseguir un valor que sea representativo del conjunto de datos que se está analizando.

Media aritmética La media llamada también promedio, se define como el cociente de la suma de los valores observados de la variable en estudio y el número de observaciones.

Características de la media   

Es un estadístico o parámetro muy conocido y de fácil comprensión. Se puede calcular para variables de escala intervalo o razón. La mayor desventaja es que se ve afectado por valores extremos, es decir si hay valores muy pequeños o muy grandes la media no los representaría adecuadamente. n

Para datos simples (no agrupados) se calcula por

x

x i 1

i

n k

x

Para datos discretos (agrupados) se calcula por

fx i

i 1

i

n k

x

Para datos continuos (agrupados) se calcula por

fx

/ i i

i 1

n

Ejemplo Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra de hilos de lino: 15,2

15,8

16,2

18,5

19,4

20,6

21,2

21,9

25,4

27,3

28,3

29,5

32,5

33,7

n

x

x i 1

n

i

= x

(15,2  15,8  16,2  ...  32,5  33,7  36,9) 15

Media = 24,16 Interpretación: La resistencia promedio al rompimiento de los hilos es de 24,16 onzas.

36,9

Estadística (Civil/Electrónica/Telecomunicaciones)

34

UPC

Ejercicio 1. Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35 familias x

fi

0

13

1

6

2

8

3

6

4

2

xi*fi

2. Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores Intervalo

fi

1

[0.02 - 0.81[

6

2

[0.81 - 1.60[

13

3

[1.60 - 2.39[

4

4

[2.39 - 3.18[

3

5

[3.18 - 3.97[

2

6

[3.97 - 4.76]

2

x’i

Mediana Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto es el valor que divide en dos partes a dicho conjunto de datos.

Características de la mediana   

Se puede calcular para variables medidas en escala intervalo o razón. El 50% de los datos tienen un valor menor o igual a la mediana. La mediana no se ve afectada por valores “extremos” (mínimo y máximo).

Estadística (Civil/Electrónica/Telecomunicaciones)

35

UPC

Para datos no Agrupados: Si denotamos las observaciones ordenadas por x1, x2, x3, ... , xn , la mediana pude representarse por:

me  x n 1

Es el dato de la posición [(n+1)/2]

Si n es impar

2

x n x n me 

2

2

Es el promedio de los datos que se encuentran en la posición: [n/2] y [(n/2)+1]

1

2

Si n es par

Ejemplo Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son: 9.84

9.98

9.98

9.99

10.00

10.00

10.05

10.12

10.26

25.00

Calcule e interprete el valor de la mediana.

x n x n Me 

2

2

2

1

=

x 5 x 6 = 10 2

Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios Ejercicio Los siguientes datos corresponden a la distribución del número de piezas defectuosas producidas en una muestra de 150 días. Calcule e interprete el valor de la mediana. Número de piezas de defectuosas

Número de días

0

50

1

60

2

25

3

10

4

5

Fi

Estadística (Civil/Electrónica/Telecomunicaciones)

36

UPC

Moda La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.

Características de la moda    

La moda se puede calcular para cualquier escala de medición. El valor de la moda no se ve afectada por valores extremos. La moda no siempre es un valor único. Un conjunto de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Se puede dar el caso de que el conjunto de datos no tiene moda.

Ejemplo Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se presentan a continuación: 9,84

9,98

9,98

9,99

10,00

10,00

10,05

10,12

10,26

25,00

Moda = 10 Interpretación: La lectura de voltaje más frecuente es de 10 voltios. Ejercicio Renacer S.A fabrica Hornos de Microondas, encargo al jefe de control de calidad que informe cual es el problema más frecuente encontrado en los hornos microondas. Se tomó una muestra del área de reparaciones y estos fueron los resultados: Problemas

Número de hornos

De capacidad de descongelación

6

Velocidad de calentamiento

14

Cable de alimentación

3

Fuga de la microondas

8

Frecuencia de la microondas (MHz)

9

Potencia de microondas (W)

10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?

Estadística (Civil/Electrónica/Telecomunicaciones)

37

UPC

Relaciones entre la media, mediana y moda Además de las medidas de tendencia central podemos estar interesadas en saber la forma que presenta el conjunto de datos. Para una distribución unimodal (una sola moda) se cumple de manera general lo siguiente: Si la distribución de frecuencias es simétrica (sesgo nulo)

Media = Mediana = Moda

Si la distribución es asimétrica cola a la derecha (sesgo derecho o positivo)

Moda < Mediana < Media

Si la distribución es asimétrica cola a la izquierda (sesgo izquierdo o negativo)

Media < Mediana < Moda

Estadística (Civil/Electrónica/Telecomunicaciones)

38

UPC

2.3 Medidas de posición o Cuantiles Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes especificados debajo y sobre éste valor. Para su cálculo, los datos deben estar previamente ordenados.

Cuartil Divide al conjunto de datos en 4 partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que son los correspondientes percentiles P25 , P50 y P75 .

Decil Divide al conjunto de datos en 10 partes porcentualmente iguales, hay nueve deciles D1, D2, …, D9 que son los correspondientes percentiles P10 , P20 , .., y P90 .

Percentil Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk, este divide el conjunto de datos en dos partes, la inferior que contiene el K% de datos y la superior que contiene el (100-k)% de datos.

(100-K)%

K% P K

Para datos no agrupados:

Primero debe ordenarse los datos en orden creciente o decreciente. Luego, para hallar el percentil Pk se sugiere los siguientes pasos:  Calcular el valor de la posición que ocupa el percentil Pk en la lista de datos ordenados que está determinada por la siguiente expresión:

 Luego,

i

k (n  1)  E, d 100

Pk  X ( E )  0, d * ( X ( E 1)  X ( E ) )

Donde: E : parte entera y d : parte decimal Ejemplo La compañía VIDRIMAX presenta un informe de sus diez tipos de envases más solicitados con sus respectivas producciones mensuales: 1980

2250

2450

2600

2980

3010

3019

3129

3289

3678

Estadística (Civil/Electrónica/Telecomunicaciones)

39

UPC

Calcule e interprete el valor del percentil 25 Solución: observe que los datos ya se encuentran ordenados. Calcule la posición que ocupa el percentil P25 i

k (n  1) 25(10  1)  2,75  E, d  i  100 100

Pk  X ( E )  0, d * ( X ( E 1)  X ( E ) )

 P25 = X2 + 0,75*(X3 - X2)

Reemplazando: P25 = 2250 + 0,75*(2450 –2250) = 2400 Interpretación: El 25% de los tipos de envases de la compañía VIDRIMAX tiene una producción máxima de 2400 envases mensuales. Ejercicio 1. Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados se muestra a continuación: 14,5

15,5

15,5

16,2

16,2

16,5

16,5

17,0

17,1

17,3

17,5

17,6

Si se desea contratar a un egresado que pertenezca al quinto superior, ¿Qué percentil debe calcular y cuál es la nota mínima que debería de tener?

2. Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un ejercicio de escape del área. Para ello se registraron los siguientes tiempos, en minutos, empleados en la evacuación. 31.5

32.5

32.5

33.4

33.9

34.0

35.6

35.6

35.9

35.9

36.3

36.4

36.9

37.0

37.3

37.3

37.4

37.5

38.0

38.9

39.2

39.3

39.4

39.7

40.2

40.3

41.5

42.4

42.8

44.5

Estadística (Civil/Electrónica/Telecomunicaciones)

40

UPC

a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo en la evacuación de la plataforma?

b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo en la evacuación de la plataforma?

3. Investigadores del Massachussets Institute of Technology (MIT) realizaron, 9 de abril de 1993, un estudio sobre asteroides. Al observar 40 de éstos asteroides con el telescopio Hiltner del observatorio de MIT; se registró el número de exposiciones de imagen espectral. Número de exposiciones de imagen espectral 1

1

1

1

1

1

1

1

1

2

2

2

2

2

2

2

2

2

2

2

2

2

3

3

3

3

3

3

3

3

3

3

3

3

4

4

4

4

6

6

Elabore la Tabla de frecuencia

Título: …………………………………………………………………………………………………………………………….. Número de exposiciones 1 2 3 4 6 Total

fi

hi

Fi

Hi

Estadística (Civil/Electrónica/Telecomunicaciones)

41

UPC

a. El mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores exposiciones es: __________________que corresponde al percentil _____________________

b. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja, media y alta ¿Cuáles serán los límites de estas si la categoría media contiene al 50% central de la cantidad de asteroides?

Ejercicios propuestos 1.

Con base en un célebre experimento, Henry Cavendish (1731 -1810) ofreció evidencias directas de la ley de la gravitación universal de Newton. En el experimento se determinó el peso de masas de objetos, la medida de la fuerza de atracción se usó para calcular la densidad de la Tierra. Los valores de la densidad de la Tierra, en orden temporal por filas son: 5.36

5.29

5.58

5.65

5.57

5.53

5.62

5.29

5.44

5.34

5.79

5.27

5.39

5.42

5.47

5.63

5.34

5.46

5.30

5.75

5.68

5.85

Calcule e interprete el valor de los cuartiles.

5.10

Estadística (Civil/Electrónica/Telecomunicaciones)

2.

42

UPC

Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y comprobados. Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los tiempos de resolución (tiempos de CPU en segundos) se listan en la siguiente tabla. 0.045

0.036

0.045

0.049

0.064

0.07

0.079

0.088

0.091

0.118

0.13

0.136

0.136

0.136

0.145

0.179

0.182

0.182

0.194

0.209

0.209

0.227

0.242

0.258

0.258

0.258

0.291

0.327

0.333

0.336

0.361

0.379

0.394

0.412

0.445

0.506

0.554

0.567

0.579

0.6

0.67

0.912

1.055

1.07

1.267

1.639

1.894

3.046

3.888

3.985

4.17

8.788

a.

¿Cuál es el tiempo máximo de resolución de un problema para ser considerado dentro del 10% de los más rápidos? b. ¿Cuál es el tiempo mínimo de resolución de un problema para ser considerado dentro del 20% de los menos rápidos c. Se desea categorizar a los problemas según sus tiempos de resolución en categorías normal, media y alta ¿Cuáles serán los límites de estas si la categoría media contiene al 50% central de la cantidad de problemas? 3. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una

distribución de frecuencias simétrica de 5 intervalos de igual amplitud resultando que el ingreso mínimo es de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares. Si el 8% de los ingresos son menores que 175 dólares y el 70% de los ingresos son menores a 275 dólares. a. Determine las frecuencias relativas de cada intervalo. b. ¿Qué porcentaje de ingresos son superiores a $ 285? 4.

Investigadores del MassachussetsInstitute of Technology (MIT) estudiaron las propiedades espectroscópicas de asteroides de la franja principal con un diámetro menor a los 100 kilómetros. Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT; se registró el número N de exposiciones de imagen espectral independiente para cada observación. Aquí se presentan los datos de 40 observaciones de asteroides obtenidas de Science (9 de abril de 1993). Número de exposiciones de imagen espectral independientes para 40 observaciones de asteroides 3

4

3

3

1

4

1

3

2

3

1

1

4

2

3

3

2

6

1

1

3

3

2

2

2

2

1

3

2

1

6

3

1

2

2

3

2

2

4

2

Calcule las medidas de tendencia central e interprete los resultados.

5.

43

UPC

A continuación se presenta la distribución del número de camiones que atendió la planta de Lurín en cada obra con el objetivo de “Evaluar indicadores en las atenciones que realiza la planta de Lurín”. Calcule las medidas de tendencia central e interprete los resultados.

Distribución del número de camiones enviados a cada obra desde Lurín 16

15

14 12

Número de obras

Estadística (Civil/Electrónica/Telecomunicaciones)

10

11 9

8

7

6

6 4

4

3

2 0

1

2

3

4

5

6

7

Número de camiones Fuente: Tricon S.A.

6.

Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto puede soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusión sobre qué tanta tensión, en promedio, puede resistir este tipo de concreto. A continuación se presenta la tensión (en kg/cm2) obtenidos de una muestra de 30 bloques de concreto que se utilizarán para construir un puente. 1,2

2,1

2,2

2,2

2,5

2,5

2,6

2,6

2,7

2,8

3,0

3,0

3,2

3,2

3,2

3,4

3,4

3,5

3.5

3,6

3,6

3,6

3,6

3,7

3,8

3,9

3,9

4,0

4,0

4,0

Calcule las medidas de tendencia central e interprete los resultados.

2.4 Medidas de variación o dispersión Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto de una medida de tendencia central. Los datos que están relativamente cercanos entre sí, tienen bajas medidas de variabilidad, mientras que los que están más alejados entre sí tienen medidas de variación más grandes.

Rango El rango es una medida de variación de un conjunto de datos y se define como la diferencia entre el valor máximo y el valor mínimo. Es una medida inestable, ya que su valor cambia mucho ante datos extremos. Se calcula para variables en escala de medida de intervalo o razón

Varianza Es una medida del grado de dispersión o variación de los valores de una variable con respecto a su media aritmética. Las unidades en las que queda expresada la varianza son unidades al cuadrado. Esta medida no tiene interpretación.

Estadística (Civil/Electrónica/Telecomunicaciones)

44

UPC

La varianza de una muestra se denota por s2, mientras que la de una población se denota por

2 Varianza poblacional N

2 

 x i 1

 

2

i

N

Varianza muestral para datos simples n

s2 

 x i 1

 x

2

i

n 1

Varianza muestral para datos agrupados discretos y continuos k

s  2

 f x  x i 1

i

2

 f x k

i

s  2

n 1

i 1

/ i

i

 x

2

n 1

Desviación estándar La desviación estándar es la raíz cuadrada positiva de la varianza Se denota por s cuando es calculada de una muestra y por  cuando es poblacional. Nota: Para calcular la varianza y desviación estándar usaremos su calculadora científica. Video: https://www.youtube.com/watch?v=Ds4vXpZ5jOw

Ejemplo Calcule el rango, la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua potable en miligramos por litro. 35

73

30

15

36

60

47

Varianza: ____________________ Desviación estándar: _______________

19

15

38

10

35

31

21

22

20

Estadística (Civil/Electrónica/Telecomunicaciones)

45

UPC

Ejercicio 1. Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una muestra de 100 días: xi

fi

0

10

1

15

2

30

3

35

4

10 100

2. Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un metal a una sustancia química. Los resultados de una muestra de 66 reacciones son las siguientes: I

Intervalos

fi

1

[15.2 – 17.2[

12

2

[17.2 – 19.2[

13

3

[19.2 – 21.2[

20

4

[21.2 – 23.2[

16

5

[23.2 – 25.2]

5 66

Calcule la varianza y desviación estándar.

xli

Estadística (Civil/Electrónica/Telecomunicaciones)

46

UPC

Coeficiente de variación Es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la variabilidad de dos o más grupos de datos expresados en distintas unidades de medida o cuando los promedios de los conjuntos de datos a comparar son diferentes. El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones con respecto a la magnitud de la media

CV 

s  100% x

Rango intercuartil Es la amplitud del 50% de los datos que se ubican en el centro de una distribución. No se ve afectada por valores extremos.

RIC  Q3  Q1  P75  P25

Rango Es la diferencia entre el dato más grande y el más pequeño. R = Xmáx – Xmín Ejemplo 1. A continuación se presentan los tiempos de transmisión de un archivo, en segundos, evaluados en empresas que adoptaron la Tecnología WAN y la Tecnología LAN bajo condiciones similares. Tecnología LAN

Frecuencia

108

111

3

111

114

35

114

117

66

117

120

57

120

123

29

123

126

16

126

129

9

129

132

3

132

135

2

Total

Tecnología WAN 138

126

125

220

124

119

119

137

110

119

155

123

124

126

126

129

Estadística (Civil/Electrónica/Telecomunicaciones)

47

UPC

Determine para qué tipo de Tecnología utilizada los tiempos de transmisión de datos son más homogéneos. Justifique numéricamente su respuesta. Tecnología WAN s = 10,45 x = 126,67 CV= 825%

Tecnología LAN s = 4,53 x = 118,02 CV= 3,84%

Interpretación: Los tiempos de transmisión de datos son más homogéneos para el tipo de tecnología LAN. Ejercicio La empresa Electro, dedicada a la venta de artefactos electrónicos para el hogar, opera 200 tiendas en diferentes lugares del país. Los últimos informes indican que las ventas mensuales ha descendido a tal punto que se han tenido que cerrar algunas tiendas. El gerente, con el fin de enfrentar el problema, ha determinado que es necesario un estudio estadístico de las ventas semanales (en miles de soles) de un producto electrónico en tres de sus principales tiendas: Aptao, Azufral y Brento. Las muestras tomadas al azar de cada tienda arrojó los siguientes resultados: Ventas Aptao

Número de semanas

Ventas Brento

Número de semanas

100 – 200 200 – 300 300 – 400 400 – 500 500 – 600 Total

5 14 21 7 3 50

20 40 60 80 100 Total

2 8 25 20 8 63

Ventas Azufral

120

200

100

50 45

120

100

100

90

75

100

210

a. Calcule la media y la varianza de las ventas en Azufral, Aptao y en Brento.

100

50

120

Estadística (Civil/Electrónica/Telecomunicaciones)

48

UPC

b. Determine en cuál de las tiendas las ventas realizadas es más homogénea. Justifique numéricamente su respuesta.

Ejercicios propuestos 7.

En el medio local hay dos plantas (Planta 1 y Planta 2) que se dedican a la fabricación de barras de acero para la construcción. Las empresas proveedoras de barras de acero para la construcción, que abastecen al mercado constructor, desean averiguar acerca de la resistencia media a la tracción y la desviación estándar, para ello, se tomaron muestras aleatorias en ambas plantas y la información registrada acerca de la resistencia a la tracción(en Kg/cm2) se muestra en las siguientes tablas: Resistencia a la tracción (Planta 1)

fi

[ 69.220 – 70.436 [

14

[ 70.436 – 71.652 [

5

[ 71.652 – 72.868 [

6

[ 72.868 – 74.084 [

8

[ 74.084 – 75.300 [

7

[ 75.300 – 76.516 [

17

[ 76.516 – 77.732 [

5

Total

62

Estadísticas descriptivas: Resistencia a la tracción: Planta 2 Variable Tracción

n 62

Media Desv.Est. 64.520 2.983

Varianza 8.899

Mínimo 61.220

Máximo 69.856

Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en las resistencias a la tracción? Sustente su respuesta estadísticamente. 8.

A continuación se presenta un gráfico que muestra la distribución de los resultados de la medición del Coeficiente de resistencia específica al corte (Kgf/cm2) de la empresa “ACE SA” en 75 obras de la ciudad de Arequipa:

Estadística (Civil/Electrónica/Telecomunicaciones)

49

UPC

Distribución de las Obras según Coeficiente de Resistencia específica al corte en la ciudad de Arequipa 25

22

fi: Número de obras

20

18

15

10

10

8

8 5

4

5

0

3.0

3.6

4.2

4.8

5.4

6.0

6.6

7.2

Xi: Coef. Resistencia específica al corte (Kgf/cm2) Fuente: Mortero S.A.

La empresa opera también en Lima y el estudio de realizado a 75 obras de esta ciudad muestra las siguientes medidas e indicadores sobre el Coeficiente de Resistencia específica al corte (Kgf/cm2). Los datos se presentan a continuación:

Variable C. resistencia.

Total 75

Media 2.0595

Desviación Estándar.

Varianza 0.833

La empresa realizará una auditoría en la ciudad que presente una mayor variabilidad de los coeficientes de resistencia específica del corte en las obras. ¿En qué ciudad se debe hacer la auditoría? Justifique su respuesta numéricamente.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

50

Diagrama de cajas o boxplot Es una gráfica que describe la distribución de un conjunto de datos tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango intercuartil como medida de dispersión. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC Se traza un rectángulo con los extremos en el primer y tercer cuartil. En la caja se traza una recta vertical en el lugar de la mediana. Así, la línea de la mediana divide los datos en dos partes porcentualmente iguales. Se ubican los límites mediante el rango intercuartil. El límite superior está a 1,5(RIC) arriba (o a la derecha) de Q3 . El límite inferior está a 1,5(RIC) debajo (o a la izquierda) de Q1 . Las líneas antes y después de las cajas se llaman bigotes, se traza desde los extremos de la caja hasta el mínimo y máximo dentro de los límites inferior y superior si no hay valores extremos. Se considera dato atípico a cualquier punto mayor al límite superior (a la derecha) y menor al límite inferior (o a la izquierda). Se marcan con un asterisco (*) las localizaciones de los valores atípicos.

El diagrama de Caja nos permite: Comparar las medianas de dos o más conjuntos de datos. Observar el tipo de distribución de los datos (simétrica o asimétrica en el 50% central). Determinar la dispersión en el 50% central de los datos. Identificar la presencia de valores extremos (datos atípicos) Ejemplo La empresa Renacer S.A. seleccionó una muestra de 30 hornos microondas del turno noche y midió la radiación, en mw/cm2, que emiten estos aparatos con la puerta cerrada. Los datos se muestran a continuación:

Estadística (Civil/Electrónica/Telecomunicaciones)

51

UPC

1

1

2

2

3

4

6

6

6

6

7 10

7 11

8 12

8 15

8 15.5

9 16.8

9 18

9 19.7

10 23

10 24

a. Añada los valores faltantes en la caja del turno noche. Incluya valores atípicos, si existiera(n).

Cantidad de Radiación (mw/cm2)

25

Cantidad de Radiaciones emitidas de hornos microondas según turnos

20 15 P75= 11.8 10

9.35 P25= 7.05

5 0 T. Mañana

T. Noche Turno de producción

b. Teniendo en cuenta el 50% central de las muestras observadas, ¿cuál de los turnos mañana o noche presenta menor dispersión en los niveles de radiación y qué forma presenta la distribución de cada grupo?

Estadística (Civil/Electrónica/Telecomunicaciones)

52

UPC

Ejercicios propuestos 1.

En un proyecto de construcción se midió la resistencia del concreto (en MN/m2) en dos plantas

diferentes. Se ha determinado que la resistencia mínima del concreto para el tipo de trabajo que se está realizando es 28.0 MN/m2. Los resultados obtenidos se presentan a continuación:

a. La planta _____ cumple con la resistencia mínima de concreto y la planta____ no cumple con la resistencia mínima. b. La planta A presenta asimetría __________________ . c. La

planta

________

presenta

mayor

variabilidad

en

la

resistencia

porque

____________________________________________. d. La planta ___________ presenta menor variabilidad en la resistencia porque ____________________________________ e. Interprete en términos del enunciado del problema el valor atípico de la planta 1. 2.

La empresa Tricon S.A realiza un estudio sobre el tiempo de espera en las obras. Considera que esta variable es necesaria pues el concreto premezclado tiene un tiempo de vida de aproximadamente 3 horas. A continuación se presentan los datos de los tiempos de espera, en minutos, de las 45 obras a las cuales se envió el concreto premezclado desde la planta de los Olivos: 23

34

37

38

41

43

44

46

47

48

49

49

51

51

52

53

54

55

57

58

58

58

58

59

59

60

60

60

60

61

62

62

62

63

63

63

64

65

70

73

74

76

78

88

89

Estadística (Civil/Electrónica/Telecomunicaciones)

53

UPC

También se presenta el diagrama de cajas de los tiempos de espera (en minutos) para las plantas de Lurín y Callao, desde donde se envía el concreto premezclado.

Tiempo de espera del concreto premezclado por planta ( en minutos) 80

74 70

67

Datos

60

58

58

56.75

53 50

49.5

40

39,25

39

30

23

25

20 LURIN

CALLAO

OLIVOS

Fuente: Tricon S.A.

a. Complete los datos que faltan en el diagrama de cajas. b. En las obras abastecidas desde la planta de los Olivos, ¿existen datos atípicos?, si existen, diga cuales son c. Respecto al 50% de los datos centrales del tiempo de espera, ¿cuál de las plantas presenta mayor dispersión? Justifique su respuesta numéricamente. 3. Las ventas, en miles de soles, durante 50 semanas de los productos principales A y B de una

compañía poseen las siguientes distribuciones de frecuencias: Ventas A

Número de semanas

Número de semanas

10 – 20

2

2 - 4

5

20 – 30

8

4 - 6

14

30 – 40

25

6 - 8

21

40 – 50

9

8 - 10

7

50 – 60

6

10 - 12

3

¿Qué producto tiene un nivel de ventas más homogéneo? 4.

Los habitantes de ciudades antiguas en EEUU ingerían cantidades pequeñas, pero dañinas, de plomo introducido en su agua potable por el empleo de las tuberías forradas de plomo que se

Estadística (Civil/Electrónica/Telecomunicaciones)

54

UPC

instalaron en los primeros sistemas de agua. Los datos en la tabla son el contenido medio de plomo, cobre y hierro (miligramos por litro) de muestras de agua recolectadas diariamente durante 23 días del sistema de agua de Boston. Los datos se recabaron en 1977 después de que se instaló un sistema de tratamiento de aguas con hidróxido de sodio. Cada media se basa en cerca de 40 determinaciones realizadas en diferentes puntos del sistema de agua de Boston donde se seguían usando tuberías de plomo. Plomo

Cobre

Hierro

0.010

0.022

0.039

0.04

0.07

0.09

0.11

0.14

0.18

0.015

0.030

0.043

0.04

0.07

0.1

0.11

0.15

0.19

0.015

0.031

0.047

0.04

0.07

0.1

0.12

0.15

0.20

0.016

0.031

0.049

0.04

0.07

0.12

0.12

0.16

0.22

0.016

0.035

0.055

0.04

0.07

0.14

0.13

0.17

0.23

0.019

0.035

0.060

0.05

0.08

0.16

0.13

0.17

0.25

0.020

0.036

0.073

0.05

0.08

0.18

0.14

0.17

0.33

0.021

0.038

0.05

0.08

0.14

0.17

a. Calcule las medidas de tendencia central y de variación en cada una de las muestras. b. Construya en un solo gráfico los diagramas de caja para cada una de las muestras. c. ¿Existen valores atípicos en alguna de las muestras?

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

55

Unidad 3 Probabilidad Logro de la unidad Comprende los diferentes conceptos relacionados con probabilidades y los utiliza adecuadamente en la solución de casos relacionados con su especialidad.

3.1 Experimento aleatorio () Es una operación cuyo resultado no se puede predecir con certeza y que se realiza bajo las siguientes condiciones: Se puede repetir indefinidamente donde los resultados dependen del azar, por lo que no se pueden predecir con certeza. Se puede describir el conjunto de todos los resultados posibles. Cuando se repite un gran número de veces, aparece un modelo definido de regularidad. Ejemplos  1:Lanzar un dado.  2 :Se lanzan dos monedas y se registra el resultado obtenido.  3 :Seleccionar un dispositivo electrónico y registrar si es defectuoso o no.  4 :Observar el tiempo de vida de un artefacto eléctrico.

3.2 Espacio muestral ( ó S) Es el conjunto de todos los posibles resultados de un experimento aleatorio. Cada elemento de este conjunto se le denomina punto muestral y se le denota con w. Ejemplos 1= {1,2,3,4,5,6} 2= {cc,cs,sc,ss} 3 = {defectuoso, no defectuoso} 4 = {t/ t ≥ 0}

3.3 Evento Es todo subconjunto del espacio muestral y representa cierta característica de ella. Se denotan mediante las primeras letras del alfabeto y en mayúsculas: A, B, C,…

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

56

Evento simple Formado por un sólo un punto muestral. No se puede descomponer. Ejemplos Si 1= {1,2,3,4,5,6} entonces {1},{2},{3},{4},{5},{6} son eventos simples Si 2= {cc,cs,sc,ss} entonces{cc},{cs},{sc},{ss} son eventos simples Si 3 = {defectuoso, no defectuoso} entonces {defectuoso},{no defectuoso} son eventos simples

Evento compuesto Formado por más de un punto muestral. Ejemplos Si 1= {1,2,3,4,5,6} entonces A = {1, 3, 5} ó A: Obtener un número impar. Es un evento compuesto. Si 2= {cc,cs,sc,ss} entonces B= {cs,sc} ó B: obtener dos valores diferentes en las caras superiores de las dos monedas.

3.4 Operaciones con eventos Intersección La intersección de dos eventos A y B es el evento que ocurre si tanto A como B, ocurren en una sola realización del experimento. La intersección de los eventos A y B se denota mediante el símbolo A  B

Unión La unión de dos eventos A y B es el evento que ocurre si A o B, o ambos ocurren en una sola realización del experimento. La unión de los eventos A y B se denota mediante el símbolo A B

Eventos mutuamente excluyentes Son aquellos eventos donde la ocurrencia de uno de ellos excluye la ocurrencia del otro, esto es no pueden ocurrir los dos a la vez. Ejemplo En el experimento: Lanzamiento de un dado. Sean los eventos:

Estadística (Civil/Electrónica/Telecomunicaciones)

57

UPC

A: Resulta un número menor que 5.

B: Resulta un número par.

Obtenga la intersección y la unión de los eventos A y B ¿Son los eventos A y B mutuamente excluyentes?  = {1,2,3,4,5,6}

A = {1,2,3,4}

A B = {1,2,3,4,6}

A  B = {2,4}

y

B = {2,4,6}

AB ≠   Por tanto, los eventos no son mutuamente excluyentes. Ejemplo En el experimento : lanzamiento de dos dados, el espacio muestral es  = {(1,1), (1,2) (1,3), …….(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} Se definen los eventos: A: obtener una suma de seis B: obtener una suma de cinco

A = {(1,5), (5,1), (2,4), (4,2) (3,3)} B = {(1,4), (4,1), (2,3), (3,2)}

Estos eventos son mutuamente excluyentes, dado que ambos a la vez no pueden ocurrir, esto es AB = , es decir la intersección de los eventos no tienen elementos en común.

Ejercicio  Se realiza el siguiente experimento aleatorio : lanzamiento de dos dados de seis caras. Determine el espacio muestral.  Sean los eventos: A: suma de los dados es 8; B: suma de los dados mayor a 6 y C: suma de los dados menor a 9. Determine los elementos de los eventos.  Obtenga la intersección de los eventos A y B, la unión de los eventos B y C ¿Son los eventos A y C mutuamente excluyentes?

Estadística (Civil/Electrónica/Telecomunicaciones)

58

UPC

3.5 Probabilidad Sea  un experimento aleatorio,  el espacio muestral asociado, y sea A un evento definido en el espacio muestral ; la probabilidad del evento A es la medida del grado de posibilidad de ocurrencia del evento A cuando se realiza una vez el experimento. La probabilidad de un evento A será un número que denotaremos por P(A) y debe cumplir los siguientes axiomas: ii) 0  P(A)  1 iii) P() = 1 iv) Sea {Ai},Ai, i=1,2,3,..,n una sucesión de eventos mutuamente excluyentes, entonces n

P(A1A2A3…An) =

 P( A ) i 1

 

i

Si P(A) tiende a 0, es poco probable que el evento A ocurra. Si P(A) tiende a 1, es un muy probable que el evento A ocurra.

En un espacio muestral finito la suma de las probabilidades de todos los eventos simples Ei debe ser igual a 1. n

 P( E )  1 i 1

i

i  1,2,3,..., k

3.6 Definición clásica de la probabilidad de un evento Sea un experimento aleatorio cuyo correspondiente espacio muestral  está formado por un número n finito de posibles resultados distintos y con la misma probabilidad de ocurrir, entonces definimos la probabilidad de un evento A como sigue: P( A) 

n  A número de casos favorables al evento A  n   número total de casos

3.7 Eventos complementarios El complemento de un evento A es el evento en el que A no ocurre, es decir, el evento formado por todos los eventos simples que no están en el evento A. El complemento del evento A se denota mediante el símbolo Ac.

A  Ac = Ω La suma de las probabilidades complementarias es igual a 1.

P( A)  P( Ac )  1

Estadística (Civil/Electrónica/Telecomunicaciones)

59

UPC

3.8 Reglas de probabilidad para uniones e intersecciones Regla aditiva de la probabilidad La probabilidad de la unión de los eventos A y B es la suma de las probabilidades de los eventos A y B menos la probabilidad de la intersección de los eventos A y B: P( A  B)  P( A)  P( B)  P( A  B)

A

B A

B

A∩B

Ʊ

Regla aditiva para eventos mutuamente excluyentes Si dos eventos A y B son mutuamente excluyentes, la probabilidad de la unión de A y B es igual a la suma de las probabilidades de A y B: P( A  B)  P( A)  P( B)

Ejemplo El gerente de INGENIEROS METAC S.A.C., es una organización orientada a suministrar productos, servicios y desarrollo de soluciones de ingeniería aplicada, considera que la probabilidad de que los accidentes en Transmisiones & Ejes hayan sido ocasionados por las conexiones eléctricas es 0,24, por falla mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar un accidente producido en Transmisiones & Ejes y definiendo los eventos de interés: E = {Accidentes por conexiones eléctricas}, P ( E ) = 0,24 y P ( M ) = 0,18 a.

M = {Accidentes por falla mecánica}  P ( E  M ) = 0,39

Determine la probabilidad que se haya producido por ambos tipos de falla. P(EM)= P(E)+ P(M) -P(EM) 0,39 = 0,24 + 0,18 - P ( E  M ) P ( E  M ) = 0,03

Estadística (Civil/Electrónica/Telecomunicaciones)

b.

60

UPC

¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla? P ( E  M´ ) = P ( E) - P ( E  M ) = 0,24 - 0,03 = 0,21

o

P ( E´  M ) = P ( M) - P ( E  M ) = 0,18 - 0,03 = 0,15 P ( E  M´ ) + P ( E´  M ) = 0,36

Ejercicio Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el área de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un producto al azar. a. Determine la probabilidad de que se hayan producido ambos tipos de defectos.

b.

¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?

c.

¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

61

3.9 Principios fundamentales de conteo Comprende un conjunto de procedimientos que permiten determinar el número de resultados de un suceso o experimento sin necesidad de utilizar una enumeración e identificación directa de todos los posibles resultados de dicho suceso o experimento. Analicemos los siguientes experimentos aleatorios: 1: lanzamiento de un dado 1= {1,2,3,4,5,6} es fácil listar y contar los posibles resultados 2: números pares de tres cifras que se pueden formar con los dígitos 1,2,3,4,5,6,7,8,9 2= {174,148,184,198,194,144, …} ya no es fácil listar y contar los posibles resultados Ante esta situación es necesario utilizar técnicas que nos faciliten el conteo de estos posibles resultados. Principio de la multiplicación Si un procedimiento A puede realizarse de “m” maneras y otro procedimiento B puede realizarse de “n” maneras, entonces los dos procedimientos A y B (uno seguido del otro) ocurren de m x n maneras o formas. Ejemplo Un ensamblador de computadoras tiene 4 microprocesadores de diferentes marcas y 3 memorias de diferentes marcas ¿de cuántas maneras posibles puede ensamblar una computadora?

Principio de la adición Si un procedimiento A puede realizarse de “m” maneras y otro procedimiento B puede realizarse de “n” maneras, y si no es posible que ambos se realicen en forma simultanea entonces los dos procedimientos A o B ocurren de m + n maneras o formas. Ejemplo Un ingeniero de telecomunicaciones está proyectando un viaje a una provincia para instalar una antena parabólica, debe decidir el viaje por bus o por tren. Si hay tres rutas para el bus y dos para el tren ¿de cuántas maneras posibles puede realizar el viaje?

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

62

Técnica de conteo: Combinación Es una técnica que permite contar el número de maneras de seleccionar o elegir aleatoriamente “r” elementos de un total de “n”, sin considerar el orden de selección. Está dado por:

C

n r



n! r ! (n  r ) !

Ejemplo Un grupo de 20 ingenieros civiles igualmente capacitados forman el staff de una empresa constructora. Si se eligen al azar a 3 de ellos para participar en un proyecto, ¿de cuántas maneras posibles se pueden seleccionar a estos 3 ingenieros?

Ejercicios propuestos 1.

Una caja contiene 24 resistencias con etiqueta negra y 24 con etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el resto de 8 ohmios; mientras que los de etiqueta roja doce son de 5 ohmios y el resto de 8 ohmios: a) Si se selecciona una resistencia al azar de la caja, ¿cuál es la probabilidad que la resistencia sea de 8 ohmios? b) Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de igual color. c) Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5 ohmios y una de 8 ohmios?

2.

Dos ingenieros civiles denominados A y B se distribuyen al azar en tres oficinas enumeradas con 1, 2 y 3 respectivamente, pudiendo estar ambos en una misma oficina. ¿Cuál es la probabilidad de que dos oficinas se queden vacías?

3. En una competencia para construir una pared participan cuatro obreros A, B, C y D. Uno de

ellos necesariamente debe ganar. Si la probabilidad de que gane A es el doble de la de B, la de B es la mitad de C y la de D es el triple de A, ¿cuál es la probabilidad que gane A?

Estadística (Civil/Electrónica/Telecomunicaciones)

63

UPC

3.10 Probabilidad condicional Si A y B son dos eventos de un espacio muestral Ω, entonces, la probabilidad condicional de que ocurra el evento A dado B se determina por: P (A/B) =

𝑃(𝐴∩𝐵) 𝑃 (𝐵 )

, siendo P (B) > 0

Ejemplo Para ocupar un puesto de trabajo en el departamento de diseño de ingeniería de una compañía constructora de barcos, se han presentado postulantes, cuyas principales características se resumen en el siguiente cuadro: Años de experiencia Al menos tres años de experiencia (A) Menos de tres años de experiencia (B) Total

Egresado de ingeniería Mecánica (M) Industrial (I) 14 4 25 11 39

No egresado de universidad (N) 9 27

15

36

Total 27 63 90

El orden en que el gerente de la estación entrevista a los aspirantes es aleatorio. Determine la probabilidad de que el primer entrevistado por el gerente: a. Tenga menos de tres años de experiencia y sea egresado de ingeniería mecánica. 25

P ( B ∩ M) = 90 = 0,278 b. No sea egresado de universidad si se sabe que tiene menos de tres años de experiencia. 27 90 63 (90)

( )

P ( N / B) =

= 0,429

c. Tenga al menos tres años de experiencia dado que es egresado de ingeniería industrial. 4 90 15 (90)

( )

P ( A / I) =

= 0, 267

d. Sea egresado de ingeniería mecánica o tenga al menos tres años de experiencia. 39

P ( M U A ) = P ( M ) + P ( A ) - P ( M  A ) = 90 +

27 90



14 90

= 0,578

Estadística (Civil/Electrónica/Telecomunicaciones)

64

UPC

Ejercicio 17

La probabilidad que la construcción de un edificio termine a tiempo es 20 , la probabilidad que no 3 4

haya huelga es , y la probabilidad que la construcción se termine a tiempo dado que no hubo huelga 14

es ; la probabilidad que haya huelga y no se termine la construcción a tiempo es 15 eventos y calcule las siguientes probabilidades:

a. La construcción se termine a tiempo y no haya huelga.

b. No haya huelga dado que la construcción se terminó a tiempo.

c. La construcción no se termine a tiempo si hubo huelga.

1 10

, Defina los

Estadística (Civil/Electrónica/Telecomunicaciones)

65

UPC

d. La construcción no se termine a tiempo si no hubo huelga.

Regla multiplicativa de la probabilidad De la definición de probabilidad condicional, obtenemos la fórmula para hallar la probabilidad de la intersección (o producto) de los eventos A y B, esto es, de P( A  B)  P( A | B) P( B)  P( B A) P( A)

Ejemplo Si A y B son eventos tales que P(A) = 0.4,P(B) = 0.2 y P(A/B) = 0.5. Calcule: P(A  B) y P(Ac  B)

3.11 Eventos independientes Los eventos A y B son independientes si la ocurrencia de B no altera la probabilidad de que haya ocurrido A, es decir, los eventos A y B son independientes si:

P( A B )  P( A) Si dos eventos no son independientes, se dice que son dependientes.

Regla multiplicativa para eventos independientes Si los eventos A y B son independientes, la probabilidad de la intersección de A y B es igual al producto de las probabilidades de A y B, es decir, P( A  B)  P( A) P( B) Generalizando para los eventos independientes E1 , E2 , , Ek . P( E1  E2  ...Ek )  P( E1 ) P( E2 )

P( Ek )

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

66

Propiedades Si los eventos A y B son independientes, entonces también son independientes:  AC y BC esto es P(ACBC) = P(AC) P(BC)  AC y B esto es P(ACB) = P(AC) P(B)  A y BC esto es P(ABC) = P(A) P(BC) Esta propiedad se puede generalizar para más de dos eventos.

Leyes de Morgan P(AB)C = P(ACBC) P(AB)C = P(ACBC) Estas leyes se pueden generalizar para más de dos eventos. Ejemplo Un sistema electrónico está compuesto por tres subsistemas A, B y C, de tal manera que las probabilidades de fallar de cada uno son 0,15; 0,20 y 0,35. Si los subsistemas funcionan de manera independiente, definir los eventos y calcular: A = {El subsistema A falle} C = {El subsistema C falle} P(A) = 0,15 P(A´) = 0,85

B = {El subsistema B falle}

P(B) = 0,20 P(B´) = 0,80

P(C) = 0,35 P(C´) = 0,65

a. La probabilidad de que al menos uno de los subsistemas falle. S = {al menos uno de los sistemas falle}

S´ = {Ningún de los sistemas falle}

P(S) = 1- P (S´) = 1 - P ( A´∩B´∩C´) = 1 - P ( A´) * P(B´) * P(C´) P(S) = 1 – 0,85 * 0,80 * 0,65 = 0,558 b. La probabilidad de solo dos de los subsistemas funcionen. S2 = {sólo dos de los sistemas funcionen} P(S2) = P ( A´∩B∩C´) + P ( A∩B´∩C´) + P ( A´∩B´∩C) = P(S2) = P ( A´) *P(B) * P(C´) + P (A) * P(B´) * P(C´) + P (A´) * P(B´) * P(C) P(S2) = 0,85 *0,20 * 0,65 + 0,15 * 0,80 * 0,65 + 0,85 * 0,80 * 0,35 = 0,4265

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

67

Aplicación al sistema de componentes: Confiabilidad de Sistemas Podemos aplicar el concepto de la independencia de eventos al caso en que se tenga un sistema de componentes electrónicos acoplados en serie o en paralelo.

Sistema en serie: Un sistema de componentes acopladas en serie funciona si todos sus componentes funcionan. Sea 𝐹𝐴 = La componente A funciona; 𝐹𝐵 = La componente B funciona Para que el sistema funcione 𝐹𝑆 , ambos deben funcionar. P(𝑭𝑺 ) = P(𝑭𝑨∩ 𝑭𝑩 ) = P(𝑭𝑨) P(𝑭𝑩 )

Ejemplo El sistema funcionará sólo si ambos componentes funcionan. El componente A funciona con una probabilidad de 0.98 y el componente B funciona con una probabilidad de 0.95. Suponga que A y B funcionan de manera independiente. Determine la probabilidad que el sistema funcione.

P(FS ) = P(FA ∩ FB ) = P(FA ) P(FB ) = 0,98 * 0,95 = 0,931

Sistema en paralelo: Un sistema de componentes acoplada en paralelo funciona, si al menos una de sus componentes funciona. El sistema funcionará si alguno, C o D funcionan.

P(FS ) = P(FA ∪ FB ) = P(FA ) + P(FB ) − P(FA ∩ FB ) P(FS ) = P(FA ∪ FB ) = P(FA ) + P(FB ) − P(FA )P( FB ) P(FS ) = 1 - P(NFA ) P(NFB )

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

68

Ejemplo Los componentes C y D funcionan con una probabilidad de 0,90 y 0,85 respectivamente. Suponga que C y D funcionan de manera independiente. Determine la probabilidad de que el sistema funcione.

P(FS ) = 1 - P(NFA ) P(NFB ) = 1 – 0,10 * 0,15 = 0,985

Ejercicio Un sistema eléctrico consta de cuatro componentes. El sistema funciona si los componentes A y B funcionan, y si funciona cualquiera de los componentes C o D. La confiabilidad (probabilidad de que funcionen) de cada uno de los componentes también se muestra en la figura. Suponga que los cuatro componentes funcionan de manera independiente.

Calcule las siguientes probabilidades: a. Que el sistema completo funcione.

Estadística (Civil/Electrónica/Telecomunicaciones)

69

UPC

b. Que el componente C no funcione, dado que el sistema completo funciona.

3.12 Probabilidad Total y el Teorema de Bayes Probabilidad Total Sean los eventos A1 , A2 ,..., Ak ,los cuales forman una partición del espacio muestral  mutuamente excluyentes y exhaustivos y sea E otro evento cualquiera de , se cumple:

P( E )  P( A1 ) P( E / A1 )  P( A2 ) P( E / A2 )  .........  P( Ak ) P( E / Ak ) Donde a la P(E) se le conoce como la probabilidad total.

Teorema de Bayes Si los eventos A1 , A2 ,..., Ak , constituyen una partición del espacio muestral , entonces para cualquier evento E de  la P(Ai|E) es:

P( Ai | E )  P( Ai | E ) 

P( Ai  E ) P( E )

para i  1, 2 ,, k

P( Ai ) P( E Ai ) P( A1 ) P( E A1 )  P( A2 ) P( E A2 )  ...  P( Ak ) P( E Ak )

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

70

Ejemplo Una cadena de tiendas de suministros de construcción vende tres marcas diferentes de teodolitos. De sus ventas de teodolitos, 50% son de la marca 1 (la menos cara), 30% son de la marca 2 y 20% son de la marca 3. Cada fabricante ofrece 1 año de garantía en las partes y mano de obra. Se sabe que 25% de los teodolitos de la marca 1 requieren trabajo de reparación dentro del periodo de garantía, mientras que los porcentajes correspondientes de las marcas 2 y 3 son 20% y 10%, respectivamente. Definamos los eventos: Ai = {Marca “i” adquirida} con i = 1,2,3 B = {Necesita Reparación} B’ = {No necesita reparación} Con el diagrama del árbol:

a. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya adquirido un teodolito marca 1 que necesitará reparación mientras se encuentra dentro de garantía? P(A1∩B) = P(B|A1)*P(A1) = 0,125 b. ¿Cuál es la probabilidad de que un comprador seleccionado al azar haya comprado un teodolito que necesitará reparación mientras se encuentra dentro de garantía? P(B) = P(marca 1 y reparación) ó P(marca 2 y reparación) ó P(marca 3 y reparación) = P(A1∩B) + P(A2∩B) + P(A3∩B) = P(B|A1)*P(A1) + P(B|A2)*P(A2) + P(B|A3)*P(A3) =0,125 + 0,06 + 0,020 = 0,205

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

71

c. Si un cliente regresa a la tienda con un teodolito que necesita reparación dentro de garantía, ¿cuál es la probabilidad de que sea un teodolito marca 1? ¿Un teodolito marca 2? ¿Un teodolito marca 3? P(A1| B) =

𝑃(𝐴1 ∩𝐵) 𝑃(𝐵)

=

0,125 0,205

= 0,6098

P(A2| B) = =

𝑃(𝐴2 ∩𝐵) 𝑃(𝐵)

=

0,060 = 0,205

P(A3| B) = =

𝑃(𝐴3 ∩𝐵) 𝑃(𝐵)

=

0,125 0,205

0,2927

= 0,0976

Ejercicio 1. Una empresa se encuentra estudiando la posibilidad de importar para el próximo año un nuevo modelo de celular de última generación. Al estudiar la situación económica del próximo año se contemplan tres posibilidades: inflación, estabilidad o crecimiento, estimando dichas alternativas con las siguientes probabilidades: 0,55; 0,35 y 0,10 respectivamente. La probabilidad de importar el nuevo modelo de celular es 0,25 si existiera inflación, 0,40 si existiera estabilidad y 0,65 si existiera crecimiento. Presente el diagrama del árbol y defina los eventos

a.

¿Cuál es la probabilidad de importar el nuevo modelo de celular para el próximo año?

Estadística (Civil/Electrónica/Telecomunicaciones)

b.

UPC

72

Asumiendo que la empresa decidió importar el nuevo modelo de celular, ¿cuál es la probabilidad que existiera inflación en la economía?

2. Consideremos que tres máquinas Alpha, Beta y Gamma producen respectivamente el 50%, el 30% y el 20% del número total de artículos de una fábrica. Si la proporción de artículos defectuosos que produce cada una de estas máquinas es 0,03 0,04 y 0,05 respectivamente y se selecciona un artículo aleatoriamente: Presente el diagrama del árbol y defina los eventos

a. Calcule la probabilidad de que el artículo sea defectuoso.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

73

b. Calcula la probabilidad de que el artículo seleccionado al azar haya sido producido por la máquina Alpha o la máquina Beta, si se sabe que este es defectuoso.

c. Si se seleccionan cinco artículos, ¿cuál es la probabilidad que sólo dos sean defectuosos?

Ejercicios propuestos 1.

Una empresa vende tres tipos de maquinaria pesada para la industria textil A, B y C. El 70% de las máquinas son del tipo A, el 20% del tipo B y el 10% son del tipo C. Las máquinas A tienen una probabilidad de 0,10 de producir una pieza defectuosa a lo largo de un año, las máquinas B tienen una probabilidad de 0,30 y las máquinas C tienen una probabilidad 0,60 de producir una de tales piezas defectuosas a lo largo de un año. Una de estas máquinas ha estado funcionando durante un año de prueba y ha producido una pieza defectuosa. ¿De cuál tipo de máquina es más probable que provenga la pieza defectuosa?

2.

Durante la época de exámenes, en cierto colegio, sólo 25% de los profesores advierten por escrito a sus alumnos que no está permitido levantarse a preguntar durante la prueba. No obstante, se ha observado que a pesar de esa advertencia 20% de los estudiantes lo hacen. Para los mentores que no establecen dicha advertencia, la cifra correspondiente es de 70%. Si durante una prueba a cargo del profesor Jaime, de pronto irrumpe un inspector en el salón y observa que hay alumnos que quebrantan la regla, ¿cuál es la probabilidad de que ese profesor no haya advertido por escrito que se prohíbe hacer preguntas en los exámenes?

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

74

3. Considere el sistema de componentes electrónicos conectados como se muestra en la figura.

Los componentes funcionan de manera independiente uno del otro, y la probabilidad de que cada componente funcione es 0,90; ¿cuál es la probabilidad de que el sistema electrónico funcione?

4.

Se tiene un sistema antiguo compuesto de varios componentes que funcionan en forma independiente y la probabilidad de falla de cada componente es 0,4. Para que el sistema funcione basta que funcione al menos uno de los componentes, ¿cuántos componentes debe tener el sistema para tener una probabilidad de 0,98 de que el sistema funcione?

5.

Electronic Systems Company que brinda soporte especializado en la instalación de redes con Tecnología LAN o WAN en diferentes empresas, sabe que el 15% de las empresas prefieren como medio físico de transporte los cables de cobre de par trenzado, el 35% prefiere los cables coaxiales, el 40% fibras ópticas y 10% el aire. Además, si la empresa elige los cables de cobre de par trenzado como medio físico la probabilidad que elija la Tecnología WAN es 0,62; las empresas que eligen cables coaxiales tienen una probabilidad de 0,45 de elegir la Tecnología LAN; las empresas que eligen la fibra óptica tiene una probabilidad de 0,55 de elegir la Tecnología WAN y las empresas que eligen el aire como medio físico de transporte tienen una probabilidad de 0,5 de elegir la Tecnología LAN. a. Calcule la probabilidad que una empresa elija para su Red la Tecnología LAN. b. Si se selecciona al azar una empresa que utiliza Tecnología WAN, ¿cuál es la probabilidad que utilice como medio físico de transporte cables de cobre de par trenzado?

6.

Si la probabilidad de que cada llave esté cerrada dejando pasar corriente es p=0,6 y las llaves se cierran y se abren en forma independiente, calcular la probabilidad de que pase corriente de I hacia O en el siguiente circuito:

Estadística (Civil/Electrónica/Telecomunicaciones)

75

UPC

Unidad 4 Variable aleatoria y distribución de probabilidad Logro de la unidad Al término de la Unidad 4, el estudiante discrimina la distribución de probabilidad a utilizar en los diferentes casos de aplicación.

4.1 Variable aleatoria Sea Ω un espacio muestral. Una variable aleatoria es una función X, que transforma cada resultado w del espacio muestral en un número real X(w). El rango de la variable aleatoria X es el conjunto RX de todos sus posibles valores.

Ejemplo Al lanzar dos monedas para registrar los posibles resultados se obtiene el espacio muestral siguiente.

 = {cc, cs, sc, ss} Si ahora definimos la variable aleatoria X como número de caras que se obtiene, entonces a cada resultado de, es posible asignarle un número real de la siguiente manera:    

S

cc, se le asigna el número real 2 cs, se le asigna el número real 1 sc, se le asigna el número real 1 ss, se le asigna el número real 0

•CC •CS •SC •SS

R 2 1 0

Estadística (Civil/Electrónica/Telecomunicaciones)

76

UPC

Clasificación de variables aleatorias Discreta: Si su rango es un conjunto finito o infinito numerable. Ejemplos: a. Número de circuitos electrónicos producidos por una empresa que cumplen con las especificaciones técnicas. b. Número de llamadas que recibe una central telefónica. Continua: Si su rango es un conjunto infinito no numerable. Ejemplos: c. Resistencia a la ruptura de un material plástico (onzas por pulgada cuadrada). d. Resistencia transversal de los ladrillos fabricados por una empresa (MN/m2).

4.2 Variables aleatorias discretas Sea X una variable aleatoria discreta.

Función de probabilidad de una variable aleatoria discreta La probabilidad de que la variable aleatoria tome un valor genérico igual a x, se denotará de la siguiente manera.

f x   P( X  x)

La función de probabilidad de X debe cumplir las siguientes condiciones:  

f ( x)  0

 f ( x)  1 Rango X

Ejercicio El ingeniero de producción de la empresa Tecnotronics S.A. ha determinado que la distribución de probabilidades del número de artículos defectuosos por lote es la siguiente: x

0

1

2

3

4

f(x)

0.25

a

0.10

0.25

0.25

a. Encuentre el valor de la constante “a” para que la distribución sea de probabilidad. b. Calcule la probabilidad de encontrar menos de 2 artículos defectuosos por lote. c. Si el lote tiene 2 o más artículos defectuosos, es considerado “malo” ¿cuál es la probabilidad que el lote sea malo?

Estadística (Civil/Electrónica/Telecomunicaciones)

77

UPC

d. Si el número de artículos defectuosos por lote es al menos 1, calcule la probabilidad de que el número de artículos defectuosos sea menor que 3. Solución:

 f ( x)  1

a. Para hallar el valor de la constante “a”, usaremos la siguiente condición:

Rango X

0,25 + a + 0,10 + 0,25 + 0,25 = 1 →

a = 0,15

b. P (X < 2) = P(X = 0) + P(X = 1) = 0,25 + 0,15 = 0,40 c. P(Lote sea malo) = P (X ≥ 2) = 1 – P(X < 2) = 1 – 0,40 = 0,60 d. P(X < 3 / X ≥ 1) =

𝑃(𝑥=1)+𝑃(𝑥=2) 1−𝑃(𝑥=0)

=

0,15+0,10 1−0,25

= 0,3333

Ejercicio El departamento de control de calidad de una empresa selecciona al azar diariamente tres bombillas de un lote que contiene 20 bombillas, para decidir si acepta el lote y los pasa al departamento de producción o rechaza el lote y los devuelve al proveedor. a. Construya la distribución de probabilidad del número de bombillas defectuosas que se encuentra en la muestra, si el muestreo es sin reposición y bajo la suposición que el lote contiene 2 bombillas defectuosas. X: Numero de bombillas defectuosas encontradas en la muestra. Rx = { } Debido a que las bombillas son escogidas con reposición la probabilidad de que salga defectuoso o no defectuoso permanece constante. D = bombilla defectuosa C

D = bombilla no defectuosa

P(D) = P(B) =

P(X=0) = P(X=1) = P(X=2) = Finalmente, colocamos los resultados en el cuadro de distribución de probabilidades.

X f(X)

0

1

2

Estadística (Civil/Electrónica/Telecomunicaciones)

78

UPC

b. Si la regla de decisión es: Rechazar el lote si en la muestra se encuentra más de un artículo defectuoso. ¿Cuál es la probabilidad de Rechazar un lote?

c. En relación a la regla planteada en (b), si el lote es aceptado, ¿cuál es la probabilidad que la muestra contenga un defectuoso?

Esperado de una variable aleatoria discreta Sea X una variable aleatoria discreta con función de probabilidad f(x). Entonces el valor esperado o medio de X es:

  E( X ) 

 xf ( x) Rango x

Esperado de una función de X Sea X una variable aleatoria discreta con función de probabilidad f(x), y sea g(x) una función de la variable X. Entonces, el valor esperado o medio de g(x) es:

E g ( x)  

 g ( x) f ( x) Rango x

Propiedades del valor esperado El valor esperado tiene ciertas propiedades que se presentan a continuación, las cuales son de bastante utilidad. Sean a y b constantes cualesquiera y sea X una variable discreta. Entonces: E(a) = a E(bX) = bE(X) E(a + bX) = a + bE(X) Sean g1 ( x),..., g k ( x) funciones de X, E[g1(x)+ …+ gk(x)] = E[g1(x)]+ …+ E[gk(x)]

Estadística (Civil/Electrónica/Telecomunicaciones)

79

UPC

Varianza de una variable aleatoria Sea X una variable discreta con función de probabilidad f(x). Entonces, la varianza de X es: 𝜎 2 = V(X) = E[X - 𝜇]2 = E(X2) - 𝜇2

Formula abreviada para el cálculo de la varianza: V(X) = E(X2) – [E(X)]2 Dónde: E(X2) = ∑ 𝑋 2 𝑓(𝑋) La desviación estándar de X es la raíz cuadrada positiva de la varianza de X

  2 Propiedades de la varianza Sean a y b dos constantes cualesquiera y sea X una variable discreta. Entonces: V(a) = 0 V(bX) = b2 V(X) V(a + bX) = b2 V(X) Ejemplo El número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado se considera una variable aleatoria, que tiene la siguiente función de probabilidad: x

0

1

2

3

P(X = x)

0,38

0,24

k

0,08

a. Calcule e interprete el valor esperado de X. b. Calcule la desviación estándar de X. c. Si por cada falla eléctrica se estima que la región pierde aproximadamente 14300 dólares, ¿cuál es la pérdida esperada? Solución En primer lugar hallaremos el valor de k para que la distribución sea función de probabilidad: 0,38 + 0,24 + k + 0,08 = 1 a. E(X) = 0*0,38 + 1*0,24 + 2*0,3 + 3*0,08 = 1,08



k = 0,3

Estadística (Civil/Electrónica/Telecomunicaciones)

80

UPC

Si el experimento se repitiera muchas veces, en promedio el número de fallas de energía eléctrica que afectan a cierta región en cualquier año dado, sería de 1.08.

b. Para calcular la varianza usaremos la formula abreviada: V(X) = E(X2) – [E(X)]2 E(X2) = 02*0,38 + 12*0,24 + 22*0,3 + 32*0,08 = 2,16 V(X) = 2,16 – [1,08]2 = 0,9936 c. Perdida = 14300X



E(Perdida) = 14300 E(X) = 14300*1,08 = 15444

Ejemplo Un ingeniero civil del departamento de obras, muestra la distribución de probabilidad de la variable aleatoria X= Nº de habitaciones a construir en edificios residenciales. x

4

5

7

8

9

f(x)

0,20

0,25

0,10

0,15

0,30

a. Si la gerencia del departamento de obras le impone que construya menos de ocho habitaciones y suponiendo que se cumple con este requerimiento, ¿cuál es la probabilidad que construya por lo menos cinco habitaciones? P (X ≥ 5 / X < 8) = 0,35/0,55= 0,6364 b. Si el precio Q en soles de una vivienda en un edificio residencial está dado por la función Q = 14 600 X +1000 ¿Cuánto esperaría pagar un cliente por una vivienda? E (X) = 6,65 E (Q) = 14 600 E(X) + 1000 = 14 600 (6,65) + 1000 = 98 090 Un cliente esperaría pagar por una vivienda 98 090 soles. Ejercicios 1.

Según el departamento de control de calidad de una empresa fabricante de tornillos, el número de fallas superficiales en los tornillos corresponde a una variable aleatoria X con E (X) = 0.88 por tornillo. Además se sabe que la función de probabilidad está dada por: x

0

1

2

3

4

f(x)

a

0,37

0,16

b

0,01

a. ¿Cuál es la probabilidad de que un tornillo presente al menos 2 fallas? b. Calcule la varianza y el coeficiente de variación de X.

Estadística (Civil/Electrónica/Telecomunicaciones)

2.

81

UPC

Una librería necesita hacer el pedido semanal de una revista especializada de ingeniería. Por registros históricos, se sabe que las frecuencias relativas de vender una cantidad de ejemplares es la siguiente: Demanda de ejemplares Frecuencia relativa

1

2

3

4

5

6

1/15

2/15

3/15

4/15

3/15

2/15

a. Calcule la media y varianza de la demanda de ejemplares. b. Pagan S/. 5 por cada ejemplar y lo venden a S/. 10. De mantenerse las condiciones bajo las que se registraron los datos y si las revistas que quedan no tienen valor de recuperación, ¿cuántos ejemplares de revista se debería solicitar. 3. Enigma S.A. produce artículos perecibles. A continuación se presenta una tabla con los datos

históricos de las demandas semanales obtenidas en las últimas 50 semanas y el número de semanas de ocurrencia: Número de productos demandados Número de semanas

2 000

3 000

4 000

5 000

15

20

10

5

a. Si la compañía decide programar la producción de dicho artículo tomando exactamente el valor esperado de la demanda, ¿cuántas unidades de dicho artículo debe producir la compañía semanalmente? b. Si cada unidad tiene un costo de S/. 5 y se vende a S/. 10. Si el producto no se vende durante la semana siguiente a la producida, se debe rematar a un precio de S/. 2,5. Todos los productos ofrecidos en remate se venden, ¿cuántas unidades debe producirse semanalmente la compañía para maximizar su utilidad esperada? 4.

Un contratista debe elegir entre dos trabajos. El primero promete un beneficio de S/. 80 000 con una probabilidad de 0,75 o una pérdida de S/. 20 000 con una probabilidad de 0,25. El segundo trabajo promete un beneficio de S/. 120 000 con una probabilidad de 0,5 o una pérdida de S/. 30 000 con una probabilidad de 0,5. a. ¿Qué trabajo recomendaría al contratista si éste quiere maximizar su beneficio? b. ¿Qué trabajo debería elegir el contratista si su negocios van mal y para no quebrar necesita un beneficio mínimo de S/. 100 000 en el siguiente trabajo?

Estadística (Civil/Electrónica/Telecomunicaciones)

82

UPC

4.3 Distribuciones especiales discretas Distribución binomial El experimento consiste de n pruebas idénticas de Bernoulli. Cada prueba tiene únicamente dos resultados: éxito o fracaso. P(éxito)=p y P(fracaso)=1-p se mantiene constante a lo largo de todas las pruebas. Las pruebas son independientes. La probabilidad del evento considerado como “éxito” es constante en cada prueba y se denota por p. La variable aleatoria binomial se define como: Número de éxitos que ocurren en los n ensayos o pruebas. La función de probabilidad de X es:

f  x   P( X  x)  Cxn p x 1  p 

n x

,

x  0, 1, 2, ... , n

Donde: n: Numero de ensayos o pruebas p: Probabilidad de éxito en cada ensayo 1 – p: Probabilidad de fracaso Notación: Si la variable aleatoria X sigue una distribución binomial con parámetros n y p se denota: X ~B (n, p) Media

 = E(X) = np

Varianza

2 = Var(X) = np(1-p)

Ejemplo El supervisor de una obra ha determinado que un proveedor entrega los pedidos a tiempo alrededor del 94% de las veces. Para su última obra, el supervisor seleccionó una muestra de 12 pedidos. a. Calcule la probabilidad de que el proveedor entregue por lo menos 11 pedidos a tiempo. b. Calcule el valor esperado del número de pedidos entregados a tiempo. Solución: X: Número de pedidos entregados a tiempo en una muestra de 12 pedidos X ~ B (n = 12, p = 0,94)

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

a) P(X ≥ 11) = P(X = 11) + P(X = 12) = (1 − 0.94)0 = 0,000

83

12 10 𝐶11 ∗ 0.9411 ∗ (1 − 0.94)1 + 𝐶12 ∗ 0.94112 ∗

b) E(X) = n*p = 12*0.94 = 11.28 = 11 Ejercicio En un proceso de fabricación se produce unidades pre coladas con un 1% de unidades defectuosas. Todos los días se someten a prueba 10 unidades seleccionadas al azar de la producción diaria. Si existen fallas en una o más de estas unidades se detiene el proceso de producción. La variable aleatoria X se define: X: X~ a. ¿Cuál es la probabilidad de encontrar dos unidades defectuosas?

Respuesta: 0,00415 b. ¿Cuál es la probabilidad de detener el proceso?

Respuesta: 0,0956 c. Calcule el valor esperado y la desviación estándar del número de unidades no defectuosas.

Respuesta: 9,9 y 0,3146

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

84

Distribución hipergeométrica El experimento consiste en extraer al azar y sin reposición n elementos de un conjunto de N elementos, r de los cuales son éxitos y (N -r) son fracasos. Las pruebas son independientes entre sí. Las pruebas presentan la misma condición, es decir que cada resultado solo puede tener dos posibles resultados: Éxito o Fracaso La probabilidad de éxito cambia en cada ensayo. La variable aleatoria hipergeométrica se define como: Número de éxitos que ocurren en los n ensayos o pruebas. La función de probabilidad de X es:

f ( x)  P  X  x  

Cxr CnNxr CnN

x  max[0, n  ( N  r )],..., min(r , n)

Donde: N: Tamaño de la población r : Numero de éxitos en la población n : Numero de ensayos o tamaño de la muestra x : Numero de éxitos en la muestra Notación: Si la variable aleatoria X sigue una distribución hipergeométrica con parámetros N, r y n, se denota: X ~H (N, n, r) r Media   EX   n N Varianza

 2  V X   n

r r  N  n  1    N  N  N  1 

Ejemplo Una compañía de transporte tiene una flota de 24 camiones. Dentro de la política ambiental de la compañía, cada mes selecciona al azar seis camiones y mide los niveles de contaminación. a. ¿Cuál es la probabilidad de que dos de los camiones elegidos emitan cantidades excesivas de contaminación? Suponga que en verdad cuatro camiones de la flota emiten cantidades excesivas de contaminación. b. Si en la muestra elegida al menos dos emiten cantidades excesivas de contaminación, la compañía decidirá que toda la flota debe pasar una revisión técnica, ¿qué tan probable es que los 24 camiones pasen la revisión técnica, manteniendo la suposición de la parte a?

Estadística (Civil/Electrónica/Telecomunicaciones)

85

UPC

c. ¿Qué tan probable es que toda la flota pase la revisión técnica si en verdad ocho camiones de la flota emiten cantidades excesivas de contaminación? Solución: X: Número de camiones que emiten cantidades excesivas de contaminación de n = 6 camiones X ~ H (N = 24, r = 4, n = 6) a. P(X = 2) =

𝐶24 ∗𝐶420 𝐶624

= 0,21598

b. P(revisión técnica) = P(X≥2) = 1 – P(X≤1) = 1– [

𝐶04 ∗𝐶620 𝐶624

+

𝐶14 ∗𝐶520 𝐶624

] = 1 – 0,748730 = 0,25127

c. X ~ H (N = 24, r = 8, n = 6) d. P (revisión técnica) = P(X ≥ 2) = 1 – P (X ≤ 1) = 1– [

𝐶08 ∗𝐶616 𝐶624

+

𝐶18 ∗𝐶516 𝐶624

] = 1 – 0,319118 = 0,680882

Ejercicio Durante una semana, una empresa fabrica 50 radiotransmisores de alta frecuencia. Por histórico se sabe que el 20% de los radiotransmisores fabricados presentan por lo menos una falla y el resto operan sin problemas. El departamento de control de calidad realiza inspecciones rigurosas cada semana que consiste en selecciona al azar una muestra de cinco radiotransmisores. La variable aleatoria X se define X: X~ a. ¿Cuál es la probabilidad de que tres presenten al menos una falla?

Respuesta: 0,04418

Estadística (Civil/Electrónica/Telecomunicaciones)

86

UPC

b. Se rechazará todo el lote para la venta si la muestra presenta por lo menos cuatro radiotransmisores con al menos una falla, ¿qué tan probable es que se rechace el lote?

esta: 0,00408

Distribución Poisson El experimento consiste en realizar el conteo del número X de veces que ocurre un evento en particular durante una unidad de tiempo, área, volumen, peso, distancia o cualquier otra unidad de medida dada. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área, etc.; es la misma para todas las unidades. El número de eventos que ocurren en una unidad de tiempo, área, volumen es independiente del número de los que ocurren en otras unidades. La variable aleatoria Poisson se define como: Número de veces que ocurre un evento durante un intervalo definido La función de probabilidad de X es:

f ( x)  P X  x  

e  x x!

x  0,1, 2, 3,...

Donde: e: Base del sistema de logaritmos neperianos

 : Media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo particular Notación: Si la variable aleatoria X sigue una distribución Poisson con parámetro  se denota: X ~ P (  ) Media Varianza

  EX   

 2  V X   

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

87

Ejemplo En la inspección del pavimento y asfalto de una carretera recién construida se ha detectado que hay, en promedio 1,25 baches o fisuras cada cuatro kilómetros. Asumiendo una distribución de Poisson, determine: a. La probabilidad de que en el siguiente kilómetro se encuentre dos baches o fisuras. b. La probabilidad de que en los siguientes dos kilómetros se encuentre a lo más tres baches o fisuras. c. El costo de reparación de estos defectos es de $35 por cada bache o fisura detectado. ¿Cuál será el costo esperado al inspeccionar 80 km de esta carretera? Solución a. X: Número de baches o fisuras cada kilómetro X ~ Poisson (λ= 0,3125) P(X=2) =

𝑒 −0.3125 ∗0.31252 2!

= 0,03572

b. X: Número de baches o fisuras cada dos kilómetro X ~ Poisson (λ= 0.625) P (X ≤ 3) = P(X=0) + P(X=1) + P(X=2) + P(X=3) = 0,9961

c. X: Número de baches o fisuras en 80 kilómetros X ~ Poisson (λ= 25) Costo = 35*X E (Costo) = 35*25 = $ 875

Ejercicio Con la finalidad de diseñar un nuevo sistema de control de tráfico, un ingeniero recoge información sobre el número de automóviles que llegan a una intersección. Por histórico se sabe que en promedio llegan cuatro autos a la intersección cada minuto según un proceso de Poisson. La variable aleatoria X se define: X: X~

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

88

a. ¿Qué probabilidad hay de que en 30 segundos lleguen tres autos?

Respuesta: 0,18045 b. ¿Qué probabilidad hay de que entre las 5:25 pm y 5:28 pm el número lleguen menos de dos autos?

Respuesta: 1 c. Si en un minuto llegaron más de tres autos, ¿cuál es la probabilidad que como máximo sean cinco los autos que llegaron en ese minuto?

Respuesta: 0,620726 Ejercicio Cierto tipo de azulejo puede tener un número X de puntos defectuosos con media de 3 puntos defectuosos por azulejo. a) Calcule la probabilidad de que haya 5 defectos en un azulejo elegido al azar.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

89

b) El precio del azulejo es $1,5 si el azulejo no tiene ningún defecto, si tiene uno a dos fallas se vende en $0,90 y si tiene más de dos defectos se remata en $0,20. Calcule el precio esperado por azulejo.

Ejercicios 1. Un cierto sistema mecánico contiene componentes y se han seleccionado al azar 10. Suponga que la probabilidad de que cualquier componente individual falle es de 0,07 y que los componentes fallan independientes unos de otros. a) ¿Cuál es la probabilidad de que falle al menos uno de los componentes? b) ¿Cuál es la probabilidad de que fallen exactamente 2 componentes? c) ¿Cuál es la probabilidad de que fallen entre 2 y 5 componentes? d) Obtenga el E(X) y V(X) 2. Un fabricante de piezas para automóviles garantiza que cada caja de piezas fabricadas por su empresa contiene como máximo 3 piezas defectuosas. Si cada caja contiene un total de 20 piezas y la experiencia ha mostrado que en el proceso de manufactura se produce el 2% de las piezas defectuosas. ¿Cuál es la probabilidad de que cada caja de piezas satisfaga esta garantía? 3. Un comerciante recibe para su venta, cierto tipo de artículo en cajas que contienen 10 unidades de los cuales 3 artículos son defectuosos. El control de calidad por caja consiste en extraer una muestra de 4 artículos uno por uno sin reposición y aceptar la caja si la muestra contiene a lo más un defectuoso. Calcular la probabilidad de rechazar una caja. 4. En un lote de 8 productos, sólo 5 de éstos cumplen con las especificaciones técnicas requeridas. Si de ese lote se escogen 3 productos al azar y sin reposición, calcule la probabilidad de que 2 cumplan con las especificaciones técnicas. 5. Un distribuidor mayorista recibe diariamente un lote de 20 refrigeradoras de las cuales ocho son de color blanco y las restantes de color plata. Un comerciante minorista le solicita, también diariamente, seis refrigeradoras. Suponiendo que las refrigeradoras se seleccionan al azar. a) ¿Cuál es la probabilidad de que, en un día cualquiera, el número de refrigeradoras de color blanco seleccionadas sea más de tres? b) ¿Cuál es la probabilidad que, para los siguientes cinco días, como máximo en dos días, el minorista reciba exactamente tres refrigeradoras de color plata? Suponer independencia. 6. En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, cuatro de la marca A y el resto de marcas menos conocidas. Si un empleado selecciona al azar cinco

Estadística (Civil/Electrónica/Telecomunicaciones)

90

UPC

tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad de que en las cinco tostadoras seleccionadas: a) Existan exactamente dos de la marca A. b) A lo sumo haya una tostadora de las marcas menos conocidas. 7. El número de averías semanales de una cierta máquina de una fábrica es una variable aleatoria con distribución de Poisson con media 0,3. a) ¿Cuál es la probabilidad de que la máquina tenga a lo más dos averías en una semana? b) Si se tienen 5 de estas máquinas. ¿Cuál es la probabilidad de que al menos 2 de estas no tengan averías en dos semanas? 8. En un estudio del tránsito en cierta intersección, se determinó que el número de automóviles que llegan a un ovalo tiene distribución de Poisson con media igual a 5 automóviles por segundo. a) ¿Cuál es la probabilidad de que en un segundo lleguen al ovalo más de dos automóviles? b) Calcule la probabilidad de que en los siguientes 10 segundos lleguen al ovalo 40 automóviles. c) Suponga que el 90% de vehículos que llegan diariamente al ovalo mencionado son de transporte privado. Para los siguientes 5 días, calcule la probabilidad de que lleguen al ovalo por lo menos tres vehículos de transporte privado.

4.4 Variables aleatorias continuas Sea X una variable aleatoria continua.

Función de densidad de una variable continua Se denomina función de densidad f(x) de una variable aleatoria continua X a la función f(x) integrable que satisface: f(x)

f ( x)  0 

 f ( x)dx  1



b

P(a  X  b)   f ( x)dx a

a

b

Ejemplo Sea K una constante y consideremos la función de densidad de la vida útil, en años, de cierto tipo de computadora:

kx 0  x  2 f ( x)   c.c. 0

Estadística (Civil/Electrónica/Telecomunicaciones)

91

UPC

a. Obtenga el valor de k, para que f(x) sea función de densidad. b. Calcule la P(0,5 < X < 1,8) c. Calcule la P(X > 1) Solución a. Para que f(x) sea función de densidad debe de satisfacer la siguiente condición: 2

∫0 𝑘𝑥𝑑𝑥 = 1

2

K ∫0 𝑥𝑑𝑥 = 1

k(2) = 1

k=½

1  x 0 x2 f ( x)   2 0 c.c. 1.8 1

b. P(0,5 < X < 1,8) = ∫0.5 2 𝑥𝑑𝑥 = 0,7475 21

c. P(X > 1) = ∫1 2 𝑥𝑑𝑥 = 0,75 Ejercicio El gerente de la empresa le informa al departamento de Control de Calidad que uno de los principales clientes de la empresa ha exigido que las bombillas LED tengan como mínimo un tiempo de encendido continuo de 2100 horas. La distribución de densidad del tiempo de encendido continúo (en miles de horas) que obtuvo la empresa es la siguiente: 1 𝑓(𝑥) = {6 (17 − 𝑥) 0

1,8 ≤ 𝑥 ≤ 2,2 𝑐𝑐

a. ¿Cuál es la probabilidad de que el departamento de Control de Calidad pueda cumplir con la exigencia del cliente?

b. ¿Cuál es la probabilidad de que el tiempo de encendido sea superior a 2000 horas?

Estadística (Civil/Electrónica/Telecomunicaciones)

92

UPC

Función de distribución acumulada La función de distribución acumulativa F(x) para una variable aleatoria continua X se define: x

F ( x)  P( X  x) 

 f t  dt



Si F(x) es la función de distribución acumulativa para una variable aleatoria continua X, entonces la función de densidad f(x) para X es:

f ( x) 

dF ( x) dx

Propiedad de la Función de distribución acumulada

P ( x1  X  x2 )  F ( x2 )  F ( x1 )

Ejemplo El tiempo, en minutos, que un tren se retrasa es una variable aleatoria continua X con la siguiente función de densidad:

 3 (25  x 2 ) 0  x  5  f ( x)   250  0 c.c.  a. Determine la función acumulada F(X) b. Calcule P(X > 2) haciendo uso de la función acumulada. c. Calcule P(1.5 < X < 3.5) haciendo uso de la función acumulada. Solución a. Para hallar la función acumulada F(X) seguiremos los siguientes pasos:  F(X) = 0



Si X ≤ 0



Si 0 < X < 5  F(X) = ∫0



Si X ≥ 5

𝑥 3 (25 − 250



F(X) = 1

𝑥 2 )𝑡𝑑𝑡 =

75𝑥− 𝑥 3 250

Estadística (Civil/Electrónica/Telecomunicaciones)

93

UPC

Finalmente, 0

75𝑥− 𝑥 3 250

F(x) = { 1

x ≤ 0 0 < x < 5 x ≥ 5 75(2)−23 ] 250

b. P(X > 2) = 1 – P(X ≤ 2) = 1 – F(2) = 1 – [

c. Calcule P(1,5 < X < 3,5) = F(3.5) – F(1.5) =

= 0,432

75(3.5)−3.53 250



75(1.5)−1.53 250

= 0,442

Ejercicio Los sondeos de mercado realizados por un fabricante sobre la demanda de un producto indican que la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas. La función de densidad de X está dada por: f (x) 

3x 25

2 3

0  x  25

a. Construir la función de distribución acumulada de X.

b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas?

Respuesta: 0,448

Estadística (Civil/Electrónica/Telecomunicaciones)

94

UPC

c. Calcule la mediana e interprete.

Respuesta: 19,8425

Esperado de una variable aleatoria continúa Sea X una variable aleatoria continua con función de densidad f(x), y sea g(x) cualquier función de X, los valores esperados de X y g(x) son: 

E  X    xf ( x)dx 

E  g  x   



 g ( x) f ( x)dx



Propiedades del esperado E(c) = c, donde c es una constante. E(cX)= cE(X) Sea X una variable aleatoria continua y sean g1(x), …, gk(x) funciones de X: E[g1(x)+ …+ gk(x)] = E[g1(x)]+ …+ E[gk(x)]

Varianza de una variable aleatoria continua Sea X una variable aleatoria continua con función de densidad f(x). Entonces, la varianza de X es 𝜎 2 = V(X) = E[X - 𝜇]2 = E(X2) - 𝜇2

Formula abreviada para el cálculo de la varianza: V(X) = E(X2) – [E(X)]2 Dónde: E(X2) = ∑ 𝑋 2 𝑓(𝑋) La desviación estándar de X es la raíz cuadrada positiva de la varianza de X

  2

Estadística (Civil/Electrónica/Telecomunicaciones)

95

UPC

Propiedades de la varianza Sean a y b dos constantes cualesquiera, entonces: V(a) = 0 V(bX) = b2 E(X) V(a + bX) = b2 E(X) Ejemplo El tiempo de anticipación (-) o retraso (+) en minutos, de la llegada de un tren sobre su tiempo establecido, es una variable aleatoria continua X con la siguiente función de densidad:

 3 (25  x 2 )  5  x  5  f ( x)   500  0 c.c. a. Calcule e interprete el valor esperado. +5 3 (25 − 500

E(X) = ∫−5

3

252 2

𝑥 2 )𝑥𝑑𝑥 = 500 [



54 4



252 2

+

54 ] 4

=0

El tiempo promedio de anticipación o retraso que tiene el tren sobre su hora establecida es 0 minutos, es decir llega en promedio puntual. b. Los supervisores de la estación ferroviaria, han notado que últimamente los trenes no están llegando en su hora establecida, para lo cual han fijado como norma que un tren puede llegar en a lo más ± 0,5 𝑆, siendo S la desviación estándar. ¿Qué porcentaje de trenes cumplen la norma fijada? +5 3 (25 500

E(X2) = ∫−5

− 𝑥 2 )𝑥 2 𝑑𝑥 =

3 53 [25 ∗ 500 3



55 5

− 25 ∗

−53 3

+

−55 ] 5

=5

V(X) = 5 – (0)2 = 5 S = √5 = 2,236068 P (-0,5S ≤ X ≤ 0,5S) = P (-1,118 ≤ X ≤1.118) = 0,32981 El 32,981% de los trenes cumplen la norma fijada. c. Calcule la probabilidad de que el tren llegue retrasado a lo más 2 minutos.

Estadística (Civil/Electrónica/Telecomunicaciones)

96

UPC

d. ¿Cuál es la probabilidad de que el tiempo de llegada de un tren difiera de su hora establecida a lo más en un minuto?

Ejercicio El peso, en onzas, de un artículo de gasfitería usado en hogares y oficinas es una variable aleatoria X con función densidad:

f ( x)  k ( x  8)

8  x  10

a. Obtenga el valor de k, para que f(x) sea una función de densidad.

Respuesta: 0,5 b. ¿Cuál es la probabilidad que un artículo pese más de 9 onzas?

Respuesta: 0,75

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

97

c. Calcule el peso máximo que debe tener un artículo de manera que el 25% de los artículos tengan pesos menores o iguales a dicho peso.

Respuesta: 9 d. Los artículos con un peso menor a 8,5 onzas son separados. ¿Cuál es la probabilidad que un artículo, seleccionado al azar, sea separado?

Respuesta: 0,0625 e. Calcule e interprete el valor esperado.

Respuesta: 9,3333 f.

Calcule la variación relativa.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

98

Ejercicios Las utilidades netas, en miles de soles, de los propietarios de stands en una galería comercial es una variable aleatoria con la siguiente función de densidad: x  f (x)   8  0

0 x 4 otro caso

a. ¿Estaría usted en condiciones de afirmar que más de la mitad de los propietarios tiene utilidades superiores al promedio? Justifique. b. Calcule la variación relativa de las utilidades.

Estadística (Civil/Electrónica/Telecomunicaciones)

99

UPC

4.5 Principales variables continuas Distribución uniforme La distribución uniforme es la distribución más simple de una variable aleatoria continua. La distribución tiene forma rectangular y queda definida por valores mínimos y máximos. Función de densidad: Se dice que una variable aleatoria continua X tiene distribución uniforme en [a, b] si su función de densidad está dada por:

f x  

1 ba

a xb

Notación: Se denota por X~U [a , b] f(x)

f (x)

1 / (b-a)

0

a

k1

k2

b

x

Si [k1, k2]  [a, b], la probabilidad de que X tome valores en el intervalo [k1, k2] es:

P(k1  X  k 2 ) 

  EX  

Media: Varianza:



2

k 2  k1 ba

ab 2

2  b  a  V X  

12

Ejemplo Se sabe que el peso X de ciertos bloques de acero, es una variable aleatoria continua distribuida uniformemente en el intervalo [50,70] toneladas. Encontrar: b) La función de densidad de la variable.

f x  

1 1  70  50 20

50  x  70

c) La probabilidad de que si se pesa un bloque seleccionado al azar pese por lo menos 62 toneladas.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

100

70 − 62

P (X ≥ 62) = 70 − 50 = 0,4 d) La probabilidad de que el peso del bloque seleccionado varié entre 58 y 63 toneladas. P (58 < X < 63) =

63 − 58 70− 50

= 0,25

Ejercicio El ingeniero supervisor del tren eléctrico de Lima sabe por experiencia que el tiempo que se demora en abordar el tren eléctrico un pasajero tiene una distribución uniforme con parámetros de 0 a 20 minutos. a. Calcule la probabilidad de que un pasajero se demore más de 6 minutos en abordar el tren.

b. Calcule la probabilidad de que un pasajero se demore en abordar el tren entre las 7:15 a.m. y las 7:20 am.

c. ¿Cuál es el tiempo mínimo para que el pasajero este considerado entre el 20% de los que más se demoran en abordar el tren?

Estadística (Civil/Electrónica/Telecomunicaciones)

101

UPC

4.6 Distribución Exponencial Función de densidad: Una variable aleatoria X es exponencial con parámetro   0 , si su función de densidad es:

 1  1 x  e f ( x)   β  0 

x0 otro caso

Notación: Si X sigue una distribución exponencial con parámetro 1/ se denota X ~ Exp ( ). Grafica de la Distribución Exponencial 1,0

Density

0,8

0,6

0,4

0,2

0,0

0

1

2

3

4

5

X

Media: Varianza:

  EX   

 2  V X    2

Función de distribución acumulada: 𝒙

F(x) = P(X ≤x) = ∫−∞ 𝒇(𝒙) 𝒅𝒙 F(x) = P(X ≤x) = 𝟏 − 𝒆−𝒙/𝜷 , x ≥ 0 Características:   

La variable puede tomar valores de 0 a +, no toma valores negativos. La gráfica es descendente con sesgo a la derecha. Existe una curva para cada valor de  .

La distribución exponencial se usa para describir la vida útil de un dispositivo o tiempo de funcionamiento hasta que falle y  es el promedio de la vida útil (vida media) del dispositivo.

Estadística (Civil/Electrónica/Telecomunicaciones)

102

UPC

Ejemplo La duración, en miles de millas, que obtienen los dueños de automóviles con cierto tipo de neumático es una variable aleatoria con la siguiente función de densidad:

 1  201 x  e f ( x)   20 0 

si x  0 si x  0

Determine la probabilidad de que uno de estos neumáticos dure a. Como máximo10 000 millas b. entre 16 000 y 24 000 millas c. al menos 30 000 millas. Ejemplo El tiempo de vida de un componente tiene una función de densidad de f(x)

1 500

𝑥

𝑒 −500

0

x>0 en otros casos

a. ¿Cuál es la probabilidad de que un componente dure más de 800 días? −800

P (X > 800) = 1- P(X ≤ 800) = 1- (1- 𝑒 500 ) =0,2019 b. Calcule el valor de la mediana P (X ≤ x) = 0,50 𝑥

- 500 = ln(0,50)

→ →

−𝑥

(1- 𝑒 500 ) =0,50 x = 346,57 días

Ejercicio La duración, en minutos, de una conversación telefónica de larga distancia nacional tiene distribución exponencial con promedio de 8 minutos. a) ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos?

Estadística (Civil/Electrónica/Telecomunicaciones)

103

UPC

b) ¿Cuál es la probabilidad que una llamada dure más de 9 minutos?

c) ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de las de mayor duración?

d) Si la llamada dura más de 5 minutos ¿cuál es la probabilidad de que dure a lo más 8 minutos?

Ejercicios 1. Se tiene que construir dos casas y para terminar cada una se necesita llevar a cabo determinado trabajo clave. El trabajo clave tiene un tiempo de ejecución cuya función de densidad de probabilidad es:  1  12x  e f ( x)  12  0 

x0 c.c.

Si se supone que los tiempos de terminación de los trabajos son independientes, calcule la probabilidad de que el tiempo de ejecución de ambos trabajos demande menos de 10 horas. 2. Suponga que la vida útil, en horas, de cierta marca de foco electrónico, es una variable aleatoria X cuya función de densidad de probabilidad es: x   8000 ce f ( x)     0

x0 c.c.

a. Calcule el valor de la constante c para que f(x) sea función de densidad. Si se selecciona un foco electrónico al azar, calcule la probabilidad de dure más de 10 000 horas. b. Si el costo C, en dólares, por cada foco está dado por:

Estadística (Civil/Electrónica/Telecomunicaciones)

C  20 

UPC

104

 X 2  , determine el costo esperado e interprete. X   2 2  4000  8000 

c. Si se selecciona ocho focos electrónicos, calcule la probabilidad de que por lo menos dos de ellos duren más de 10 000 horas. 3. La vida, en horas, de un dispositivo electrónico es una variable aleatoria que tiene la siguiente función de densidad: 1

1  x f ( x )  e 50 50

para x  0

a. Calcule e interprete la mediana. Si un lote tiene 20 de estos dispositivos, ¿cuántos se esperaría que duren más que la mediana? b. Si el dispositivo duró 80 horas, ¿cuál es la probabilidad de que dure 25 horas más? c. Se escoge aleatoriamente de un lote 5 dispositivos electrónicos, ¿cuál es la probabilidad de que al menos uno dure más de 35 horas? 4. El tiempo de duración X, en meses, de un tipo de resistencia eléctrica tiene la siguiente función de densidad de probabilidad:

0,5e 0,5 x , si x  0 f ( x)   , en otro caso 0 a. Si se prueban 10 resistencias eléctricas, ¿cuál es la probabilidad de que al menos dos de ellas duren más de 4 meses? b. Si el costo de producción de una resistencia es: C(X) = 2+ 3x ¿cuánto es el valor esperado del costo?

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

105

Distribución normal Esta distribución se aproxima a las distribuciones de frecuencias observadas de muchas medidas naturales y físicas, como es el caso de pesos, alturas, ventas, vida útil de producción, coeficiente intelectual, etc. La curva normal tiene forma de campana y es simétrica con respecto a su media La media, la mediana y la moda son iguales y se encuentran en x =  y la desviación estándar es . Función de densidad: La variable aleatoria X es normal si su función de densidad se define de la siguiente manera:

f ( x) 

1  x    

  1 e 2 2 

2

  x  

Notación: Si la variable aleatoria tiene distribución normal con parámetros 𝜇 y 𝜎 2 se denota: X ~ N(, 2) Media E(X) =  Varianza Var(X) = 2

Distribución normal estándar La distribución normal estándar es una distribución de una variable aleatoria continua denotada con la letra Z, que tiene media 0 y desviación estándar 1. Una variable aleatoria con distribución normal se puede convertir en una distribución normal estándar si se realiza la siguiente transformación, llamada de estandarización o de tipificación.

Z

X 



X : Variable aleatoria de interés.

 : Media de la distribución.

:

Desviación estándar de la distribución.

Notación:

Z ~ N (0,1)

Función Acumulada: F (Z) = P (Z ≤ z) La distribución de la variable Z se encuentra tabulada en las tablas estadísticas, pudiendo hallar diversas situaciones como:

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

Ejemplos

Sea Z una variable con distribución normal estándar. a) P(Z < 1,28) = 0,89973 b) P(Z < -1,37) = c) P(Z > - 1,26) = 1- P(Z < - 1,26) = 1 - 0,10383 = 0,89617 d) P(Z > 2.19) = e) P (-2,63< Z < 1,26) = P (Z): T-Value = 1.83

P-Value = 0.039

DF = 29

Ejercicio 1.

Los siguientes datos corresponden a la resistencia a la compresión a los 28 días, en kg/cm2, reportados por dos laboratorios: Laboratorio 1

287,0

238,2

314,3

365,9

362,0

388,7

Laboratorio 2

306,0

338,0

349,4

307,4

316,2

326,9

292,9

290,3

Con 5% de nivel de significación, ¿los laboratorios reportan resultados en promedio similares? Asuma poblaciones normales.

Estadística (Civil/Electrónica/Telecomunicaciones)

139

UPC

Test and CI for Two Variances: Laboratorio 1, Laboratorio 2 Method F

DF1 7

DF2 5

Test Statistic 8.50

P-Value 0.032

Two-Sample T-Test and CI: Laboratorio 1, Laboratorio 2 Difference = μ (Laboratorio 1) - μ (Laboratorio 2) Estimate for difference: -6.6 95% CI for difference: (-50.2, 37.0) T-Test of difference = 0 (vs ≠): T-Value = -0.34 P-Value = 0.741

2.

DF = 9

La exactitud obtenida en mediciones con GPS depende del equipo receptor. Uno de los fabricantes de receptores está realizando un estudio para comparar la exactitud de dos modelos, GPSMAP (1) y Oregón (2). Según información del departamento de control de calidad, la exactitud del modelo GPSMAP es menor que la de Oregón, por lo cual se sugiere dejar de fabricarla. El jefe de producción selecciona al azar dos muestras de receptores de ambos modelos con la finalidad de realizar la prueba correspondiente y registra la exactitud, en mm, obtenida por ambos receptores. Considerando que la exactitud se distribuye normalmente y con un nivel de significación del 4%, ¿la empresa debe dejar de fabricar el modelo GPSMAP A continuación se muestran los reportes obtenidos con Minitab:

Test and CI for Two Variances Method F

DF1 15

DF2 12

Test Statistic 0.81

P-Value 0.691

Two-Sample T-Test and CI Sample 1 2

N 16 13

Mean 7.22 16.03

StDev 2.17 2.41

SE Mean 0.54 0.67

Difference = μ (1) - μ (2) Estimate for difference: -8.810 96% upper bound for difference: -7.261 T-Test of difference = 0 (vs 0.150

95 90

Percent

80 70 60 50 40 30 20 10 5 1

-2

-1

0 RESI1

1

2

Con un p valor de 0,150, el resultado de esta prueba indica que no hay suficiente evidencia estadística para rechazar el supuesto de normalidad al 5% de nivel de significancia. El modelo para este diseño es el siguiente:

y ij     i   ij para i  1, 2, ..., k ; j  1, 2, ..., ni donde: yij : valor observado del i- ésimo tratamiento en la j-ésima repetición : Media poblacional 

i

: Efecto del i-ésimo tratamiento

 ij

: Error experimental asociado a la observación yij, donde  ij ~ N(0,  2 )

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

145

6.2 Análisis de la varianza de un factor: DCA El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar tres o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Se desea medir el efecto del factor en estudio (variable independiente de naturaleza cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de naturaleza cuantitativa). En un DCA los tratamientos se asignan aleatoriamente a las unidades experimentales. Hay k poblaciones (k tratamientos) y se seleccionan k muestras aleatorias independientes, una de cada población. Ejemplo: Una importante compañía de construcciones desea comparar tres marcas de taladros para determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los taladros de cada marca se distribuyen normalmente. ¿Las marcas de taladro tienen un tiempo de vida útil promedio similar a las otras marcas antes de requerir una reparación? Un ingeniero civil residente de una obra desea evaluar el efecto que tiene las técnicas de mezclado de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas diferentes y para realizar la prueba produce especímenes de concreto. ¿La resistencia promedio a la compresión es la misma para cada técnica de mezclado? Suponga que una empresa constructora brinda capacitación con diferentes métodos a sus operarios. ¿El rendimiento promedio de los operarios en la empresa es el mismo según los métodos de adiestramiento recibido por el operario? Una importante compañía de construcciones desea comparar tres marcas de camiones antes de ordenar toda una nueva flota de una clase de camión. ¿Los costos medios de operación por kilómetro de cada camión es el mismo para cada marca de camión? Análisis de la varianza Técnica estadística que permite descomponer la variabilidad total de los resultados de un experimento en sus distintas fuentes (tratamientos, error experimental), con la finalidad de compararlas e identificar su importancia relativa en la explicación de la variación total.

Estadística (Civil/Electrónica/Telecomunicaciones)

146

UPC

Tabla del ANOVA Fuente de variación

Grados de libertad

Tratamientos

k–1

Suma de cuadrados SCTR 

k

 i 1

yi2 y2  ni n

Error

n. – k

SCE  SCT  SCTR

Total

n. – 1

SCT 

k

n

 y

2 ij

i 1 j 1



Cuadrado medio CMTR 

CME 

Fc

SMTR k 1

SCE n  k

CMTR CME

y 2 n

Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencia entre los tratamientos, la cantidad Fc del cuadro de análisis de varianza seguiría una distribución F con los grados de libertad del tratamiento y con los grados de libertad del error. Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias entre las medias de los tratamientos. Ejemplo La gerente de mercadeo de un banco planea poner en marcha cierto tipo de promociones para atraer nuevos clientes en cuatro sucursales del banco. Ella está convencida que diferentes tipos de promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias entre los ingresos medios de los clientes de cada sucursal, se optará por un programa de promociones distinto para cada una. Considere a los montos de los depósitos, en miles de soles, como una medida representativa de los ingresos de los clientes. Se presentan datos para una muestra de siete depósitos de cada sucursal ¿Debe la gerente optar por un programa de promociones distinto para cada sucursal? Evalúe esta posibilidad con un nivel de significación del 5%.

Depósito

Sucursal 1 (Tratamiento 1)

Sucursal 2 (Tratamiento 2)

Sucursal 3 (Tratamiento 3)

Sucursal 4 (Tratamiento 4)

1

y11 = 5,3

y21 = 3,3

y31 = 3,6

y41 = 4,3

2

y12 = 2,6

y22 = 4,6

y32 = 2,8

y42 = 2,5

3

y13 = 3,6

y23= 2,1

y33 = 4,5

y43 = 1,8

4

y14 = 3,8

y24 = 3,5

y34 = 3,8

y44 = 3,0

5

y15 = 2,7

y25 = 5,0

y35 = 1,9

y45 = 3,9

6

y16 = 5,1

y26 = 2,8

y36 = 4,1

y46 = 3,5

7

y17 = 4,2

y27 = 2,5

y37 = 5,1

y47 = 4,1

Total yi.

y1. = 27,3

y2. = 23,8

y3. = 25,8

y4. = 23,1

Los cálculos para obtener las sumas de cuadrados son:

Estadística (Civil/Electrónica/Telecomunicaciones)

-

y..2 n.

 k 4   i 1 

147

UPC

2

 y ij   2 j 1   (100)  357,1429 k 4 7777 n. 7

  i 1

-

SCT 

k 4 7

 i 1 j 1

-

SCTR 

k 4

 i 1

-

y ij2





y 2   5,32  2,62  . . .  4 ,12  357,1429  27,0171 n

y i2 y 2  27,32 23,82 25,82 23,12    357,1429  1,568      ni n  7 7 7 7 

SCE  SCT  SCTR  27,0171 1,568  25,4486

La tabla del análisis de varianza: Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrados medio

Fcritico

Ftabla

0,523  0,49 1,060

3,01

Tratamientos

k–1=4–1=3

SCTR =1,569

1,569  0,523 3

Error

n. – k = 28 – 4 = 24 SCE =25,449

25,449  1,060 24

Total

n. – 1 = 28 – 1 = 27 SCT = 27,017

La salida que muestra el Minitab es la siguiente: Source Sucursal Error Total

DF 3 24 27

Seq SS 1.569 25.449 27.017

Adj SS 1.569 25.449

Adj MS 0.523 1.060

F 0.49

P 0.690

Hipótesis estadística Ho: 1= 2=…= K

No hay diferencia en las medias poblacionales

El factor en estudio no afecta a la variable respuesta

H1: Al menos un i es diferente

Hay diferencia en las medias poblacionales

El factor en estudio afecta a la variable respuesta

Paso 1: Formular la hipótesis de trabajo Ho:A = B = C H1:Al menos un i es diferente a los demás

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

148

Paso 2: Establecer el nivel de significación  = 0,05 Paso 3: Estadístico de Prueba Fc = 0,49 Paso 4: Criterio de decisión Fc = 0,49 < Fcrit = 3,01  NO se rechaza Ho Paso 5: Conclusión Al 5% de significación, no es posible afirmar que al menos un depósito promedio sea diferente a los demás.

6.3 Prueba para la diferencia de medias Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El análisis de varianza indica si hay evidencias de que al menos una de las medias sea diferente o no. Cuando se rechaza la hipótesis nula, el análisis de varianza no revela cuál o cuáles de las medias son significativamente diferentes; en estos casos se deben utilizar otras pruebas estadísticas.

Método de comparaciones múltiples: Prueba de Tukey-Kramer Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que difieren de otro (µi versus µj) se utilizan las pruebas de comparaciones múltiples, como la de Tukey - Kramer. Con esta prueba, con el fin de probar todas las hipótesis nulas simultaneas H0: µi - µj = 0, los estadísticos de prueba son:

xi.  x j. CME  1 1   2  Ji J j  donde: CME es el cuadrado medio del error del análisis de varianza Ji y Jj son los tamaños de muestra de los tratamientos i y j, respectivamente. Ejemplo Los siguientes datos corresponden a las mediciones de los pesos de recubrimiento de estaño de discos por cuatro laboratorios diferentes.

Estadística (Civil/Electrónica/Telecomunicaciones)

149

UPC

Laboratorio A

Laboratorio B

Laboratorio C

Laboratorio D

0,25

0,18

0,19

0,23

0,33

0,28

0,25

0,30

0,22

0,21

0,27

0,28

0,30

0,23

0,24

0,28

0,27

0,25

0,18

0,24

0,28

0,20

0,26

0,34

0,32

0,27

0,28

0,20

0,24

0,19

0,24

0,18

0,31

0,24

0,25

0,24

0,26

0,22

0,20

0,28

0,20

0,29

0,21

0,22

0,28

0,16

0,19

0,21

3,26

2,72

2,76

3,00

Determine qué medias difieren de las otras. Use un nivel de significación   0,05 . Solución La tabla del análisis de varianza es: Source Laboratorio Error Total

DF 3 44 47

Seq SS 0.015558 0.072833 0.088392

Adj SS 0.015558 0.072833

Adj MS 0.005186 0.001655

F 3.13

P 0.035

Desarrollando el ejemplo utilizando el Minitab se obtienen los siguientes resultados:

Probability Plot of RESI2 Normal 99

Mean -8.67362E-18 StDev 0.03937 N 48 KS 0.077 P-Value >0.150

95 90

Percent

80 70 60 50 40 30 20 10 5 1

-0.10

-0.05

0.00 RESI2

0.05

0.10

Estadística (Civil/Electrónica/Telecomunicaciones)

150

UPC

Test for Equal Variances for Pesos de Recubrimiento Bartlett's Test Test Statistic P-Value

A

0.96 0.810

Laboratorio

Levene's Test Test Statistic P-Value

B

0.26 0.852

C

D

0.02

0.03 0.04 0.05 0.06 0.07 0.08 0.09 95% Bonferroni Confidence Intervals for StDevs

0.10

Estos resultados pueden resumirse en un diagrama de líneas como el que se muestra a continuación. La idea es que los tratamientos unidos por una línea no presentan diferencias significativas.

Factor Lab_A Lab_D Lab_C Lab_B

N 12 12 12 12

Mean 0.2717 0.2500 0.2300 0.2267

B

C

D

A

0,227

0,230

0,250

0,272

Grouping A A B A B B

Means that do not share a letter are significantly different.

Estadística (Civil/Electrónica/Telecomunicaciones)

151

UPC

Ejemplo Una importante compañía de construcciones desea comparar tres marcas de taladros para determinar cuánto tiempo pasa antes de necesitar una reparación; si los tiempos de vida de los taladros de cada marca se distribuyen normalmente. Los datos de los tiempos de vida útil (decenas de horas) para cada marca se encuentran en la siguiente tabla. Marca A

Marca B

Marca C

6

10

3

2

9

2

4

8

5

1

6

4

7

a. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro antes de una reparación? Utilice nivel de significación de 5%. b. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar? Solución: a. ¿Sugieren los datos que el tiempo promedio de vida es el mismo para cada marca de taladro antes de una reparación? Utilice nivel de significación de 5%. Paso 1: Formular la hipótesis de trabajo Ho:A = B = C H1:Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación  = 0,05 Paso 3: Estadístico de Prueba Fc = 7,037 Paso 4: Criterio de decisión Fc = 7,037 > Fcrit(2,10; 0,05) = 4,1  Se rechaza Ho Paso 5: Conclusión Al 5% de significación, existe evidencia estadística para afirmar que el tiempo promedio de vida es diferente para cada marca de taladro antes de una reparación.

Estadística (Civil/Electrónica/Telecomunicaciones)

152

UPC

Resultado obtenido con Minitab Paso 1: Formular la hipótesis Ho:A = B = C H1:Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación  = 0,05 Paso 3: Estadístico de Prueba Source Factor Error Total

DF 2 10 12

Adj SS 55.94 39.75 95.69

Adj MS 27.971 3.975

F-Value 7.04

P-Value 0.012

Paso 4: Criterio de decisión p = 0,012 < α = 0,05  Se rechaza Ho Paso 5: Conclusión Al 5% de significación, existe evidencia estadística para afirmar que el tiempo promedio de vida es diferente para cada marca de taladro antes de una reparación. a. Si la prueba resulta significativa, ¿qué marca de taladro recomendaría utilizar?

Factor Marca B Marca A Marca C

N 4 5 4

Mean 8.250 4.00 3.500

Grouping A B B

Estadística (Civil/Electrónica/Telecomunicaciones)

153

UPC

Observación: Las medias que no comparten una letra son significativamente diferentes Luego, ordenando las medias en forma ascendente según las medias muestrales, y colocando una línea debajo de las medias no se ha encontrado diferencias significativas entre las marcas de taladros A y C, la marca de taladro B presenta un mayor tiempo promedio de vida antes de la reparación. Se tiene:

µC µA µB Conclusión: Se recomienda utilizar la marca de taladro B. Ejercicio 1. Un ingeniero civil residente de una obra desea evaluar el efecto que tienen las técnicas de mezclado de concreto sobre la resistencia (kg/cm2) a la compresión. Para ello evalúa cuatro técnicas diferentes y para realizar la prueba produce especímenes de concreto. Si la resistencia a la compresión del concreto de cada técnica se distribuye normalmente y tienen la misma varianza. Los datos recabados son los siguientes:

Source Factor Error Total

DF 3 12 15

Técnica 1

Técnica 2

Técnica 3

Técnica 4

2765

3200

2800

2600

2665

3300

3150

2700

2865

2975

2885

2600

2890

3150

2850

2765

Adj SS 522475 180275 702750

Adj MS 174158 15023

F-Value 11.59

Estadística (Civil/Electrónica/Telecomunicaciones)

Factor Técnica Técnica Técnica Técnica

2 3 1 4

N 4 4 4 4

Mean 3156.3 2921.3 2796.3 2666.3

154

UPC

Grouping A A B B B

a. Al 5% de significación, ¿al menos una técnica de mezclado influye en la resistencia a la compresión del concreto? Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrado medio

Paso 1: Formular la hipótesis de trabajo Ho:A = B = C H1:Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación  = 0,05 Paso 3: Estadístico de Prueba Fc = Paso 4: Criterio de decisión Como Fc =

Fcrit (2,10; 0,05) = 4,1  Se rechaza Ho

Paso 5: Conclusión Al 5% de significación,

b. Si la prueba resulta significativa, ¿qué técnica recomendaría utilizar?

Fc

Estadística (Civil/Electrónica/Telecomunicaciones)

155

UPC

2. Una compañía que produce ladrillos, efectuó un experimento para determinar si cuatro temperaturas (en °F) de cocción específicas afectan la densidad (gr/cm3) de cierto tipo de ladrillo. La densidad de los ladrillos para cada temperatura se distribuye normalmente y tienen la misma varianza. Temperaturas 100°F (1)

125°F (2)

150°F (3)

175°F (4)

19,9

21,7

20,9

21,8

19,7

21,4

20,8

21,9

19,8

21,5

20,8

21,7

19,7

21,5

20,6

21,6

20,0

21,7

Después de procesar la información, los resultados obtenidos con Minitab se muestran a continuación: Analysis of Variance Source Factor Error Total

DF 3 14 17

Factor 175°F (4) 125°F (2) 150°F (3) 100°F (1)

Adj SS 10.9494 0.2150 11.1644

N 5 4 4 5

Mean 21.7400 21.5250 20.7750 19.8200

Adj MS 3.64981 0.01536

F-Value 237.66

Grouping A A B C

P-Value 0.000

Estadística (Civil/Electrónica/Telecomunicaciones)

156

UPC

a. Utilice nivel de significación de 5% para probar si al menos una temperatura de cocción influye en la densidad de los ladrillos. Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrado medio

Paso 1: Formular la hipótesis de trabajo Ho:A = B = C H1:Al menos un i es diferente a los demás. Paso 2: Establecer el nivel de significación  = 0,05 Paso 3: Estadístico de Prueba Fc = Paso 4: Criterio de decisión Como Fc =

Fcrit (2,10; 0,05) = 4,1  Se rechaza Ho

Paso 5: Conclusión Al 5% de significación,

b. Si la prueba resulta significativa, ¿qué temperatura recomendaría utilizar?

Fc

Estadística (Civil/Electrónica/Telecomunicaciones)

157

UPC

Ejercicios 1.

Importación Bombardera desea determinar si el tipo de chip (A, B, C) que tienen laptops que ellos importan influye en el tiempo de respuesta (microsegundos). Si el tiempo de respuesta para cada tipo de chip se distribuye normalmente y tienen la misma varianza. Para esto, prueba 5 laptops con cada chip. A continuación se muestran los resultados en microsegundos:

Source Factor Error Total

DF 2 12 14

Factor Tipo B Tipo A Tipo C

N 5 5 5

Adj SS 342.5 178.8 521.3

Mean 28.80 20.80 17.40

Tipo A

Tipo B

Tipo C

18

24

17

23

25

14

21

30

19

18

27

20

24

38

17

Adj MS 171.27 14.90

F-Value 11.49

P-Value 0.002

Grouping A B B

a. Al nivel de significancia del 5%, ¿la importadora puede concluir que hay diferencia en los tiempos promedio de respuesta según el tipo de chip utilizado? b. Si la prueba resulta significativa, ¿qué tipo de chip recomendaría utilizar? 2.

Un empresario debe elegir la alternativa más eficiente para fabricar un mismo producto. Se analiza el costo por unidad (en soles) de tres alternativas. Si el costo por unidad para cada alternativa se distribuye normalmente y tienen la misma varianza, ¿qué alternativa deberá elegirse?

Estadística (Civil/Electrónica/Telecomunicaciones)

158

UPC

Alternativa A

Alternativa B

Alternativa C

9,35

8,35

9,35

8,35

8,35

10,35

7,35

7,35

9,35

8,35

7,35

8,35

9,35

8,35

9,35

7,35

7,35

9,35

Los resultados obtenidos con Minitab se presentan a continuación: Source Factor Error Total

DF 2 15 17

Adj SS 7.000 7.500 14.500

Factor Alternativa C Alternativa A Alternativa B

N 6 6 6

Adj MS 3.5000 0.5000

Mean 9.350 8.350 7.850

F-Value 7.00

P-Value 0.007

Grouping A A B B

a. Pruebe si existe alguna diferencia significativa en los costos unitarios de las tres alternativas de fabricación. Utilice nivel de significación de 5%. b. Si existen diferencias, ¿entre qué grupos están las diferencias? Utilice nivel de significación de 5%.

Estadística (Civil/Electrónica/Telecomunicaciones)

159

UPC

Unidad 7 Análisis de regresión lineal simple y no lineal Logro de la unidad Al final la unidad el alumno será capaz de modelar adecuadamente la relación existente entre dos variables cuantitativas con el fin de predecir una de ellas Y (variable respuesta o dependiente) en función de otra variable X (regresora o independiente) mediante una función lineal o no lineal en el ámbito de su especialidad y utilizando el software estadístico Minitab.

7.1 Regresión lineal ¿La velocidad de transferencia de datos de un disco duro depende de la velocidad en que giran los discos del plato del disco duro o de su capacidad de almacenamiento? ¿El tiempo de ejecución de una obra civil depende del número de trabajadores o del índice de automatización? ¿El tiempo de falla de los equipos electrónicos dependerá de la resistencia de los resistores? ¿el sueldo dependerá del grado de instrucción? ¿el tiempo de procesamiento de trabajos estará relacionado con el número de trabajos por día? ¿La temperatura está relacionada con la presión sobre el rendimiento de un producto químico? Estas preguntas surgen cuando queremos estudiar dos variables de una población con el fin de examinar la relación existente entre ellas. Las dos variables en estudio son variables cuantitativas que nos permitirá construir una ecuación lineal que modela la relación existente entre estas dos variables. En el análisis de regresión la ecuación lineal puede usarse para estimar o predecir los valores de una variable dependiente, llamada Y, cuando se conocen o se suponen conocidos los valores de otra variable, variable independiente, llamada X. El análisis de correlación permite determinar el grado de relación lineal existente entre dos variables. Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación. ¿Qué es el análisis de regresión lineal?

Es modelar la dependencia de la variable Y en función de la variable X a través de la ecuación de una recta

Yi  0  1 X i  ei Variable respuesta o Dependiente

i = 1, 2,…, n

Variable predictora o Independiente

Estadística (Civil/Electrónica/Telecomunicaciones)

160

UPC

7.1.1 Diagrama de dispersión o gráfico del plot

El primer paso en el análisis de regresión es registrar simultáneamente los valores de las dos variables asociadas (X, Y) en una gráfica bidimensional para ver si existe una tendencia lineal que podría explicar la relación entre estas dos variables X vs Y X vs Y 9

1600

Variables no relacionadas

8

Modelo lineal Buen ajuste

1400 1200 1000

Y

Y

7

6

800 600 400

5

Cuando X crece Y decrece

200

4

0 10

15

20

25

300,2

X vsXY

0,4

0,6

0,8

1,0

1,2

1,4

1,6

X

60

X vs Y 140

Modelo lineal Buen ajuste

50

Variables no relacionadas

130 120

100

40 Y

Y

110

90 80

30

Cuando X crece Y crece

70 60 50

20 20

25

30

35 X

40

50200

45

400

600

800

1000

1200

X

Ejercicio Se desea modelar la vida útil (en años) de un satélite en función de la cantidad de combustible (en kg) requerido para moverlo de su posición orbital, usando un modelo lineal. Los datos se muestran a continuación: Vida útil (años)

10,8

11,5

12

12,4

13,2

13,7

13,9

14,1

14,8

15

Cantidad de combustible (kg) 150,4

156,3

162,5

165,8

172,5

168,9

184,5

185,9

187,2

199,4

RELACION ENTRE LA VIDA UTIL Y LA CANTIDAD DE COMBUSTIBLE 15

Vida útil

14

13

12

11 150

160

170

180

Cantidad de combustible

190

200

Estadística (Civil/Electrónica/Telecomunicaciones)

161

UPC

Comente el diagrama de dispersión de estas variables.

7.1.2 Método de los mínimos cuadrados Mediante este método es posible seleccionar la recta que se ajuste mejor a los datos. La recta resultante tiene dos características importantes:  La suma de las desviaciones verticales de los puntos con relación a la recta es cero; y  La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una menor suma de cuadrados de tales desviaciones). n

Es decir:

(y i 1

i

 yˆ i ) 2 es mínima

Los valores de 0 y 1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones de las llamadas ecuaciones normales de la recta de regresión:

 n  ˆ ˆ y  n     i 0 1   xi  i 1  i 1  n

 n  ˆ  n 2 ˆ x y    i i 0   xi    1   xi  i 1  i 1   i 1  n

Este método nos permite estimar los parámetros del modelo de regresión. Resolviendo las ecuaciones simultáneas para  0 y  1 tenemos:  n  ˆ1  

  n  n  xi yi    xi  yi      i 1   i1  i1  2  n 2  n  n xi    xi       i1   i1  n



 



y ˆ0  y  ˆ1 x



7.1.3 Recta de regresión La ecuación lineal es: yˆ i  ˆ0  ˆ1 xi donde:  

ˆ1 es la pendiente de la recta o coeficiente de regresión. ˆ es la ordenada en el origen o intercepto de la recta con eje y 0

Estadística (Civil/Electrónica/Telecomunicaciones)

162

UPC

Ejercicio Calcule e interprete los coeficientes de regresión estimados del ejemplo anterior, considerando la siguiente información: Cantidad de combustible

150.4

156.3

162.5

165.8

172.5

168.9

184.5

185.9

187.2

199.4

Vida útil

10.8

11.5

12

12.4

13.2

13.7

13.9

14.1

14.8

15

Haciendo uso de las fórmulas, el procedimiento implica realizar los siguientes cálculos previos:



X Cantidad de combustible

Y Vida útil

xy

x2

y2

1

150.4

10.8

1624,32

22620,16

116,64

2

156.3

11.5

1797,45

24429,69

132,25

3

162.5

12

1950

26406,25

144

4

165.8

12.4

2055,92

27489,64

153,76

5

172.5

13.2

2277

29756,25

174,24

6

168.9

13.7

2313,93

28527,21

187,69

7

184.5

13.9

2564,55

34040,25

193,21

8

185.9

14.1

2621,19

34558,81

198,81

9

187.2

14.8

2770,56

35043,84

219,04

10

199.4

15

2991

39760,36

225

Total

1733,4

131,4

22965,92

302632,46

1744,64

Para simplificar los cálculos, se ha realizado la corrida con el Minitab, obteniendo el siguiente reporte: The regression equation is Y = - 1.996 + 0.08732 X

ˆ1

ˆ0

Estadística (Civil/Electrónica/Telecomunicaciones)

163

UPC

7.1.4 Análisis de varianza El análisis de varianza es la descomposición de la variación total en sus fuentes de variación: regresión y error (residual). Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrado medio

Estadístico de prueba

1

SCReg

CMReg (1)

Fc = (1) / (2)

Error (residual)

n–2

SCE

CME (2)

Total

n–1

SCTot

Regresión

Donde las fórmulas a usar estarían dadas por: 2     yi n    i 1  , SC Re g  ˆ 2 . SCTot   1   n  i 1    SC Re g SCE Además CM Re g  y CME  . 1 n2



    yi2     

n



n



   xi2  

 xi   i 1  n n



i 1

2

    y SCE  SCTot  SC Re g .    

Este análisis permite realizar la prueba de hipótesis para validar el modelo de regresión obtenido a un nivel de significación α.

H 0 : 1  0 H1 : 1  0 1. α (nivel de significación) Distribution Plot F; df1=15; df2=23

Z.R.

0,9

2. Prueba estadística

0,7 Density

CMReg Fcal  CMError

0,8

0,6 0,5 0,4

α

0,3 0,2 0,1 0,0

0

Z.NR A.

X

Fcrit

3. Criterios de decisión Si Fcal > Fcrit. (α, 1, n-2) entonces se rechaza Ho, por lo tanto el modelo es válido o Si Fcal ≤ Fcrit. (α, 1, n-2) entonces no se rechaza Ho el modelo no es válido 4. Conclusión

Estadística (Civil/Electrónica/Telecomunicaciones)

164

UPC

Ejercicio A un nivel de significación del 5%, valide el modelo de regresión lineal del ejercicio anterior. Analysis of Variance Source Regression Error Total

DF 1 8 9

SS 16.5077 1.5363 18.0440

MS 16.5077 0.1920

F 85.96

P 0.000

Complete la tabla: Fuente de variación

Grados de libertad

Suma de cuadrados

Cuadrado medio

Estadístico de prueba

Regresión Error (residual) Total

1. H 0 :

H1 : 2. α = Distribution Plot F; df1=15; df2=23

Z.R.

0,9

3. Prueba estadística

CMReg CMError

0,7 Density

Fcal 

0,8

0,6 0,5 0,4

α

0,3 0,2 0,1 0,0

0

Z.NR A.

X

Fcrit=

4. Decisión: 5. Conclusión:

7.1.5 Coeficiente de determinación Es una medida de bondad de ajuste del modelo. Nos indica que tan bueno es el modelo para explicar el porcentaje de variabilidad de la variable dependiente Y. El coeficiente de determinación R 2 indica el porcentaje de la variabilidad de la variable dependiente Y que es explicada por el modelo de regresión lineal. También nos ayuda a saber la precisión con la que se puede predecir o pronosticar el valor de una variable, si se conocen o suponen valores para la otra variable.

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

165

El coeficiente de determinación R 2 se calcula de la siguiente manera:

R2 

SCReg  100% SCTot

Ejercicio Calcule e interprete el coeficiente de determinación del ejercicio anterior. S = 0.438218

R-Sq = 91.5%

R-Sq(adj) = 90.4%

7.1.6 Error estándar de la estimación El error estándar de la estimación mide la variabilidad, o dispersión, de los valores de Y alrededor del plano de regresión. Actúa como la desviación estándar, es una medida promedio de la diferencia del valor observado y el valor estimado de Y.

S

SCE  CME n2

Ejercicio Calcule el valor del error estándar de estimación en la salida del Minitab. S

7.1.7 Coeficiente de correlación El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y. Se calcula como la raíz cuadrada del coeficiente de determinación:

 R 2 r  R 2

si ˆ1  0 si ˆ  0 1

Si el coeficiente de correlaciónesta cerca de cero entonces indicará que no existe relación lineal significativa entre las dos variables Si el coeficiente de correlación se acerca a 1 o a -1 indicará que existe una relación lineal fuerte pudiendo ser directa o inversa.

Estadística (Civil/Electrónica/Telecomunicaciones)

166

UPC

Relación lineal

No existe

Relación lineal

fuerte e

Relación

fuerte y

inversa

Lineal

directa

-1.0

-0.65

-0.2

0.2

0.65

1.0

Su valor varia dentro del intervalo de -1 y 1

Ejercicio Calcule e interprete el coeficiente de correlación del ejemplo anterior. S = 0.438218

R-Sq = 91.5%

R-Sq(adj) = 90.4%

r

Ejercicio Una empresa dedicada a la fabricación de equipos de telecomunicación considera que la vida útil de los equipos puede estar explicada por la temperatura del ambiente en el que trabaja mediante una relación lineal. Para encontrar la ecuación de regresión lineal de la vida útil en función de la temperatura se tomó una muestra de 11 datos, los cuales se muestran en la tabla siguiente: Temperatura(ºC)

24

20

18

16

10

12

13

28

16

15

23

Vida útil(en años)

8,0

6,4

5,5

4,6

3,8

3,9

5,6

8,5

6,6

4,5

8,8

T 0.93 6.35

P 0.376 0.000

Salida del Minitab Predictor Coef Constante 0.798 Temperatura 0.2944 S = 0.811758

EE Coef 0.858 0.0464

R-cuad. = 81.74%

R-cuad.(ajustado) = 79.71% Gráfica de dispersión de Vida útil vs. Temperatura

Análisis de varianza GL 1 9 10

SC 26.546 5.931 32.476

CM

F

8

Vida útil(en años)

Fuente Regresión Error residual Total

9

7

6

5

4 10

15

20

Temperatura

25

30

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

Responda las siguientes preguntas: a. Comente el diagrama de dispersión de estas variables.

b. Interprete los coeficientes de regresión estimados.

ˆ1

ˆ0

c. Valide el modelo de regresión al 1% de nivel de significación. Ho: H1:

d. Interprete el coeficiente de determinación y el coeficiente de correlación. r2

167

Estadística (Civil/Electrónica/Telecomunicaciones)

168

UPC

r

7.1.8 Intervalos de predicción El intervalo de confianza al 1     100 % para un valor individual es:

1 x0  x  1 x  x     Yˆ X  yˆ 0  t ( n  2, / 2) S 1   0 0 n S xx n S xx 2

yˆ 0  t ( n  2, / 2 ) S 1 

 n    xi  n 2 donde S xx   xi   i 1  n i 1

2

2

o

S xx 

SC Re gr b12

Ejercicio Para la construcción de carreteras que experimentan heladas intensas, es importante que la densidad del concreto (Kg/m2) seleccionado tenga un valor bajo de conductividad térmica para reducir al mínimo los daños provocados por cambios de temperatura. Por lo tanto, se desea modelar la conductividad térmica en función de la densidad que posee el concreto. Por lo tanto se toman 12 trozos al azar de diferentes densidades de concreto y se registra la conductividad. El registro se muestra a continuación en la siguiente tabla:

Conductividad térmica (watts/metros.Kelvin)

300

400

500

600

700

800

0.065

0.08

0.095

0.115

0.13

0.15

900

1000

1100 1200 1400 1600

0.175 0.205

0.23 0.27 0.346 0.436

Diagrama de dispersión de Conductividad vs Densidad 0,45 0,40

Conductividad

Densidad del concreto

0,35 0,30 0,25 0,20 0,15 0,10 0,05 200

400

600

800

1000

Densidad

1200

1400

1600

Estadística (Civil/Electrónica/Telecomunicaciones)

169

UPC

Coefficients Term Constant Densidad del concreto S = 0,0241052

Coef -0.0494 0.000275

R-Cuad = 95,87%

SE Coef 0.0173 0.000018

T-Value -2.86 15.24

P-Value 0.017 0.000

VIF 1.00

R-Cuad(ajustado) = 95,46%

Análisis de Varianza Fuente Regresión Error residual Total

GL 1 10 11

SC

SE Fit 0.0080576

F

0,00581 0,14085

Variable Densidad del concreto Fit 0.129486

CM

Setting 650 95% CI (0.111533, 0.147440)

95% PI (0.0728555, 0.186117)

a. Comente el diagrama de dispersión.

b. Presente la ecuación de la recta o modelo de regresión estimado.

c. Interprete el valor de la pendiente de la recta.

d. Interprete el coeficiente de determinación y correlación. r2

r

Estadística (Civil/Electrónica/Telecomunicaciones)

170

UPC

e. Valide el modelo de regresión. Use un nivel de significación de 0,01

f. Pronostique con 95% de confianza la conductividad térmica cuando la densidad del concreto es de 650 Kg/m2. Interprete.

Ejercicio Se desea modelar el tiempo de operación (en horas) en función de la temperatura de un dispositivo. Para ello se realiza un experimento estadístico, cuyos resultados son los siguientes: Temperatura (oC) Tiempo de operación

18

18

18

22

22

26

30

30

34

1200

1215

1150

1000

974

810

583

612

240

Gráfica de dispersión de Tiempo de operación vs. Temperatura (oC)

Tiempo de operación

1200

1000

800

600

400

200 20

24

28

Temperatura (oC)

32

36

Estadística (Civil/Electrónica/Telecomunicaciones)

171

UPC

Análisis de regresión: Tiempo vs. Temperatura (°C) La ecuación de regresión es Tiempo = 2184 - 54.46 Temperatura(°C) Coefficients Term Constant Temperatura

Coef 2184.0 -54.46

SE Coef 75.0 3.02

T-Value 29.11 -18.06

P-Value 0.000 0.000

VIF 1.00

Analysis of Variance Source Regression Error Total S = 51.4830

DF 1 7 8

SS 864685 18554 883239

R-cuad. = 97.9%

Variable Tiempo acumulado Variable Temperatura Fit 822.532

MS 864685 2651

F 326.23

P 0.000

R-cuad(ajustado) = 97.6%

Setting 25

Setting 25

SE Fit 17.3205

95% CI (781.576, 863.488)

95% PI (694.089, 950.975)

a. Comente el diagrama de dispersión.

b. Presente la ecuación de la recta o modelo de regresión estimado.

c. Interprete el coeficiente de regresión de la variable independiente.

ˆ1

Estadística (Civil/Electrónica/Telecomunicaciones)

172

UPC

d. Interprete el coeficiente de determinación y correlación. r2

r

e. Valide el modelo de regresión. Use un nivel de significación del 5%.

f.

Pronostique con 95% de confianza el tiempo de operación hasta el fallo cuando la temperatura es 25ºC. Interprete.

Ejercicio 1.

NVZ Import-Export es una empresa proveedora de GPS para automóviles de diferentes modelos, últimamente ha importado nuevos modelos de GPS que ya están a la venta. El jefe del departamento de ventas ha implementado charlas motivadoras para sus agentes vendedores y desea modelar la eficiencia de sus ventas (%) en función de las horas que asisten mediante una función lineal. Por lo tanto, selecciona aleatoriamente una muestra de 10 agentes vendedores y registra el tiempo acumulado de horas en las que estuvo presente el agente vendedor en una o más charlas durante el último trimestre y la eficiencia de sus ventas. Los datos y resultados se muestran a continuación: Eficiencia en las ventas (%)

47

84

80

46

62

72

52

87

37

68

Tiempo acumulado, en horas

27

45

41

19

35

39

19

49

15

31

Coefficients Term Constant Tiempo acumulado

Coef 18.06 1.420

SE Coef 5.16 0.152

T-Value 3.50 9.32

P-Value 0.008 0.000

VIF 1.00

Estadística (Civil/Electrónica/Telecomunicaciones)

173

UPC

Analysis of Variance Source Regression Error Total

DF 1 8 9

SS 2520.5 232.0 2752.5

Variable Tiempo acumulado Fit 53.56

a. b. c. d.

SE Fit 2.00918

MS 2520.5 29.0

F 86.91

P 0.000

Setting 25 95% CI (48.9268, 58.1932)

95% PI (40.3056, 66.8144)

Presente la ecuación de la recta. Interprete el coeficiente de regresión estimado. Realice el proceso de validación del modelo, con un nivel de significación de 5%. Si es deseable alcanzar una eficiencia de por lo menos 50% cuando las horas de capacitación sea de 25 horas, estime, con un nivel de confianza del 95%, la eficiencia de un agente vendedor cuando realizó 25 horas de charla y diga si es posible alcanzar la eficiencia deseada.

7.2 Regresión no lineal El modelo de regresión lineal simple resulta ser una herramienta útil en el análisis de la relación lineal existente entre una variable dependiente, Y, y otra independiente, X. Sin embargo no todas las relaciones existentes pueden considerarse lineales, de hecho existen muchas relaciones no lineales. Muchas relaciones de este tipo, a pesar de su naturaleza no lineal pueden ser linealizados aplicando alguna transformación sobre una de las variables o sobre ambas. Las transformaciones pueden ser de diferente tipo y dependerán del modelo inicial considerado para el análisis. Cuando la relación entre variables (x, y) no es lineal: o El coeficiente de determinación es bajo. o La prueba de validación del modelo resulta no significativa. Si la relación no es línea, los siguientes modelos pueden ser linealizados: ˆ X Y  ˆ0 e 1 al tomar logaritmo, se tiene ln Y   ln ˆ0   ˆ1 X

   

 Y  ˆ0 X 1 al tomar logaritmo, se tiene ln Y   ln ˆ0  ˆ1 ln X ˆ

El primero es el modelo exponencial y el segundo, el modelo potencia. De hecho existen modelos no lineales que no pueden ser linealizados:

Y  0  e

1x   2 x 2

Estadística (Civil/Electrónica/Telecomunicaciones)

174

UPC

La transformación de datos nos permite linealizar la relación entre dos variables, se realiza cuando se sospecha y luego se verifica que no existe dependencia lineal entre las variables en estudio. Las transformaciones que pueden mejorar el ajuste y la capacidad de predicción del modelo son muy numerosas. Aquí se presenta algunas de las trasformaciones.

Forma funcional que relaciona y con x

Transformación apropiada

Forma de regresión lineal simple

Exponencial : y  0e1x

y *  ln y

Regresión de y * vs. X

Potencia: y  0 x 1

y*  ln y;

x*  ln x

Regresión de y * vs. x *

Ejemplo El gerente de una empresa dedicada a la producción de brocas de acero para cerámicas o mayólicas, sospecha que la deformación del acero a temperatura normal mantiene una relación inversa con la dureza del mismo ya que, a medida que la deformación crece, se ve afectada la dureza del acero. Él desea modelar la dureza en función de la deformación. Para ello se realizan 10 pruebas encontrando los siguientes resultados: Deformación (mm)

6

7

11

13

20

26

28

33

35

30

Dureza (kg/mm2)

65

67

65

53

41

40

37

34

32

42

a. Comente el diagrama de dispersión.

Estadística (Civil/Electrónica/Telecomunicaciones)

175

UPC

Dispersión de la dureza en función de la deformación

Dureza (Kg/mm2)

80 70

y = -1.191x + 72.493 R² = 0.9103

60 50 -0.025x 40 y = 76.902e

R² = 0.9247

30

y = 149.29x-0.41 R² = 0.9118

20 10 0 0

10

20

30

40

Deformación (mm)

Y= X=

b. Obtener la ecuación del modelo de regresión no lineal indicado. Según el enunciado, analizaremos la regresión lineal entre X y ln(Y) N°

Y: Dureza (kg/mm2)

ln(Y)

X: Deformación (mm)

X*ln(Y)

X^2

1

65

4,1744

6

25,0463

36

2

67

4,2047

7

29,4328

49

3

65

4,1744

11

45,9183

121

4

53

3,9703

13

51,6138

169

5

41

3,7136

20

74,2714

400

6

40

3,6889

26

95,9109

676

7

37

3,6109

28

101,1057

784

8

34

3,5264

33

116,3699

1089

9

32

3,4657

35

121,3008

1225

10

42

3,7377

30

112,1301

900

38,2669

209,00

773,1000

5449

Total

Al reemplazar estos resultados en las fórmulas para determinar la pendiente y la ordenada en el origen, tenemos:

 n   n  n  n  xi  ln  yi     xi   ln  yi    i 1  i 1   10773,1  209   38,2669   0,02468 y ˆ1   i 1 2 2 105449   209   n 2  n  n  xi     xi   i 1   i 1 

Estadística (Civil/Electrónica/Telecomunicaciones)

ln ˆ0   ln Y   ln ˆ1 X 

176

UPC

38,2669  209    0,02468      4,3425 10  10 

Así, como ln ˆ0   4,3425  ˆ0  e 4,3425  7 6,8995 Entonces, la ecuación del modelo potencia estimado está dado por Y  7 6,8995  e 0, 0247 X .

Modelo Exponencial

La ecuación de regresión es lny = 4.3425 - 0.02468Deformación Análisis de Varianza Fuente Regresión Error Total

GL 1 8 9

SC Ajust. 0.65845 0.05360 0.71205

MC Ajust. 0.658453 0.006700

Valor F 98.28

Valor p 0.000

Resumen del modelo

S 0.0818508

R-cuad. 92.47%

R-cuad. (ajustado) 91.53%

R-cuad. (pred) 89.36%

Coeficientes

Término Constante Deformación

Coef 4.3425 -0.02468

EE del coef. 0.0581 0.00249

Valor T 74.72 -9.91

Valor p 0.000 0.000

c. Asumiendo que el modelo obtenido en el ítem anterior es válido, estime la dureza cuando la transformación es de 15 mm.

Estadística (Civil/Electrónica/Telecomunicaciones)

177

UPC

Ejemplo Se desea analizar la pureza del oxígeno producido en un proceso de destilación química, en base al porcentaje de hidrocarburos que están presentes en el condensador principal de la unidad de destilación. Se tomó una muestra aleatoria de diez observaciones para ambas variables, cuyos resultados se procesaron en Minitab, obteniendo las siguientes salidas: Regresión Lineal Simple: Análisis de regresión: Purezas vs. Porcentaje_hidrocarburo La ecuación de regresión es Purezas = 74.7 + 15.4 Porcentaje_hidrocarburo Predictor Constante Porcentaje_hidrocarburo S = 0.432434

Coef 74.6732 15.4301

R-cuad. = 88.6%

Análisis de varianza Fuente GL SC Regresión 1 105.32 Error residual 8 1.50 Total 9 106.82

SE Coef T 0.8126 91.89 0.6502 23.73

P 0.000 0.000

R-cuad.(ajustado) = 88.4%

CM 105.32 0.19

F 563.21

P 0.000

Modelo Exponencial Análisis de regresión: LnY vs. Nivel_hidrocarburo La ecuación de regresión es LnY = 4.34 + 0.166 Nivel_hidrocarburo Análisis de varianza Fuente Regresión Error residual Total S = 0.00505068

GL 1 8 9

SC 0.012149 0.000204 0.012353

CM 0.012149 0.000026

R-cuad. = 98.3%

Predictor Constante Nivel_hidrocarburo

Coef 4.33513 0.165720

F 476.24

P 0.000

R-cuad.(ajustado) = 98.1%

SE Coef 0.00949 0.007594

T 456.76 21.82

P 0.000 0.000

Estadística (Civil/Electrónica/Telecomunicaciones)

178

UPC

Modelo potencia Análisis de regresión: LnY vs. LnX La ecuación de regresión es LnY = 4.34 + 0.166 LnX Análisis de varianza Fuente Regresión Error residual Total

S = 0.00505068 Predictor Constante LnX

GL 1 8 9

SC 0.012149 0.000204 0.012353

CM 0.012149 0.000026

R-cuad. = 99.3%

Coef 4.33513 0.165720

SE Coef 0.00949 0.007594

F 476.24

P 0.000

R-cuad.(ajustado) = 99.1%

T 456.76 21.82

P 0.000 0.000

a. Determine y valide el modelo de regresión más adecuado (entre el lineal, exponencial y potencia). Utilice 5% de nivel de significación. Paso 1: Modelo

Paso 2: Validación del modelo

R2

Prioridad

Estadística (Civil/Electrónica/Telecomunicaciones)

179

UPC

b. Usando el modelo el modelo obtenido en el ítem anterior, estime la pureza del oxígeno producido, cuando el porcentaje de hidrocarburos presentes en el condensador principal de la unidad de destilación es de 1,36%.

Ejemplo En EE.UU. el costo del servicio para realizar llamadas telefónicas empleando la red satelital está en función a los minutos empleados. En cierto día se puso a prueba un plan llamado Beyond Zero, en la cual a mayor tiempo empleado en la llamada menor el costo por minuto. Se desea modelar el costo en función del tiempo con un modelo de regresión no lineal. Los datos se muestran a continuación así como las salidas del Minitab: Costo($)

2,5

2,2

1,05

0,81

0,56

0,45

0,5

2,65

0,75

Tiempo (min)

0,95

1,15

1,4

1,4

2,1

1,68

1,97

0,99

1,55

Regresión Lineal Simple: Fuente Regresión Error Total

GL 1 7 8

SC Ajust. 5.15119 1.43064 6.58182

MC Ajust. 5.15119 0.20438

Valor F 25.20

Valor p 0.002

Resumen del modelo S 0.452080

R-cuad. (ajustado) 75.16%

R-cuad. 78.26%

Coeficientes Término Coef Constante 4.180 Tiempo -1.983

R-cuad. (pred) 61.10%

EE del coef. Valor T 0.598 6.99 0.395 -5.02

Valor p 0.000 0.002

Ecuación de regresión Costo($) = 4.180 - 1.983 Tiempo(min)

Modelo Exponencial Análisis de regresión: lny Fuente Regresión Error Total

GL 1 7 8

vs. Tiempo

SC Ajust. 3.32458 0.66746 3.99204

MC Ajust. 3.32458 0.09535

Valor F 34.87

Valor p 0.001

Estadística (Civil/Electrónica/Telecomunicaciones)

180

UPC

Resumen del modelo S 0.308791

R-cuad. 83.28%

R-cuad. (ajustado) 80.89%

R-cuad. (pred) 69.54%

Coeficientes EE del Término Coef coef. Constante 2.352 0.409 Tiempo -1.593 0.270 Ecuación de regresión Lny

Valor T 5.76 -5.90

Valor p 0.001 0.001

VIF 1.00

= 2.352 - 1.593 Tiempo

Modelo potencia Análisis de regresión: lny Fuente Regresión Error Total

GL 1 7 8

vs. lnx

SC Ajust. 3.54008 0.45196 3.99204

MC Ajust. 3.54008 0.06457

Valor F 54.83

Valor p 0.000

Resumen del modelo S 0.254097

R-cuad. 88.68%

R-cuad. (ajustado) 87.06%

R-cuad. (pred) 80.97%

Coeficientes Término Constante lnx

Coef 0.840 -2.365

EE del coef. 0.140 0.319

Valor T 6.01 -7.40

Valor p 0.001 0.000

VIF 1.00

Ecuación de regresión lnny = 0.840 - 2.365 lnx

a. Determine y valide el modelo de regresión más adecuado (entre el lineal, exponencial y potencia). Use 5% de nivel de significación. Paso 1: Modelo

Paso 2: Validación del modelo

R2

Prioridad

Estadística (Civil/Electrónica/Telecomunicaciones)

UPC

181

b. Usando el modelo el modelo obtenido en el ítem anterior, estime el costo del servicio, cuando el tiempo empleado es de 2 minutos.

FÓRMULAS ESTADÍSTICAS

DISTRIBUCIONES IMPORTANTES Binomial

X ~ B(n , p)

P(X  x )  C nx p x (1  p) n x

Poisson

X ~ P ( )

P( X  x ) 

e  . x x!

f ( x)  P  X  x  

Hipergeométrica

X ~ H ( N , n, r )

Uniforme

X ~ U (a, b)

f x  

X ~ Exp( )

 1  1 x  e f ( x)   β  0 

Exponencial

1 ba

x  0 , 1 ,... , n

x  0 , 1 , 2 , ... Cxr CnNxr CnN

x  max[0, n  ( N  r )],..., min(r , n)

E(X)  np

V(X)  np (1  p)

E(X)  

V(X)  

EX   n

EX  

a xb

r N

ab 2

EX   

otro caso

ESTIMACIÓN POR INTERVALO Y PRUEBA DE HIPOTESIS Intervalos de Confianza

Estadístico de Prueba

Varianza desconocida



_

IC (  )  x  t ( n 1, / 2 )

_

s n

V X  

r r  N  n  1    N  N  N  1 

b  a 2 12

x0

F(x) = P(X ≤x) = 𝟏 − 𝒆−𝒙/𝜷 , x ≥ 0

Parámetro

V X   n

t

x  S/ n

~ t ( n 1)

V X    2

Universidad Peruana de Ciencias Aplicadas

IC ( p)  pˆ  Z(1 / 2)

p

2 

LIC( 2 ) 

Z

pˆ (1  pˆ ) n

(n  1)S  (2n  1,  / 2)

2

LSC( 2 ) 

2 

(n  1)S  (2n  1, 1 -  / 2) 2

pˆ  p p(1  p) n (n  1)S2 ~ X (2n 1) 2 

Varianzas poblacionales desconocidas pero iguales 1   2

_

t

_

( x 1  x 2 )  ( 1   2 )  1 1   S    n1 n 2 

~ t ( n1  n 2  2 )

donde S p2 

(n1  1) S12  (n2  1) S 22 n1  n 2  2

2 p

Varianzas poblacionales desconocidas y diferentes 2

t

( x1  x 2 )  (1   2 ) S12 n1

1

2

/  22



S22

~ t ( v)

n2

donde

 S12 S22     n n 2  1  v 2 2  S12   S22      n     1    n2  n1  1 n 2  1

S12 F  2 ~ Fn1 1, n2 1 S2

Estadística (Civil/Electrónica/Telecomunicaciones)

183

Universidad Peruana de Ciencias Aplicadas

ANÁLISIS DE REGRESIÓN Coeficiente de determinación SSR r2  SST

Modelos no lineales: Potencia: yˆ  ˆ0 x

ˆ1

o Lny  Lnˆ0  ˆ1 Lnx

Pronósticos: Valor individual yˆ 0  t ( n  2, / 2)s 1 

donde:

1 ( x 0  x )2  n Sxx

 x  

2

S xx   x

2 i

i

n



Exponencial: yˆ  ˆ0 e

ˆ1 x

o Lny  Lnˆ0  ˆ1 x

SS Re g ˆ1 2

s  CME

Estadística (Civil/Electrónica/Telecomunicaciones)

184

Tabla N° 2.1 TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal:  P  Z  z     Z -3.9 -3.8 -3.7 -3.6 -3.5 -3.4 -3.3 -3.2 -3.1 -3.0

-0.09 0.000033 0.000050 0.000075 0.000112 0.000165 0.000242 0.000349 0.000501 0.000711 0.001001

-0.08 0.000034 0.000052 0.000078 0.000117 0.000172 0.000251 0.000362 0.000519 0.000736 0.001035

-0.07 0.000036 0.000054 0.000082 0.000121 0.000178 0.000260 0.000376 0.000538 0.000762 0.001070

-0.06 0.000037 0.000057 0.000085 0.000126 0.000185 0.000270 0.000390 0.000557 0.000789 0.001107

-0.05 0.000039 0.000059 0.000088 0.000131 0.000193 0.000280 0.000404 0.000577 0.000816 0.001144

-0.04 0.000041 0.000062 0.000092 0.000136 0.000200 0.000291 0.000419 0.000598 0.000845 0.001183

-0.03 0.000042 0.000064 0.000096 0.000142 0.000208 0.000302 0.000434 0.000619 0.000874 0.001223

-0.02 0.000044 0.000067 0.000100 0.000147 0.000216 0.000313 0.000450 0.000641 0.000904 0.001264

-0.01 0.000046 0.000069 0.000104 0.000153 0.000224 0.000325 0.000466 0.000664 0.000935 0.001306

-0.00 0.000048 0.000072 0.000108 0.000159 0.000233 0.000337 0.000483 0.000687 0.000968 0.001350

-2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0

0.00139 0.00193 0.00264 0.00357 0.00480 0.00639 0.00842 0.01101 0.01426 0.01831

0.00144 0.00199 0.00272 0.00368 0.00494 0.00657 0.00866 0.01130 0.01463 0.01876

0.00149 0.00205 0.00280 0.00379 0.00508 0.00676 0.00889 0.01160 0.01500 0.01923

0.00154 0.00212 0.00289 0.00391 0.00523 0.00695 0.00914 0.01191 0.01539 0.01970

0.00159 0.00219 0.00298 0.00402 0.00539 0.00714 0.00939 0.01222 0.01578 0.02018

0.00164 0.00226 0.00307 0.00415 0.00554 0.00734 0.00964 0.01255 0.01618 0.02068

0.00169 0.00233 0.00317 0.00427 0.00570 0.00755 0.00990 0.01287 0.01659 0.02118

0.00175 0.00240 0.00326 0.00440 0.00587 0.00776 0.01017 0.01321 0.01700 0.02169

0.00181 0.00248 0.00336 0.00453 0.00604 0.00798 0.01044 0.01355 0.01743 0.02222

0.00187 0.00256 0.00347 0.00466 0.00621 0.00820 0.01072 0.01390 0.01786 0.02275

-1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0

0.02330 0.02938 0.03673 0.04551 0.05592 0.06811 0.08226 0.09853 0.11702 0.13786

0.02385 0.03005 0.03754 0.04648 0.05705 0.06944 0.08379 0.10027 0.11900 0.14007

0.02442 0.03074 0.03836 0.04746 0.05821 0.07078 0.08534 0.10204 0.12100 0.14231

0.02500 0.03144 0.03920 0.04846 0.05938 0.07215 0.08691 0.10383 0.12302 0.14457

0.02559 0.03216 0.04006 0.04947 0.06057 0.07353 0.08851 0.10565 0.12507 0.14686

0.02619 0.03288 0.04093 0.05050 0.06178 0.07493 0.09012 0.10749 0.12714 0.14917

0.02680 0.03362 0.04182 0.05155 0.06301 0.07636 0.09176 0.10935 0.12924 0.15151

0.02743 0.03438 0.04272 0.05262 0.06426 0.07780 0.09342 0.11123 0.13136 0.15386

0.02807 0.03515 0.04363 0.05370 0.06552 0.07927 0.09510 0.11314 0.13350 0.15625

0.02872 0.03593 0.04457 0.05480 0.06681 0.08076 0.09680 0.11507 0.13567 0.15866

-0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0

0.16109 0.18673 0.21476 0.24510 0.27760 0.31207 0.34827 0.38591 0.42465 0.46414

0.16354 0.18943 0.21770 0.24825 0.28096 0.31561 0.35197 0.38974 0.42858 0.46812

0.16602 0.19215 0.22065 0.25143 0.28434 0.31918 0.35569 0.39358 0.43251 0.47210

0.16853 0.19489 0.22363 0.25463 0.28774 0.32276 0.35942 0.39743 0.43644 0.47608

0.17106 0.19766 0.22663 0.25785 0.29116 0.32636 0.36317 0.40129 0.44038 0.48006

0.17361 0.20045 0.22965 0.26109 0.29460 0.32997 0.36693 0.40517 0.44433 0.48405

0.17619 0.20327 0.23270 0.26435 0.29806 0.33360 0.37070 0.40905 0.44828 0.48803

0.17879 0.20611 0.23576 0.26763 0.30153 0.33724 0.37448 0.41294 0.45224 0.49202

0.18141 0.20897 0.23885 0.27093 0.30503 0.34090 0.37828 0.41683 0.45620 0.49601

0.18406 0.21186 0.24196 0.27425 0.30854 0.34458 0.38209 0.42074 0.46017 0.50000

Universidad Peruana de Ciencias Aplicadas

Tabla N° 2.2 TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal:  P  Z  z     Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594

0.01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859

0.02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121

0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381

0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639

0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894

0.06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147

0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398

0.08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646

0.09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128

0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193

0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257

0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320

0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381

0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441

0.85543 0.87698 0.89617 0.91309 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500

0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558

0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615

0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670

2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9

0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813

0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819

0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825

0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831

0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836

0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841

0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846

0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851

0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856

0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861

3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.99995

0.99869 0.99907 0.99934 0.99953 0.99968 0.99978 0.99985 0.99990 0.99993 0.99995

0.99874 0.99910 0.99936 0.99955 0.99969 0.99978 0.99985 0.99990 0.99993 0.99996

0.99878 0.99913 0.99938 0.99957 0.99970 0.99979 0.99986 0.99990 0.99994 0.99996

0.99882 0.99916 0.99940 0.99958 0.99971 0.99980 0.99986 0.99991 0.99994 0.99996

0.99886 0.99918 0.99942 0.99960 0.99972 0.99981 0.99987 0.99991 0.99994 0.99996

0.99889 0.99921 0.99944 0.99961 0.99973 0.99982 0.99987 0.99992 0.99994 0.99996

0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.99996

0.99897 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.99997

0.99900 0.99929 0.99950 0.99965 0.99976 0.99984 0.99989 0.99993 0.99995 0.99997

Estadística (Civil/Electrónica/Telecomunicaciones)

186

Universidad Peruana de Ciencias Aplicadas

Tabla Nº 3.1 TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva:  P  T  c      

0.4

0.3

0.2

0.15

0.1

0.05

1 2 3 4 5 6 7 8 9 10

0.32492 0.28868 0.27667 0.27072 0.26718 0.26483 0.26317 0.26192 0.26096 0.26018

0.72654 0.61721 0.58439 0.56865 0.55943 0.55338 0.54911 0.54593 0.54348 0.54153

1.37638 1.06066 0.97847 0.94096 0.91954 0.9057 0.89603 0.88889 0.8834 0.87906

1.96261 1.38621 1.24978 1.18957 1.15577 1.13416 1.11916 1.10815 1.09972 1.09306

3.07768 1.88562 1.63774 1.53321 1.47588 1.43976 1.41492 1.39682 1.38303 1.37218

6.31375 2.91999 2.35336 2.13185 2.01505 1.94318 1.89458 1.85955 1.83311 1.81246

7.91582 10.57889 3.31976 3.89643 2.60543 2.95051 2.33287 2.60076 2.19096 2.42158 2.10431 2.31326 2.04601 2.24088 2.00415 2.18915 1.97265 2.15038 1.9481 2.12023

12.7062 15.89454 21.20495 31.82052 63.65674 4.30265 4.84873 5.64278 6.96456 9.92484 3.18245 3.48191 3.89605 4.5407 5.84091 2.77645 2.99853 3.29763 3.74695 4.60409 2.57058 2.75651 3.00287 3.36493 4.03214 2.44691 2.61224 2.82893 3.14267 3.70743 2.36462 2.51675 2.71457 2.99795 3.49948 2.306 2.44898 2.63381 2.89646 3.35539 2.26216 2.39844 2.5738 2.82144 3.24984 2.22814 2.35931 2.52748 2.76377 3.16927

1 2 3 4 5 6 7 8 9 10

11 12 13 14 15 16 17 18 19 20

0.25956 0.25903 0.25859 0.25821 0.25789 0.2576 0.25735 0.25712 0.25692 0.25674

0.53994 0.53862 0.5375 0.53655 0.53573 0.53501 0.53438 0.53382 0.53331 0.53286

0.87553 0.87261 0.87015 0.86805 0.86624 0.86467 0.86328 0.86205 0.86095 0.85996

1.08767 1.08321 1.07947 1.07628 1.07353 1.07114 1.06903 1.06717 1.06551 1.06402

1.36343 1.35622 1.35017 1.34503 1.34061 1.33676 1.33338 1.33039 1.32773 1.32534

1.79588 1.78229 1.77093 1.76131 1.75305 1.74588 1.73961 1.73406 1.72913 1.72472

1.92843 1.91231 1.89887 1.8875 1.87774 1.86928 1.86187 1.85534 1.84953 1.84433

2.09614 2.07644 2.06004 2.04617 2.03429 2.024 2.015 2.00707 2.00002 1.99371

2.20099 2.17881 2.16037 2.14479 2.13145 2.11991 2.10982 2.10092 2.09302 2.08596

2.32814 2.30272 2.2816 2.26378 2.24854 2.23536 2.22385 2.2137 2.2047 2.19666

2.49066 2.4607 2.43585 2.4149 2.39701 2.38155 2.36805 2.35618 2.34565 2.33624

2.71808 2.681 2.65031 2.62449 2.60248 2.58349 2.56693 2.55238 2.53948 2.52798

3.10581 3.05454 3.01228 2.97684 2.94671 2.92078 2.89823 2.87844 2.86093 2.84534

11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27 28 29 30

0.25658 0.25643 0.2563 0.25617 0.25606 0.25595 0.25586 0.25577 0.25568 0.25561

0.53246 0.53208 0.53175 0.53144 0.53115 0.53089 0.53065 0.53042 0.53021 0.53002

0.85907 0.85827 0.85753 0.85686 0.85624 0.85567 0.85514 0.85465 0.85419 0.85377

1.06267 1.06145 1.06034 1.05932 1.05838 1.05752 1.05673 1.05599 1.0553 1.05466

1.32319 1.32124 1.31946 1.31784 1.31635 1.31497 1.3137 1.31253 1.31143 1.31042

1.72074 1.71714 1.71387 1.71088 1.70814 1.70562 1.70329 1.70113 1.69913 1.69726

1.83965 1.83542 1.83157 1.82805 1.82483 1.82186 1.81913 1.81659 1.81424 1.81205

1.98804 1.98291 1.97825 1.97399 1.9701 1.96651 1.9632 1.96014 1.95729 1.95465

2.07961 2.07387 2.06866 2.0639 2.05954 2.05553 2.05183 2.04841 2.04523 2.04227

2.18943 2.18289 2.17696 2.17154 2.16659 2.16203 2.15782 2.15393 2.15033 2.14697

2.32779 2.32016 2.31323 2.30691 2.30113 2.29581 2.29091 2.28638 2.28217 2.27826

2.51765 2.50832 2.49987 2.49216 2.48511 2.47863 2.47266 2.46714 2.46202 2.45726

2.83136 2.81876 2.80734 2.79694 2.78744 2.77871 2.77068 2.76326 2.75639 2.75000

21 22 23 24 25 26 27 28 29 30

31 32 33 34 35 36 37 38 39

0.25553 0.25546 0.2554 0.25534 0.25528 0.25523 0.25518 0.25513 0.25508

0.52984 0.52967 0.5295 0.52935 0.52921 0.52908 0.52895 0.52883 0.52871

0.85337 0.853 0.85265 0.85232 0.85201 0.85172 0.85144 0.85118 0.85094

1.05406 1.0535 1.05298 1.05248 1.05202 1.05158 1.05117 1.05077 1.0504

1.30946 1.30857 1.30774 1.30695 1.30621 1.30551 1.30485 1.30423 1.30364

1.69552 1.69389 1.69236 1.69092 1.68957 1.6883 1.68709 1.68595 1.68488

1.81 1.80809 1.80629 1.80461 1.80302 1.80153 1.80012 1.79878 1.79751

1.95218 1.94987 1.9477 1.94567 1.94375 1.94195 1.94024 1.93863 1.93711

2.03951 2.03693 2.03452 2.03224 2.03011 2.02809 2.02619 2.02439 2.02269

2.14383 2.1409 2.13816 2.13558 2.13316 2.13087 2.12871 2.12667 2.12474

2.27461 2.2712 2.26801 2.26501 2.26219 2.25953 2.25702 2.25465 2.2524

2.45282 2.44868 2.44479 2.44115 2.43772 2.43449 2.43145 2.42857 2.42584

2.74404 2.73848 2.73328 2.72839 2.72381 2.71948 2.71541 2.71156 2.70791

31 32 33 34 35 36 37 38 39

40

0.25504

0.52861

0.8507

1.05005 1.30308 1.68385 1.79631

1.93566

2.02108

2.12291

2.25027

2.42326

2.70446

40

0.04

0.03

0.025

0.02

0.015

0.01

0.005

  Estadística (Civil/Electrónica/Telecomunicaciones)

187



Universidad Peruana de Ciencias Aplicadas

Tabla Nº 3.2 TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva:  P  T  c     α v

0.4

0.3

0.2

0.15

0.1

0.05

0.04

0.03

0.025

0.02

0.015

0.01

0.005

41 42 43 44 45 46 47 48 49 50

0.255 0.25496 0.25492 0.25488 0.25485 0.25482 0.25479 0.25476 0.25473 0.2547

0.5285 0.5284 0.52831 0.52822 0.52814 0.52805 0.52798 0.5279 0.52783 0.52776

0.85048 0.85026 0.85006 0.84987 0.84968 0.84951 0.84934 0.84917 0.84902 0.84887

1.04971 1.04939 1.04908 1.04879 1.04852 1.04825 1.048 1.04775 1.04752 1.04729

1.30254 1.30204 1.30155 1.30109 1.30065 1.30023 1.29982 1.29944 1.29907 1.29871

1.68288 1.68195 1.68107 1.68023 1.67943 1.67866 1.67793 1.67722 1.67655 1.67591

1.79517 1.79409 1.79305 1.79207 1.79113 1.79023 1.78937 1.78855 1.78776 1.787

1.93428 1.93298 1.93173 1.93054 1.92941 1.92833 1.92729 1.9263 1.92535 1.92444

2.01954 2.01808 2.01669 2.01537 2.0141 2.0129 2.01174 2.01063 2.00958 2.00856

2.12117 2.11952 2.11794 2.11644 2.115 2.11364 2.11233 2.11107 2.10987 2.10872

2.24825 2.24633 2.24449 2.24275 2.24108 2.23949 2.23797 2.23652 2.23512 2.23379

2.4208 2.41847 2.41625 2.41413 2.41212 2.41019 2.40835 2.40658 2.40489 2.40327

2.70118 2.69807 2.69510 2.69228 2.68959 2.68701 2.68456 2.68220 2.67995 2.67779

51 52 53 54 55 56 57 58 59 60

0.25467 0.25465 0.25462 0.2546 0.25458 0.25455 0.25453 0.25451 0.25449 0.25447

0.52769 0.52763 0.52757 0.52751 0.52745 0.5274 0.52735 0.5273 0.52725 0.5272

0.84873 0.84859 0.84846 0.84833 0.84821 0.84809 0.84797 0.84786 0.84776 0.84765

1.04708 1.04687 1.04667 1.04648 1.0463 1.04612 1.04595 1.04578 1.04562 1.04547

1.29837 1.29805 1.29773 1.29743 1.29713 1.29685 1.29658 1.29632 1.29607 1.29582

1.67528 1.67469 1.67412 1.67356 1.67303 1.67252 1.67203 1.67155 1.67109 1.67065

1.78627 1.78558 1.78491 1.78426 1.78364 1.78304 1.78246 1.7819 1.78137 1.78085

1.92356 1.92272 1.92191 1.92114 1.92039 1.91967 1.91897 1.9183 1.91765 1.91703

2.00758 2.00665 2.00575 2.00488 2.00404 2.00324 2.00247 2.00172 2.001 2.0003

2.10762 2.10655 2.10553 2.10455 2.10361 2.1027 2.10182 2.10097 2.10015 2.09936

2.2325 2.23127 2.23009 2.22895 2.22785 2.22679 2.22577 2.22479 2.22384 2.22292

2.40172 2.40022 2.39879 2.39741 2.39608 2.3948 2.39357 2.39238 2.39123 2.39012

2.67572 2.67373 2.67182 2.66998 2.66822 2.66651 2.66487 2.66329 2.66176 2.66028

61 62 63 64 65 66 67 68 69 70

0.25445 0.25444 0.25442 0.2544 0.25439 0.25437 0.25436 0.25434 0.25433 0.25431

0.52715 0.52711 0.52706 0.52702 0.52698 0.52694 0.5269 0.52687 0.52683 0.5268

0.84755 0.84746 0.84736 0.84727 0.84719 0.8471 0.84702 0.84694 0.84686 0.84679

1.04532 1.04518 1.04504 1.0449 1.04477 1.04464 1.04452 1.0444 1.04428 1.04417

1.29558 1.29536 1.29513 1.29492 1.29471 1.29451 1.29432 1.29413 1.29394 1.29376

1.67022 1.6698 1.6694 1.66901 1.66864 1.66827 1.66792 1.66757 1.66724 1.66691

1.78034 1.77986 1.77939 1.77893 1.77849 1.77806 1.77765 1.77724 1.77685 1.77647

1.91642 1.91584 1.91527 1.91472 1.91419 1.91368 1.91318 1.91269 1.91222 1.91177

1.99962 1.99897 1.99834 1.99773 1.99714 1.99656 1.99601 1.99547 1.99495 1.99444

2.0986 2.09786 2.09715 2.09645 2.09578 2.09514 2.09451 2.0939 2.0933 2.09273

2.22204 2.22118 2.22035 2.21955 2.21877 2.21802 2.21729 2.21658 2.21589 2.21523

2.38905 2.38801 2.38701 2.38604 2.3851 2.38419 2.3833 2.38245 2.38161 2.38081

2.65886 2.65748 2.65615 2.65485 2.65360 2.65239 2.65122 2.65008 2.64898 2.64790

75 80 85 90 95 100 105 110 120

0.25425 0.25419 0.25414 0.2541 0.25406 0.25402 0.25399 0.25396 0.25391

0.52664 0.5265 0.52637 0.52626 0.52616 0.52608 0.526 0.52592 0.5258

0.84644 0.84614 0.84587 0.84563 0.84542 0.84523 0.84506 0.8449 0.84463

1.04365 1.0432 1.0428 1.04244 1.04212 1.04184 1.04158 1.04134 1.04093

1.29294 1.29222 1.29159 1.29103 1.29053 1.29007 1.28967 1.2893 1.28865

1.66543 1.66412 1.66298 1.66196 1.66105 1.66023 1.6595 1.65882 1.65765

1.77473 1.77321 1.77187 1.77068 1.76961 1.76866 1.76779 1.76701 1.76564

1.90967 1.90784 1.90623 1.9048 1.90352 1.90237 1.90133 1.90039 1.89874

1.9921 1.99006 1.98827 1.98667 1.98525 1.98397 1.98282 1.98177 1.97993

2.09008 2.08778 2.08574 2.08394 2.08233 2.08088 2.07958 2.07839 2.07631

2.21216 2.20949 2.20713 2.20504 2.20317 2.2015 2.19998 2.19861 2.1962

2.3771 2.37387 2.37102 2.3685 2.36624 2.36422 2.36239 2.36073 2.35782

2.64298 2.63869 2.63491 2.63157 2.62858 2.62589 2.62347 2.62126 2.61742



0.25335

0.5244

0.84162

1.03643

1.28156

1.64484

1.75069

1.88079

1.95997

2.05375

2.17009

2.32635

2.57583

  Estadística (Civil/Electrónica/Telecomunicaciones)

188

Universidad Peruana de Ciencias Aplicadas

Tabla N°4.1 TABLA DE LA DISTRIBUCIÓN JI-CUADRADO



Áreas bajo la curva: P( 2  c)   v





1 2 3 4 5

0.995 0.000 0.010 0.072 0.207 0.412

0.990 0.000 0.020 0.115 0.297 0.554

0.980 0.001 0.040 0.185 0.429 0.752

0.975 0.001 0.051 0.216 0.484 0.831

0.960 0.003 0.082 0.300 0.627 1.031

0.950 0.004 0.103 0.352 0.711 1.145

0.900 0.016 0.211 0.584 1.064 1.610

0.800 0.064 0.446 1.005 1.649 2.343

0.700 0.148 0.713 1.424 2.195 3.000

0.600 0.275 1.022 1.869 2.753 3.656

0.500 0.455 1.386 2.366 3.357 4.351

6 7 8 9 10

0.676 0.989 1.344 1.735 2.156

0.872 1.239 1.647 2.088 2.558

1.134 1.564 2.032 2.532 3.059

1.237 1.690 2.180 2.700 3.247

1.492 1.997 2.537 3.105 3.697

1.635 2.167 2.733 3.325 3.940

2.204 2.833 3.490 4.168 4.865

3.070 3.822 4.594 5.380 6.179

3.828 4.671 5.527 6.393 7.267

4.570 5.493 6.423 7.357 8.295

5.348 6.346 7.344 8.343 9.342

11 12 13 14 15

2.603 3.074 3.565 4.075 4.601

3.053 3.571 4.107 4.660 5.229

3.609 4.178 4.765 5.368 5.985

3.816 4.404 5.009 5.629 6.262

4.309 4.939 5.584 6.243 6.914

4.575 5.226 5.892 6.571 7.261

5.578 6.304 7.041 7.790 8.547

6.989 7.807 8.634 9.467 10.307

8.148 9.034 9.926 10.821 11.721

9.237 10.182 11.129 12.078 13.030

10.341 11.340 12.340 13.339 14.339

16 17 18 19 20

5.142 5.697 6.265 6.844 7.434

5.812 6.408 7.015 7.633 8.260

6.614 7.255 7.906 8.567 9.237

6.908 7.564 8.231 8.907 9.591

7.596 8.288 8.989 9.698 10.415

7.962 8.672 9.390 10.117 10.851

9.312 10.085 10.865 11.651 12.443

11.152 12.002 12.857 13.716 14.578

12.624 13.531 14.440 15.352 16.266

13.983 14.937 15.893 16.850 17.809

15.338 16.338 17.338 18.338 19.337

21 22 23 24 25

8.034 8.643 9.260 9.886 10.520

8.897 9.542 10.196 10.856 11.524

9.915 10.600 11.293 11.992 12.697

10.283 10.982 11.689 12.401 13.120

11.140 11.870 12.607 13.350 14.098

11.591 12.338 13.091 13.848 14.611

13.240 14.041 14.848 15.659 16.473

15.445 16.314 17.187 18.062 18.940

17.182 18.101 19.021 19.943 20.867

18.768 19.729 20.690 21.652 22.616

20.337 21.337 22.337 23.337 24.337

26 27 28 29 30

11.160 11.808 12.461 13.121 13.787

12.198 12.878 13.565 14.256 14.953

13.409 14.125 14.847 15.574 16.306

13.844 14.573 15.308 16.047 16.791

14.851 15.609 16.371 17.138 17.908

15.379 16.151 16.928 17.708 18.493

17.292 18.114 18.939 19.768 20.599

19.820 20.703 21.588 22.475 23.364

21.792 22.719 23.647 24.577 25.508

23.579 24.544 25.509 26.475 27.442

25.336 26.336 27.336 28.336 29.336

31 60 70 120

14.458 35.534 43.275 83.852

15.655 37.485 45.442 86.923

17.042 39.699 47.893 90.367

17.539 40.482 48.758 91.573

18.683 42.266 50.724 94.303

19.281 43.188 51.739 95.705

21.434 46.459 55.329 100.624

24.255 50.641 59.898 106.806

26.440 53.809 63.346 111.419

28.409 56.620 66.396 115.465

30.336 59.335 69.334 119.334

Estadística (Civil/Electrónica/Telecomunicaciones)

189

Universidad Peruana de Ciencias Aplicadas

Tabla N°4.2 TABLA DE LA DISTRIBUCIÓN JI-CUADRADO



Áreas bajo la curva: P( 2  c)  

v

  0.050 0.025 0.020 0.010 3.841 5.024 5.412 6.635 5.991 7.378 7.824 9.210 7.815 9.348 9.837 11.345 9.488 11.143 11.668 13.277 11.070 12.832 13.388 15.086

1 2 3 4 5

0.250 1.323 2.773 4.108 5.385 6.626

0.200 1.642 3.219 4.642 5.989 7.289

0.150 2.072 3.794 5.317 6.745 8.115

0.125 2.354 4.159 5.739 7.214 8.625

0.100 2.706 4.605 6.251 7.779 9.236

6 7 8 9 10

7.841 8.558 9.037 9.803 10.219 11.030 11.389 12.242 12.549 13.442

9.446 10.748 12.027 13.288 14.534

9.992 11.326 12.636 13.926 15.198

10.645 12.017 13.362 14.684 15.987

12.592 14.067 15.507 16.919 18.307

14.449 16.013 17.535 19.023 20.483

15.033 16.622 18.168 19.679 21.161

16.812 18.475 20.090 21.666 23.209

18.548 20.278 21.955 23.589 25.188

11 12 13 14 15

13.701 14.845 15.984 17.117 18.245

14.631 15.812 16.985 18.151 19.311

15.767 16.989 18.202 19.406 20.603

16.457 17.703 18.939 20.166 21.384

17.275 18.549 19.812 21.064 22.307

19.675 21.026 22.362 23.685 24.996

21.920 23.337 24.736 26.119 27.488

22.618 24.054 25.471 26.873 28.259

24.725 26.217 27.688 29.141 30.578

26.757 28.300 29.819 31.319 32.801

16 17 18 19 20

19.369 20.489 21.605 22.718 23.828

20.465 21.615 22.760 23.900 25.038

21.793 22.977 24.155 25.329 26.498

22.595 23.799 24.997 26.189 27.376

23.542 24.769 25.989 27.204 28.412

26.296 27.587 28.869 30.144 31.410

28.845 30.191 31.526 32.852 34.170

29.633 30.995 32.346 33.687 35.020

32.000 33.409 34.805 36.191 37.566

34.267 35.718 37.156 38.582 39.997

21 22 23 24 25

24.935 26.039 27.141 28.241 29.339

26.171 27.301 28.429 29.553 30.675

27.662 28.822 29.979 31.132 32.282

28.559 29.737 30.911 32.081 33.247

29.615 30.813 32.007 33.196 34.382

32.671 33.924 35.172 36.415 37.652

35.479 36.781 38.076 39.364 40.646

36.343 37.659 38.968 40.270 41.566

38.932 40.289 41.638 42.980 44.314

41.401 42.796 44.181 45.558 46.928

26 27 28 29 30

30.435 31.528 32.620 33.711 34.800

31.795 32.912 34.027 35.139 36.250

33.429 34.574 35.715 36.854 37.990

34.410 35.570 36.727 37.881 39.033

35.563 36.741 37.916 39.087 40.256

38.885 40.113 41.337 42.557 43.773

41.923 43.195 44.461 45.722 46.979

42.856 44.140 45.419 46.693 47.962

45.642 46.963 48.278 49.588 50.892

48.290 49.645 50.994 52.335 53.672

31 60 70 120

35.887 66.981 77.577 130.055

37.359 68.972 79.715 132.806

39.124 71.341 82.255 136.062

40.181 72.751 83.765 137.990

41.422 74.397 85.527 140.233

44.985 79.082 90.531 146.567

48.232 83.298 95.023 152.211

49.226 84.580 96.387 153.918

52.191 88.379 100.425 158.950

55.002 91.952 104.215 163.648

Estadística (Civil/Electrónica/Telecomunicaciones)

0.005 7.879 10.597 12.838 14.860 16.750

190

Universidad Peruana de Ciencias Aplicadas

Tabla N°5.1 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F  c)    0.050 0.025 0.010 0.005

v2 1

1 2 3 4 161.45 199.50 215.71 224.58 647.79 799.48 864.15 899.60 4052.18 4999.34 5403.53 5624.26 16212.46 19997.36 21614.13 22500.75

v1 5 230.16 921.83 5763.96 23055.82

6 7 8 9 10 233.99 236.77 238.88 240.54 241.88 937.11 948.20 956.64 963.28 968.63 5858.95 5928.33 5980.95 6022.40 6055.93 23439.53 23715.20 23923.81 24091.45 24221.84

0.050 0.025 0.010 0.005

2

18.51 38.51 98.50 198.50

19.00 39.00 99.00 199.01

19.16 39.17 99.16 199.16

19.25 39.25 99.25 199.24

19.30 39.30 99.30 199.30

19.33 39.33 99.33 199.33

19.35 39.36 99.36 199.36

19.37 39.37 99.38 199.38

19.38 39.39 99.39 199.39

19.40 39.40 99.40 199.39

0.050 0.025 0.010 0.005

3

10.13 17.44 34.12 55.55

9.55 16.04 30.82 49.80

9.28 15.44 29.46 47.47

9.12 15.10 28.71 46.20

9.01 14.88 28.24 45.39

8.94 14.73 27.91 44.84

8.89 14.62 27.67 44.43

8.85 14.54 27.49 44.13

8.81 14.47 27.34 43.88

8.79 14.42 27.23 43.68

0.050 0.025 0.010 0.005

4

7.71 12.22 21.20 31.33

6.94 10.65 18.00 26.28

6.59 9.98 16.69 24.26

6.39 9.60 15.98 23.15

6.26 9.36 15.52 22.46

6.16 9.20 15.21 21.98

6.09 9.07 14.98 21.62

6.04 8.98 14.80 21.35

6.00 8.90 14.66 21.14

5.96 8.84 14.55 20.97

0.050 0.025 0.010 0.005

5

6.61 10.01 16.26 22.78

5.79 8.43 13.27 18.31

5.41 7.76 12.06 16.53

5.19 7.39 11.39 15.56

5.05 7.15 10.97 14.94

4.95 6.98 10.67 14.51

4.88 6.85 10.46 14.20

4.82 6.76 10.29 13.96

4.77 6.68 10.16 13.77

4.74 6.62 10.05 13.62

0.050 0.025 0.010 0.005

6

5.99 8.81 13.75 18.63

5.14 7.26 10.92 14.54

4.76 6.60 9.78 12.92

4.53 6.23 9.15 12.03

4.39 5.99 8.75 11.46

4.28 5.82 8.47 11.07

4.21 5.70 8.26 10.79

4.15 5.60 8.10 10.57

4.10 5.52 7.98 10.39

4.06 5.46 7.87 10.25

0.050 0.025 0.010 0.005

7

5.59 8.07 12.25 16.24

4.74 6.54 9.55 12.40

4.35 5.89 8.45 10.88

4.12 5.52 7.85 10.05

3.97 5.29 7.46 9.52

3.87 5.12 7.19 9.16

3.79 4.99 6.99 8.89

3.73 4.90 6.84 8.68

3.68 4.82 6.72 8.51

3.64 4.76 6.62 8.38

0.050 0.025 0.010 0.005

8

5.32 7.57 11.26 14.69

4.46 6.06 8.65 11.04

4.07 5.42 7.59 9.60

3.84 5.05 7.01 8.81

3.69 4.82 6.63 8.30

3.58 4.65 6.37 7.95

3.50 4.53 6.18 7.69

3.44 4.43 6.03 7.50

3.39 4.36 5.91 7.34

3.35 4.30 5.81 7.21

0.050 0.025 0.010 0.005

9

5.12 7.21 10.56 13.61

4.26 5.71 8.02 10.11

3.86 5.08 6.99 8.72

3.63 4.72 6.42 7.96

3.48 4.48 6.06 7.47

3.37 4.32 5.80 7.13

3.29 4.20 5.61 6.88

3.23 4.10 5.47 6.69

3.18 4.03 5.35 6.54

3.14 3.96 5.26 6.42

0.050 0.025 0.010 0.005

10

4.96 6.94 10.04 12.83

4.10 5.46 7.56 9.43

3.71 4.83 6.55 8.08

3.48 4.47 5.99 7.34

3.33 4.24 5.64 6.87

3.22 4.07 5.39 6.54

3.14 3.95 5.20 6.30

3.07 3.85 5.06 6.12

3.02 3.78 4.94 5.97

2.98 3.72 4.85 5.85

0.050 0.025 0.010 0.005

11

4.84 6.72 9.65 12.23

3.98 5.26 7.21 8.91

3.59 4.63 6.22 7.60

3.36 4.28 5.67 6.88

3.20 4.04 5.32 6.42

3.09 3.88 5.07 6.10

3.01 3.76 4.89 5.86

2.95 3.66 4.74 5.68

2.90 3.59 4.63 5.54

2.85 3.53 4.54 5.42

0.050 0.025 0.010 0.005

12

4.75 6.55 9.33 11.75

3.89 5.10 6.93 8.51

3.49 4.47 5.95 7.23

3.26 4.12 5.41 6.52

3.11 3.89 5.06 6.07

3.00 3.73 4.82 5.76

2.91 3.61 4.64 5.52

2.85 3.51 4.50 5.35

2.80 3.44 4.39 5.20

2.75 3.37 4.30 5.09

Estadística (Civil/Electrónica/Telecomunicaciones)

191

Universidad Peruana de Ciencias Aplicadas

Tabla N°5.2 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F  c)    0.050 0.025 0.010 0.005

v2 1

12 243.90 976.72 6106.68 24426.73

15 245.95 984.87 6156.97 24631.62

20 248.02 993.08 6208.66 24836.51

24 249.05 997.27 6234.27 24937.09

v1 30 250.10 1001.40 6260.35 25041.40

40 251.14 1005.60 6286.43 25145.71

50 251.77 1008.10 6302.26 25212.76

60 252.20 1009.79 6312.97 25253.74

70 252.50 1011.01 6320.89 25283.55

120 253.25 1014.04 6339.51 25358.05

0.050 0.025 0.010 0.005

2

19.41 39.41 99.42 199.42

19.43 39.43 99.43 199.43

19.45 39.45 99.45 199.45

19.45 39.46 99.46 199.45

19.46 39.46 99.47 199.48

19.47 39.47 99.48 199.48

19.48 39.48 99.48 199.48

19.48 39.48 99.48 199.48

19.48 39.48 99.48 199.48

19.49 39.49 99.49 199.49

0.050 0.025 0.010 0.005

3

8.74 14.34 27.05 43.39

8.70 14.25 26.87 43.08

8.66 14.17 26.69 42.78

8.64 14.12 26.60 42.62

8.62 14.08 26.50 42.47

8.59 14.04 26.41 42.31

8.58 14.01 26.35 42.21

8.57 13.99 26.32 42.15

8.57 13.98 26.29 42.10

8.55 13.95 26.22 41.99

0.050 0.025 0.010 0.005

4

5.91 8.75 14.37 20.70

5.86 8.66 14.20 20.44

5.80 8.56 14.02 20.17

5.77 8.51 13.93 20.03

5.75 8.46 13.84 19.89

5.72 8.41 13.75 19.75

5.70 8.38 13.69 19.67

5.69 8.36 13.65 19.61

5.68 8.35 13.63 19.57

5.66 8.31 13.56 19.47

0.050 0.025 0.010 0.005

5

4.68 6.52 9.89 13.38

4.62 6.43 9.72 13.15

4.56 6.33 9.55 12.90

4.53 6.28 9.47 12.78

4.50 6.23 9.38 12.66

4.46 6.18 9.29 12.53

4.44 6.14 9.24 12.45

4.43 6.12 9.20 12.40

4.42 6.11 9.18 12.37

4.40 6.07 9.11 12.27

0.050 0.025 0.010 0.005

6

4.00 5.37 7.72 10.03

3.94 5.27 7.56 9.81

3.87 5.17 7.40 9.59

3.84 5.12 7.31 9.47

3.81 5.07 7.23 9.36

3.77 5.01 7.14 9.24

3.75 4.98 7.09 9.17

3.74 4.96 7.06 9.12

3.73 4.94 7.03 9.09

3.70 4.90 6.97 9.00

0.050 0.025 0.010 0.005

7

3.57 4.67 6.47 8.18

3.51 4.57 6.31 7.97

3.44 4.47 6.16 7.75

3.41 4.41 6.07 7.64

3.38 4.36 5.99 7.53

3.34 4.31 5.91 7.42

3.32 4.28 5.86 7.35

3.30 4.25 5.82 7.31

3.29 4.24 5.80 7.28

3.27 4.20 5.74 7.19

0.050 0.025 0.010 0.005

8

3.28 4.20 5.67 7.01

3.22 4.10 5.52 6.81

3.15 4.00 5.36 6.61

3.12 3.95 5.28 6.50

3.08 3.89 5.20 6.40

3.04 3.84 5.12 6.29

3.02 3.81 5.07 6.22

3.01 3.78 5.03 6.18

2.99 3.77 5.01 6.15

2.97 3.73 4.95 6.06

0.050 0.025 0.010 0.005

9

3.07 3.87 5.11 6.23

3.01 3.77 4.96 6.03

2.94 3.67 4.81 5.83

2.90 3.61 4.73 5.73

2.86 3.56 4.65 5.62

2.83 3.51 4.57 5.52

2.80 3.47 4.52 5.45

2.79 3.45 4.48 5.41

2.78 3.43 4.46 5.38

2.75 3.39 4.40 5.30

0.050 0.025 0.010 0.005

10

2.91 3.62 4.71 5.66

2.85 3.52 4.56 5.47

2.77 3.42 4.41 5.27

2.74 3.37 4.33 5.17

2.70 3.31 4.25 5.07

2.66 3.26 4.17 4.97

2.64 3.22 4.12 4.90

2.62 3.20 4.08 4.86

2.61 3.18 4.06 4.83

2.58 3.14 4.00 4.75

0.050 0.025 0.010 0.005

11

2.79 3.43 4.40 5.24

2.72 3.33 4.25 5.05

2.65 3.23 4.10 4.86

2.61 3.17 4.02 4.76

2.57 3.12 3.94 4.65

2.53 3.06 3.86 4.55

2.51 3.03 3.81 4.49

2.49 3.00 3.78 4.45

2.48 2.99 3.75 4.41

2.45 2.94 3.69 4.34

0.050 0.025 0.010 0.005

12

2.69 3.28 4.16 4.91

2.62 3.18 4.01 4.72

2.54 3.07 3.86 4.53

2.51 3.02 3.78 4.43

2.47 2.96 3.70 4.33

2.43 2.91 3.62 4.23

2.40 2.87 3.57 4.17

2.38 2.85 3.54 4.12

2.37 2.83 3.51 4.09

2.34 2.79 3.45 4.01

Estadística (Civil/Electrónica/Telecomunicaciones)

192

Universidad Peruana de Ciencias Aplicadas

Tabla N°5.3 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F  c)    0.050 0.025 0.010 0.005

v2 13

1 4.7 6.4 9.1 11.4

2 3.8 5.0 6.7 8.2

3 3.4 4.3 5.7 6.9

4 3.2 4.0 5.2 6.2

v1 5 3.0 3.8 4.9 5.8

6 2.9 3.6 4.6 5.5

7 2.8 3.5 4.4 5.3

8 2.8 3.4 4.3 5.1

9 2.7 3.3 4.2 4.9

10 2.7 3.2 4.1 4.8

0.050 0.025 0.010 0.005

14

4.60 6.30 8.86 11.06

3.74 4.86 6.51 7.92

3.34 4.24 5.56 6.68

3.11 3.89 5.04 6.00

2.96 3.66 4.69 5.56

2.85 3.50 4.46 5.26

2.76 3.38 4.28 5.03

2.70 3.29 4.14 4.86

2.65 3.21 4.03 4.72

2.60 3.15 3.94 4.60

0.050 0.025 0.010 0.005

15

4.54 6.20 8.68 10.80

3.68 4.77 6.36 7.70

3.29 4.15 5.42 6.48

3.06 3.80 4.89 5.80

2.90 3.58 4.56 5.37

2.79 3.41 4.32 5.07

2.71 3.29 4.14 4.85

2.64 3.20 4.00 4.67

2.59 3.12 3.89 4.54

2.54 3.06 3.80 4.42

0.050 0.025 0.010 0.005

20

4.35 5.87 8.10 9.94

3.49 4.46 5.85 6.99

3.10 3.86 4.94 5.82

2.87 3.51 4.43 5.17

2.71 3.29 4.10 4.76

2.60 3.13 3.87 4.47

2.51 3.01 3.70 4.26

2.45 2.91 3.56 4.09

2.39 2.84 3.46 3.96

2.35 2.77 3.37 3.85

0.050 0.025 0.010 0.005

24

4.26 5.72 7.82 9.55

3.40 4.32 5.61 6.66

3.01 3.72 4.72 5.52

2.78 3.38 4.22 4.89

2.62 3.15 3.90 4.49

2.51 2.99 3.67 4.20

2.42 2.87 3.50 3.99

2.36 2.78 3.36 3.83

2.30 2.70 3.26 3.69

2.25 2.64 3.17 3.59

0.050 0.025 0.010 0.005

30

4.17 5.57 7.56 9.18

3.32 4.18 5.39 6.35

2.92 3.59 4.51 5.24

2.69 3.25 4.02 4.62

2.53 3.03 3.70 4.23

2.42 2.87 3.47 3.95

2.33 2.75 3.30 3.74

2.27 2.65 3.17 3.58

2.21 2.57 3.07 3.45

2.16 2.51 2.98 3.34

0.050 0.025 0.010 0.005

40

4.08 5.42 7.31 8.83

3.23 4.05 5.18 6.07

2.84 3.46 4.31 4.98

2.61 3.13 3.83 4.37

2.45 2.90 3.51 3.99

2.34 2.74 3.29 3.71

2.25 2.62 3.12 3.51

2.18 2.53 2.99 3.35

2.12 2.45 2.89 3.22

2.08 2.39 2.80 3.12

0.050 0.025 0.010 0.005

45

4.06 5.38 7.23 8.71

3.20 4.01 5.11 5.97

2.81 3.42 4.25 4.89

2.58 3.09 3.77 4.29

2.42 2.86 3.45 3.91

2.31 2.70 3.23 3.64

2.22 2.58 3.07 3.43

2.15 2.49 2.94 3.28

2.10 2.41 2.83 3.15

2.05 2.35 2.74 3.04

0.050 0.025 0.010 0.005

50

4.03 5.34 7.17 8.63

3.18 3.97 5.06 5.90

2.79 3.39 4.20 4.83

2.56 3.05 3.72 4.23

2.40 2.83 3.41 3.85

2.29 2.67 3.19 3.58

2.20 2.55 3.02 3.38

2.13 2.46 2.89 3.22

2.07 2.38 2.78 3.09

2.03 2.32 2.70 2.99

0.050 0.025 0.010 0.005

60

4.00 5.29 7.08 8.49

3.15 3.93 4.98 5.79

2.76 3.34 4.13 4.73

2.53 3.01 3.65 4.14

2.37 2.79 3.34 3.76

2.25 2.63 3.12 3.49

2.17 2.51 2.95 3.29

2.10 2.41 2.82 3.13

2.04 2.33 2.72 3.01

1.99 2.27 2.63 2.90

0.050 0.025 0.010 0.005

70

3.98 5.25 7.01 8.40

3.13 3.89 4.92 5.72

2.74 3.31 4.07 4.66

2.50 2.97 3.60 4.08

2.35 2.75 3.29 3.70

2.23 2.59 3.07 3.43

2.14 2.47 2.91 3.23

2.07 2.38 2.78 3.08

2.02 2.30 2.67 2.95

1.97 2.24 2.59 2.85

0.050 0.025 0.010 0.005

120

3.92 5.15 6.85 8.18

3.07 3.80 4.79 5.54

2.68 3.23 3.95 4.50

2.45 2.89 3.48 3.92

2.29 2.67 3.17 3.55

2.18 2.52 2.96 3.28

2.09 2.39 2.79 3.09

2.02 2.30 2.66 2.93

1.96 2.22 2.56 2.81

1.91 2.16 2.47 2.71

Estadística (Civil/Electrónica/Telecomunicaciones)

193

Universidad Peruana de Ciencias Aplicadas

Tabla N°5.4 TABLA DE LA DISTRIBUCIÓN F Áreas bajo la curva: P(F  c)   v1

 0.050 0.025 0.010 0.005

v2 13

12 2.6 3.2 4.0 4.6

15 2.5 3.1 3.8 4.5

20 2.5 2.9 3.7 4.3

24 2.4 2.9 3.6 4.2

30 2.4 2.8 3.5 4.1

40 2.3 2.8 3.4 4.0

50 2.3 2.7 3.4 3.9

60 2.3 2.7 3.3 3.9

70 2.3 2.7 3.3 3.8

120 2.3 2.7 3.3 3.8

0.050 0.025 0.010 0.005

14

2.53 3.05 3.80 4.43

2.46 2.95 3.66 4.25

2.39 2.84 3.51 4.06

2.35 2.79 3.43 3.96

2.31 2.73 3.35 3.86

2.27 2.67 3.27 3.76

2.24 2.64 3.22 3.70

2.22 2.61 3.18 3.66

2.21 2.60 3.16 3.62

2.18 2.55 3.09 3.55

0.050 0.025 0.010 0.005

15

2.48 2.96 3.67 4.25

2.40 2.86 3.52 4.07

2.33 2.76 3.37 3.88

2.29 2.70 3.29 3.79

2.25 2.64 3.21 3.69

2.20 2.59 3.13 3.59

2.18 2.55 3.08 3.52

2.16 2.52 3.05 3.48

2.15 2.51 3.02 3.45

2.11 2.46 2.96 3.37

0.050 0.025 0.010 0.005

20

2.28 2.68 3.23 3.68

2.20 2.57 3.09 3.50

2.12 2.46 2.94 3.32

2.08 2.41 2.86 3.22

2.04 2.35 2.78 3.12

1.99 2.29 2.69 3.02

1.97 2.25 2.64 2.96

1.95 2.22 2.61 2.92

1.93 2.20 2.58 2.88

1.90 2.16 2.52 2.81

0.050 0.025 0.010 0.005

24

2.18 2.54 3.03 3.42

2.11 2.44 2.89 3.25

2.03 2.33 2.74 3.06

1.98 2.27 2.66 2.97

1.94 2.21 2.58 2.87

1.89 2.15 2.49 2.77

1.86 2.11 2.44 2.70

1.84 2.08 2.40 2.66

1.83 2.06 2.38 2.63

1.79 2.01 2.31 2.55

0.050 0.025 0.010 0.005

30

2.09 2.41 2.84 3.18

2.01 2.31 2.70 3.01

1.93 2.20 2.55 2.82

1.89 2.14 2.47 2.73

1.84 2.07 2.39 2.63

1.79 2.01 2.30 2.52

1.76 1.97 2.25 2.46

1.74 1.94 2.21 2.42

1.72 1.92 2.18 2.38

1.68 1.87 2.11 2.30

0.050 0.025 0.010 0.005

40

2.00 2.29 2.66 2.95

1.92 2.18 2.52 2.78

1.84 2.07 2.37 2.60

1.79 2.01 2.29 2.50

1.74 1.94 2.20 2.40

1.69 1.88 2.11 2.30

1.66 1.83 2.06 2.23

1.64 1.80 2.02 2.18

1.62 1.78 1.99 2.15

1.58 1.72 1.92 2.06

0.050 0.025 0.010 0.005

45

1.97 2.25 2.61 2.88

1.89 2.14 2.46 2.71

1.81 2.03 2.31 2.53

1.76 1.96 2.23 2.43

1.71 1.90 2.14 2.33

1.66 1.83 2.05 2.22

1.63 1.79 2.00 2.16

1.60 1.76 1.96 2.11

1.59 1.74 1.93 2.08

1.54 1.68 1.85 1.99

0.050 0.025 0.010 0.005

50

1.95 2.22 2.56 2.82

1.87 2.11 2.42 2.65

1.78 1.99 2.27 2.47

1.74 1.93 2.18 2.37

1.69 1.87 2.10 2.27

1.63 1.80 2.01 2.16

1.60 1.75 1.95 2.10

1.58 1.72 1.91 2.05

1.56 1.70 1.88 2.02

1.51 1.64 1.80 1.93

0.050 0.025 0.010 0.005

60

1.92 2.17 2.50 2.74

1.84 2.06 2.35 2.57

1.75 1.94 2.20 2.39

1.70 1.88 2.12 2.29

1.65 1.82 2.03 2.19

1.59 1.74 1.94 2.08

1.56 1.70 1.88 2.01

1.53 1.67 1.84 1.96

1.52 1.64 1.81 1.93

1.47 1.58 1.73 1.83

0.050 0.025 0.010 0.005

70

1.89 2.14 2.45 2.68

1.81 2.03 2.31 2.51

1.72 1.91 2.15 2.33

1.67 1.85 2.07 2.23

1.62 1.78 1.98 2.13

1.57 1.71 1.89 2.02

1.53 1.66 1.83 1.95

1.50 1.63 1.78 1.90

1.49 1.60 1.75 1.86

1.44 1.54 1.67 1.77

0.050 0.025 0.010 0.005

120

1.83 2.05 2.34 2.54

1.75 1.94 2.19 2.37

1.66 1.82 2.03 2.19

1.61 1.76 1.95 2.09

1.55 1.69 1.86 1.98

1.50 1.61 1.76 1.87

1.46 1.56 1.70 1.80

1.43 1.53 1.66 1.75

1.41 1.50 1.62 1.71

1.35 1.43 1.53 1.61

Estadística (Civil/Electrónica/Telecomunicaciones)

194