170753222 Integracion Con Matlab

Estadística Básica Aplicaciones Carmen Rosa Barreto Rodríguez Estadística Básica Aplicaciones Catalogación de la Fu

Views 360 Downloads 146 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Integracion Numerica Con Matlab

59 0 328KB Read more

Integracion Con Condiciones Iniciales

35 0 313KB Read more

Superficies Con Matlab

10 4 853KB Read more

EE610 Practicas Con Matlab

77 2 1MB Read more

Metodos Numericos Con Matlab

27 0 715KB Read more

Control Digital Con Matlab

91 3 3MB Read more

Control Con MATLAB

44 0 1MB Read more

Thd Con Matlab

analisis de distorcion armonica con matlab analisis de distorcion armonica con matlabanalisis de distorcion armonica con

55 2 3MB Read more

Ejercicios Resueltos Con Matlab

34 1 764KB Read more

Controlador Fuzzy con matlab

29 6 262KB Read more

Author / Uploaded
Jose Ortiz Robles

Citation preview

Estadística Básica Aplicaciones

Carmen Rosa Barreto Rodríguez

Estadística Básica Aplicaciones

Catalogación de la Fuente Barreto Rodríguez, Carmen Rosa Estadística Básica: Aplicaciones.- Chimbóte: ULADECH, 2007 290 p.; il.; 21 cm. (Serie Universidad en marcha N° 5) D. Lea. N° 2008 - 08727 ISBN: 978-603-45269-3-8 1.

Estadística Básica 1.- Estadística Descriptiva 3.- Probabilidades D. 519.5/b25

ESTADÍSTICA BÁSICA 1 Serie: Universidad en marcha N° 5 Primera edición: Enero 2007 Primera reimpresión: Julio 2008 Tiraje: 1 millar Carmen Rosa Barreto Rodríguez De esta edición Universidad Los Ángeles de Chimbóte Jr. Leoncio Prado N° 443 Chimbóte Ancash - Perú telf.: (043) 342698 www.uladeeh.edu.pe Manuel Cardoza Sernaqué - Editor Hecho el depósito legal en la Biblioteca Nacional del Perú Reg. N° 201209837 ISBN: 978-60345269-3-8 Impreso en Perú en Imprenta Editora Gráfica Real S.A.C. Jr. Independencia 953, Trujillo - Perú T. (51-44)253324 www.graficarealtrujillo.com Prohibida la reproducción total o parcial de esta obra sin previa autorización escrita de los titulares de copyright

Impreso en Perú / Printed in Perú ISBN: 978-603-45269-4-5

9 786034

526945

A mis padres Alejandrina y Raymundo, a mi hijo Ayrton Benjamín a quien con inmenso amor dejo abierto el camino de la superación, y a mi maestro Julio Domínguez Granda.

Nota preliminar

Las técnicas y métodos fundamentales de la estadística descriptiva e inferencial regularmente incluidos en un curso de estadística básica, la explicación sencilla de estos métodos que contribuyen a la formación básica de los estudiantes de diversas especialidades, son analizadas en este iibro surgido de la experiencia docente en las aulas de la Universidad Los Ángeles de Chimbóte, que busca de esta forma subsanar la escasez de bibliografía adecuada a que debe tener acceso el estudiante. Estadística Básica /Aplicaciones consta de siete capítulos: Estadística Descriptiva, Medidas de Resumen, Distribuciones Bidimensionales de Frecuencias. Nociones de Probabilidad, Distribuciones de Probabilidad Importantes, Introducción a la Inferencia Estadística e Introducción a las Técnicas de Muestreo: teoría complementada con ejemplos resueltos y problemas propuestos a los cuales se ha anexado como apéndice las principales tablas estadísticas. Este libro es un aporte del docente al estudiante, al sistema y a la vida universitaria que demanda un cambio urgente en el desempeño de sus actores; es una herramienta de utilidad innegable que dejamos en manos del educando y el maestro acucioso, como testimonio de un trabajo y una fe en la educación peruana que día a día se multiplica en las miradas de los hombres y mujeres que protagonizan el trabajo educativo peruano.

El Editor

ÍNDICE Pág. 1. ESTADÍSTICA DESCRIPTIVA 15 1.1. ¿QUÉ ES LA ESTADÍSTICA? 15 1.2. DIVISIÓN DE LA ESTADÍSTICA. 15 1.3. RESEÑA HISTÓRICA DE LA ESTADÍSTICA. 16 1.4. IMPORTANCIA DE LA ESTADÍSTICA. 17 1.5.LA ESTADÍSTICA EN EL DESARROLLO DE LA19 INVESTIGACIÓN. 1.6.VARIABLES. 20 1.7.ESCALAS DE MEDICIÓN. 21 1.8. TÉRMINOS DE ESTADÍSTICA. 22 1.9. RECOLECCIÓN DE DATOS. 23 1.9.1. Fuentes de Información. 23 1.9.2. Sistemas de Recolección. 24 1.9.3. Técnicas de Recolección. 24 1.10. ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS.25 1.10.1. Revisión y Corrección de Datos. 25 1.10.2. Con strucción de Tablas de Distribuciones de 25 Frecuencias. 1.10.2.1. Di stribuciones de Frecuencias para 26 Variables Cuantitativas. 1.10.2.2. Di stribución de Frecuencias para 35 Variables Cualitativas. 1.10.3. Representación Tabular y Gráfica. 36 1.10.3.1. Cuadr os Estadísticos 36 1.10.3.2. Repre sentación Gráfica 37 2. MEDIDAS DE RESUMEN 53 2.1. MEDIDAS DE TENDENCIA CENTRAL. 53 2.1.1. La Media Aritmética. 53 2.1.2. La Mediana. 58 2.1.3. La Moda. 63 2.2. MEDIDAS DE POSICIÓN O CUANTILAS 67 2.2.1. Cuartiles. 67 2.2.2. D eciles. 71 2 2 3 Percentiles 74 2.3.MEDIDAS DE DISPERSIÓN O VARIABILIDAD. 77 2.3.1. Rango o Recorrido de una Variable. 78 2.3.2. Rango Intercuartil. 78 2.3.3. Rango Semi Intercuartil. 79 2.3.4. Varianza. 80 2.3.5. Desviación Estándar o Típica. 82 2.3.6. Coeficiente de Variación. 83 2.4.MEDIDAS DEASIMETRÍA. 84

2.4.1. 2.4.2.

El Coeficiente de Asimetría de Pearson. 84 La Media Asimétrica. 85 2.5.MEDIDAS DE KÚRTOSIS. 87 2.6.DIAGRAMA DE CAJA. 89 3. DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS. 95 3.1. TIPOS DE VARIABLE ESTADÍSTICA BIDIMENSIONAL. 95 3.2.REPRESENTACIÓN DE LA INFORMACIÓN MEDIANTE TABLAS 95 BIDIMENSIONALES. 3.3. DISTRIBUCIONES MARGINALES. 97 3.4. FRECUENCIAS RELATIVAS BIDIMENSIONALES. 98 3.5. PROPIEDADES DE LAS FRECUENCIAS BIDIMENSIONALES.100 3.6.MEDIDAS ESTADÍSTICAS EN UNA DISTRIBUCIÓN 101 BIDIMENSIONAL DE FRECUENCIAS. 3.6.1.Medias y Varianzas Marginales para las Variables X e Y. 101 3.6.2. Covarianza. 103 4. NOCIONES DE PROBABILIDAD. 107 4.1. EXPERIMENTO. 107 4.1.1. Experimento Determinístíco. 107 4.1.2. Experimento Aleatorio. 108 4.1.3. Características de un Experimento Aleatorio. 108 4.2. ESPACIO MUESTRAL. 108 4.2.1. Espacio Muestral Discreto. 109 4.2.2. Espacio Muestral Continuo. 109 4.3. EVENTOS. 109 4.3.1. Tipos de Eventos. 109 4.3.2. Operaciones con Eventos. 110 4.3.3.Eventos Mutuamente Excluyentes y Colectivamente 112 Exhaustivos. 4.3.4. Propiedades de las Operaciones con Eventos. 113 4.4. PROBABILIDAD. 115 4.5. TIPOS DE PROBABILIDAD. 115 4.5.1. Probabilidad Clásica. 115 4.5.2. Probabilidad de Frecuencia Relativa. 116 4.5.3. Probabilidad Subjetiva. 118 4.6. AXIOMAS DE PROBABILIDAD. 118 4.7. TEOREMAS DE LOS AXIOMAS DE PROBABILIDAD. 119 4.8. PROBABILIDAD CONDICIONAL. 119 4.9. REGLAS DE PROBABILIDAD. 120 4.9.1. Probabilidad del Producto. 120 4.9.2. Probabilidad de la Suma. 122 4.10. TABLAS DE CONTINGENCIA Y TABLAS DE PROBABILIDAD. 125 4.10.1. Tablas de Contingencia. 125 4.10.2. Tablas de Probabilidad. 125 4.11. TEOREMA DE BAYES. 128 4.11.1. Partición de un Espacio Muestral. 128 4.11.2. Probabilidad Total. 128 4.11.3. Teorema de Bayes. 129 5. DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES 141

5.1.DISTRIBUCIONES DE PROBABILIDAD DE TIPO DISCRETO. 141 5.1.1. Distribución de Bernoulli. 141 5.1.2. Distribución Binomial. 142 5.1.2.1.Uso de la Tabla de la Distribución Binomial. 144 5.1.3. Distribución de Poisson. 145 5.1.3.1. Distri bución de Poisson como Aproximación de la 147 Binomial. 5.1.3.2. Uso de la Tabla de la Distribución de Poisson. 147 5.2.DISTRIBUCIONES DE PROBABILIDAD DETIPO CONTINUO. 148 5.2.1. Distribución Normal. 148 5.2.1.1.Propiedades de la Distribución Normal. 149 5.2.1.2. La Distribución Normal Estándar. 150 5.2.1.3.Uso de Tablas de la Distribución Normal Estándar. 150 5.2.1.4.Propiedades para el Cálculo de Otras Areas en la Distribución Normal Estándar. 154 5.2.1.5.Aplicaciones de la Distribución Normal Estándar. 157 5.2.2. Distribución t de Student. 161 5.2.2.1.UsodeTablas de la Distribución t de Student. 162 5.2.3. Distribución Chi Cuadrado. 165 5.2.3.1.Uso de la Tabla de la Distribución Chi Cuadrado. 166 6. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. 173 6.1.ESTIMACIÓN DE PARÁMETROS. 173 6.1.1. Estimación Puntual. 173 6.1.2. Estimación por Intervalos. 173 6.1.2.1.Intervalo de Confianza para la Media Poblacional. 174 6.1.2.2. Intervalos de Confianza para la Proporción Poblacional. 180 6.1.2.3. Interv alos de Confianza para la Diferencia de Medias 183 Poblacionales. 6.1.2.4. Interv alos de Confianza para la Diferencia de Medias 191 Poblacionales con Observaciones Pareadas. 6.1.2.5. Interv alo de Confianza para la Diferencia de 194 Proporciones Poblacionales. 6.2.PRUEBADEHIPÓTESIS. 195 6.2.1. Prueba de Hipótesis para la Media Poblacional. 199 6.2.2. Prueba de Hipótesis para la Proporción Poblacional. 208 6.2.3. Prueb a de Hipótesis para la Diferencia de Medias 214 Poblacionales.

6.2.4. a de Hipótesis para la Diferencia de Medias Poblacionales con Observaciones Pareadas. 6.2.5. a de Hipótesis para la Diferencia de Proporciones Poblacionales. 6.3.ANÁLISIS DE REGRESIÓN LINEALSIMPLE. 6.3.1. Elección de una Relación Funcional. 6.3.2. El Método de los Mínimos Cuadrados Ordinarios. 6.4.ANÁLISIS DE CORRELACIÓN LINEALSIMPLE. 6.5.PRUEBADE INDEPENDENCIA. 7. INTRODUCIÓNA LAS TÉCNICAS DE MUESTREO. 7.1.TIPOS DE MUESTREO. 7.1.1. Métodos de Muestreo Probabilístico. 7.1.2. Métodos de Muestreo no Probabilístico. 7.2.CALCULO DELTAMAÑO MUESTRAL. 7.2.1. Para el Muestreo Aleatorio Simple. 7.2.2. Para el Muestreo Aleatorio Sistemático. 7.2.3. Para el MuestreoAleatorio Estratificado. 7.2.4. el MuestreoAleatorio por Conglomerado. APÉNDICE. BIBLIOGRAFÍA.

Prueb 223 Prueb 227 230 231 232 241 245 269 269 269 270 271 271 274 274 Para 276 279 289

Carmen Rosa Barreto Rodríguez

10

CAPITULO 1 ESTADÍSTICA DESCRIPTIVA 1.1 .¿QUÉ ES LA ESTADÍSTICA? El origen etimológico de la palabra "estadística” no está bien determinado, puesto que existen distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa “balanza”, otros sostienen que deriva del latín STATUS que significa “situación”, mientras que algunos autores afirman que procede del alemán STAAT que significa “Estado”. En el caso concreto de suponer que viene del vocablo "Estado”, es por el hecho de que una de las funciones tradicionales del gobierno central y del Estado es llevar registros sobre la situación de la población, nacimientos, defunciones, producción, impuestos y otros hechos contables y de control. La evolución y desarrollo de la “estadística’’ en el mundo actual es tal que sería difícil dar una definición precisa de este concepto, pero particularmente daremos la siguiente definición: La estadística es una ciencia que proporciona un conjunto de métodos y técnicas que se utilizan para recolectar, organizar, presentar, analizar e interpretar el comportamiento de los datos con respecto a una característica materia de estudio e investigación con la finalidad de obtener conclusiones válidas y tomar decisiones razonables de acuerdo a tales análisis. 1.2. DIVISIÓN DE LA ESTADÍSTICA La Estadística se divide en dos grandes áreas: Estadística Descriptiva y Estadística Inferencial. a) Estadística Descriptiva: Parte de la estadística que analiza y describe un conjunto de datos de una muestra o de una población sin sacar conclusiones de tipo general. Cuadro s

>

Análisis Descriptivo

b) Estadística Inferencíal: Parte de la Estadística que infiere o induce leyes de comportamiento para una población a través de una muestra aleatoria seleccionada de dicha población. 1.3.

R

Estadística Inferencial

E SEÑA HISTÓRICA DE LA ESTADÍSTICA El desarrollo de la Estadística atraviesa portres etapas: a) Etapa Inicial: Se extiende desde la antigüedad hasta mediados del siglo XVIII. Se caracteriza porque la Estadística está asociada a los censos poblaciones y registro de bienes y servicios de un Estado o pueblo Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios ya usaban pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante el trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI A.C. Los libros bíblicos de números y crónicas incluyen en algunas partes trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar natural de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594 A.C. para cobrar impuestos. El Imperio Romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de los territorios bajo su control. Durante la Edad Media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios, Pipino El Breve y Cario Magno, ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762, respectivamente.

Después de la conquista normanda de Inglaterra en 1066. el Rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevadoa cabo en 1086, se recoge en el Domesday Betk. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations in the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En nuestro país, en el Imperio Incaico los registros de población y censo se llevaron a cabo mediante los quipus. b) Etapa de la Sistematización: Se caracteriza por la aparición de tres escuelas que sistematizan la estadística: b.1) Escuela Alemana: Creó la primera cátedra en estadística, en las universidades alemanas se enseñaba la técnica de los censos. Se considera esta disciplina como la descripción de los fenómenos concernientes al Estado 1 administración. b.2) Escuela Inglesa: Cuantificaron las leyes que rigen los fenómenos sociales y como consecuencia arimetizar la estadística. Se le conoce a esta disciplina como Estadística Investigadora. b.3) Escuela Francesa: Introduce la teoría de las probabilidades como fundamento matemático de la Estadística. La teoría de las probabilidades se incorpora rápidamente como un instrumento poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos cuyas causas son demasiado complejas para conocerlos totalmente y hacer posible su análisis. c) Etapa Actual: Comprendida entre principios del siglo XIX hasta nuestros días. En esta etapa la matemática se plasma como columna vertebral de la estadística y se caracteriza por el gran desarrollo alcanzado como ciencia y como una metodología de la investigación científica aplicada a todas las ramas del saber humano: Ingeniería, Biología, Economía, Medicina, Agronomía, Educación, Comercio, Derecho, etc. 2

¿.IMPORTANCIA DE LA ESTADÍSTICA La estadística es importante, desde el punto de vista cultural, en la formación general del ciudadano, quien precisa tener cierta cultura estadística para leer e interpretar cuadros y gráficos que con frecuencia aparecen en los medios informativos; por su utilidad en las diferentes disciplinas como herramienta básica para la investigación en el estudio de

fenómenos complejos en los que hay comenzar por definir el objeto de estudio y las variables relevantes, tomardatos de los mismos, interpretaciones y analizarlos; por su aporte en el desarrollo personal fomentando un razonamiento critico basado en la valoración de la evidencia objetiva, es decir hemos de ser capaces de usar los datos cuantitativos para controlar nuestros juicios e interpretar el de los demás: es importante para adquirir un sentido crítico de los métodos y razonamientos que permitan resolver problemas de decisión y efectuar predicciones, porque ayuda a comprender otros temas del currículo, tanto de la educación obligatoria como universitaria, donde con frecuencia aparecen gráficos, resúmenes, términos o conceptos estadísticos, además de ser un buen vehículo para alcanzar las capacidades de comunicación, tratamiento de información, resolución de problemas, uso de ordenadores y trabajo cooperativo y en grupo a los que se da bastante importancia en los nuevos currículos. La estadística es importante, desde una perspectiva económica y financiera, por ser ella una herramienta válida para quien formula las políticas económicas, para quien asesora al presidente y a otros funcionarios públicos, por su ayuda inteligente en la toma de decisiones sobre tasas tributarias, programas sociales y otros asuntos que se manejan en el área gubernamental y empresarial, así como en el mundo de los negocios en cuestiones de rentabilidad. Expresa también que para los que trabajan en el área de investigación de mercados, la estadística es de gran ayuda para determinar la reacción de los consumidores frente a los actuales productos de una empresa y en el lanzamiento de los nuevos, como también para evaluar las oportunidades de inversión por parte de los asesores financieros. Desde una perspectiva industrial, la estadística es importante ya que juega un papel importante en el proceso de transformación necesario para la sobrevivencia de la industria nacional en concierto con la industria mundial. En este nuevo escenario, empresas que sobrevivan a la fuerte competencia y a los cambios permanentes de la expectativa de los clientes serán aquéllas que demuestran flexibilidad, orientando sus procesos y productos a los consumidores, con calidad superior, rapidez, bajo precio y utilizando nuevos recursos para cualquier otro competidor. Para lograrlo existe una necesidad crítica de los métodos y pensamientos estadísticos para tomar decisiones no sólo a nivel operacional. sino también en los niveles de alta dirección. En la actualidad la estadística es considerada como una de las ciencias metodológicas fundamentales y base del método científico experimental, es por eso que como especialista en la materia considero que la

estadística es muy importante por ser una ciencia de carácter instrumental para otras disciplinas, tales como medicina, ingeniería, contabilidad, administración, educación, etc., y que contribuye a tomar decisiones inteligentes y significativas en ambientes de incertidumbre de acuerdo a la naturaleza del problema por resolver. 2.5. LA ESTADÍSTICA EN EL DESARROLLO DE LA INVESTIGACIÓN La investigación científica consiste en la búsqueda de la verdad, de una verdad que ya existe pero que tenemos que descubrir. El proceso de investigación científica comienza con un problema, que constituye el punto de partida. Del análisis lógico del problema surge una hipótesis, que viene a ser una respuesta preliminar al problema. Para comprobar la hipótesis, se recolectan pruebas, hechos, datos, observaciones. etc., los mismos que clasificados, analizados o interpretados permiten la demostración de la hipótesis, llegándose a la generalización, es decir, a establecer los principios o leves. El proceso utilizado es la investigación científica, el principio o ley que se ha obtenido es la ciencia. La estadística está relacionada directamente con el método científico por lo siguiente: En el proceso de observación y los hechos a observar. Además, la estadística ayuda a que las observaciones sean exactas. En el proceso de formulación de hipótesis la estadística permite descubrir algunas relaciones que conducen a la formulación de hipótesis. En el proceso de verificación de hipótesis la estadística permite, a través de sus técnicas, la presentación adecuada de los resultados y el uso correspondiente de las pruebas de significación en el análisis inferencial.

Esquemáticamente podemos observar esta relación: RELACIÓN DE LA ESTADÍSTICA CON EL MÉTODO CIENTÍFICO

MÉTODO CIENTÍFICO

ESTADISTICA

Observaciones Formulación de hipótesis Verificación de hipótesis

Datos Datos relacionados Técnicas adecuadas

2.5.1. Etapas del Método Estadístico: De acuerdo con el orden de aplicaciones de la estadística, el método estadístico se lleva a cabo en cuatro etapas: a) Etapa de Planificación: Esta etapa define claramente la naturaleza y objetivos de la investigación, así como los detalles concernientes a la recolección, clasificación y análisis de la información, en base a lo cual se describen las características de una determinada población o se confirma o niega una determinada hipótesis de trabajo. b) Etapa de Recolección: Esta etapa consiste en determinar los métodos de recolección adecuados para preparar los instrumentos de recolección, probar del método y los instrumentos de recolección seleccionados y realizar la recolección de datos. c) Organización y Presentación de Datos: En esta etapa se debe tratar de asegurar la validez y confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los datos y finalmente presentarlos en cuadros estadísticos y gráficos. d) Análisis e Interpretación de Resultados: En esta etapa se calculan indicadores y medidas de resumen que describen el conjunto de datos. 2.6. VARIABLES Es una característica de la población que se va a investigar y puede tomar diferentes valores. Las variables se clasifican en: cuantitativas y cualitativas: a) Variables Cuantitativas: Cuando el valor de la variable es de carácter numérico. Las variables cuantitativas pueden ser discretas y continuas. a. 1) Variable Cuantitativa Discreta: Cuando el valor de la variable está representado sólo por números enteros (positivos). Ejemplo 1: X: número de hijos a. 2) Variable Cuantitativa Continua: Cuando el valor de la variable puede tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier número real.

Ejemplo 2: X: precio en soles b) Variabie Cualitativa: Cuando expresa una cualidad o atributo tiene carácter cualitativo, Sus datos se expresan mediante una palabra. Es no numérico. La variable cualitativa puede ser: nominal u ordinal. b.1) Variable Cualitativa Nominal: Es aquélla que establece la distinción de los elementos en las categorías sin implicar orden entre ellas. Ejemplo 3: X: sexo: masculino, femenino. b. 2) Variable Cualitativa Ordinal: Es aquélla que agrupa a los objetos, individuos, en categorías ordenadas para establecer relaciones comparativas. Ejemplo 4: Y: nivel de pobreza: o pobre, pobre, muy pobre, extremadamente pobre. 2.7. ESCALAS DE MEDICIÓN Las variables no sólo se clasifican, sino también se miden. La medición se hace con el fin de diferenciar, por comparación, un elemento de otro en las características de la variable. Esto se hace a través de niveles o escalas, entre las cuales tenemos: a) Escala Nominal: Es el nivel más simple de medición donde las variables establecen categorías sin orden. En este nivel las categorías sólo se nombran o se enumeran, pero no se comparan. Ejemplo 5: X: sexo: masculino y femenino b) Escala Ordinal: Es el segundo nivel de medición donde la variable establece categorías jerarquizadas. Este nivel de medición no mide las magnitudes de diferencias, pero si permite apreciar qué valores asignados a los individuos caen más altos o más bajo que otros. Ejemplo 6: X: grado de instrucción: primaria, secundaria, superior c) Escala de Intervalo: Es el tercer nivel de medición, entre cuyos diversos valores que toma la variable existen, a la vez, clasificación, orden y grados de distancias iguales entre las diferentes categorías, es decir, los intervalos son considerados como equivalentes y con un origen convencional (la unidad de medida no necesariamente empieza de cero; sólo sirve como punto o valor de comparación). Ejemplo 7: X: coeficiente de inteligencia

d) Escala de Razón o Proporción: Es el nivel más alto de medición y donde la variable supone o comprende a la vez todos los casos anteriores: clasificación, orden, distancia y origen único natural (la unidad de medida necesariamente tiene que empezar de cero). Ejemplo 8: X: edad en años 2.8. TÉRMINOS DE ESTADÍSTICA Considerando que existe un conjunto de términos que se usan frecuentemente en estadística, conviene precisar el significado de algunos de ellos. a) Población(N): Es el conjunto de todos los individuos, objetos u observaciones que poseen alguna característica observable común. Ejemplo 9: La población de estudiantes de la Universidad Los Ángeles de Chimbóte. Una población puede clasificarse como finita o infinita. a. 1) Población Finita: Es aquélla que tiene un número limitado de elementos. Ejemplo 10: Las edades de todos los estudiantes de la Universidad Los Ángeles de Chimbóte. a. 2) Población Infinita: Es aquélla que tiene un número ilimitado de elementos. Ejemplo 11: El número de unidades elaboradas en un proceso de producción continuo. b) Muestra (n): Es una parte o un subconjunto representativo de la población y al proceso de obtener la muestra se llama muestreo. La selección y el estudio de la muestra tiene por objeto la extracción de conclusiones que sean válidas para la población de la cual se obtuvo dicha muestra. Ejemplo 12: Estudio de una muestra aleatoria de 200 estudiantes de la ULADECH según su nivel socio económico. c) Unidad Estadística: También se le conoce como unidad de observación o unidad de análisis. Es el elemento u objeto indivisible de la población que será analizado y sobre los cuales se obtendrán los datos. Ejemplo 13: Si se quiere estudiar el rendimiento académico de los alumnos de la Universidad Los Ángeles de Chimbóte, la unidad estadística serán los alumnos.

d) Datos: También se les conoce como observaciones. Son los valores recopilados como resultado de las observaciones de una variable. e) Parámetro: Es un valor obtenido para describir en forma resumida las características pertinentes o más importantes de una población. Ejemplo 14: El sueldo promedio de todos los trabajadores de la Empresa Sider Perú de Chimbóte. f) Estadígrafo: También se le conoce como estadístico(a). Es una medida descriptiva de una muestra. El estadígrafo sirve como estimación del parámetro. Ejemplo 15: El sueldo promedio del 25% de los trabajadores de la Empresa SiderPerú de Chimbóte. g) Indicadores: Son elementos característicos que describen una situación permitiendo su análisis. Son referentes empíricos que permiten una medición, descripción, ordenamiento de los datos característicos en forma válida y confiable. Los indicadores no determinan la realidad, la realidad la determina el valor del indicador. La validez y confiabilidad del indicador depende de la validez de los datos utilizados y de la lógica de su relación o construcción. Son indicadores los llamados índices, tasas, estadígrafos, medidas de resumen, etc. 2.9. RECOLECCIÓN DE DATOS La recolección o recopilación de datos es el momento en el cual el investigador se pone en contacto con los sujetos, objetos o elementos sometidos a estudio con el propósito de obtener los datos o respuestas de las variables consideradas; a partir de estos datos se prepara la información estadística y se calcula las medidas de resumen e indicadores para el análisis estadístico. Para recogerla información se toma en cuenta las siguientes modalidades: las fuentes de información, los sistemas de recolección y las técnicas de recolección. 2.9.1. Fuentes de Información Es el lugar, la institución o persona donde están los datos que se necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de información pueden ser:

a) Fuentes Primarias: Cuando los datos se obtienen directamente de la misma persona o entidad utilizando ciertas técnicas. Ejemplo 16: Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los trabajadores de una empresa “x". b) Fuentes Secundarias: Cuando los datos ya han sido elaborados y procesados por otras personas o instituciones. Ejemplo 17: La información estadística que publica el INEI de los diferentes ministerios del Perú. 2.9.2. Sistemas de Recolección Son procedimientos que se utilizan para recoger información. Pueden ser: a) Los Registros: Son libros, padrones en donde se anotan en forma regular permanente y obligatoria los hechos ocurridos. Ejemplo 18: Registros Civiles, RENIEC, Registros Públicos, etc. b) Las Encuestas: Son procedimientos de obtención de información estructurada según criterios previos de sistematización que se efectúa con un propósito específico en la población o en un sector de ella. Pueden ser: b. 1) Encuesta Censal: Cuando abarca toda la población en estudio. Ejemplo 19: Censos de población y vivienda de una localidad o país. b. 2) Encuesta Muestral: Cuando abarca una parte de la población en estudio. Ejemplo 20: Llevar a cabo una encuesta de preferencia electoral. 2.9.3. Técnicas de Recolección Son procedimientos que se utilizan para recolectar información según la naturaleza del trabajo de investigación. Pueden ser: El cuestionario, la entrevista, el análisis de contenido, etc. a) La observación: Es la acción de mirar con rigor, en forma sistemática y profunda, con el interés de descubrir la importancia de aquello que se observa. b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas que se formulan al

encuestado o entrevistado con el propósito de obtener datos de las variables consideradas en estudio. c) La entrevista: Es un diálogo entre personas, es una técnica donde una persona llamada entrevistador, encuestador o empadronador solicita al entrevistado le proporcione algunos datos e información. d) Análisis de contenidos: Es la técnica más elaborada y que goza de mayor prestigio en el campo de la observación documental. El fin o propósito del análisis del contenido consiste en determinar los puntos más importantes de un documento para observar y reconocer el significado de los mismos en sus elementos, como palabras, frases, etc., y en clasificarlos adecuadamente para su análisis y explicación. Puede aplicarse a cualquier forma de comunicación: programas televisivos, programas radiofónicos, artículos de prensa, libros, poemas, conversaciones, pinturas, discursos, cartas, melodías, etc. 2.10. ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS Una vez que usted ha llevado a cabo la recolección de datos es necesario organizados y presentarlos adecuadamente de tal manera que facilite su comprensión, descripción y análisis del fenómeno en estudio y obtener conclusiones válidas para la toma de decisiones. Se consideran las siguientes actividades: revisión y corrección de los datos, construcción de tablas de distribución de frecuencias y representación tabular y gráfica. 2.10.1. Revisión y Corrección de los Datos Todo análisis estadístico, por acabado y seguro que sea, es capaz de suministrar respuestas inadecuadas si éste se basa en una información incorrecta, es por eso que es necesario inspeccionar la validez y confiabilidad de los datos para corregir los errores y omisiones de acuerdo a ciertas reglas. 2.10.2. Construcción de Tablas de Distribución de Frecuencias Después de la revisión y corrección de los datos recopilados, seguidamente se deben ordenar y clasificar según su magnitud y agruparlos de acuerdo a sus características en grupos más condensados en una tabla de frecuencias. En ella se observa la frecuencia o repetición de cada uno de os valores de la variable después de realizar la operación de tabulación.

2.10.2.1. Distribución de Frecuencias para Variables Cuantitativas: Son tablas de trabajo estadístico que presentan la distribución de un conjunto de datos cuando la variable es cuantitativa ya sea discreta o continua. Cuando la variable es discreta se llama distribución de frecuencias en puntos aislados. Cuando la variable es continua se llama distribución de frecuencias en intervalos de clase. Para construir este tipo de tablas se deben tomar en cuenta los siguientes elementos: %

a) Valor de la variable o Intervalo de clase: También se le conoce como clase, resulta de la clasificación o categorización de la variable y se representa por Y¡ alos puntos y por Ll - LS a los intervalos. b) Frecuencia Absoluta: Es el número de veces que se repite un determinado valor de la variable; en el caso de intervalos, es el número de observaciones comprendidas en dicho intervalo. Se representa por í con (¡=1,2... m); donde “m” representa el número de valores distintos que toma la variable Y, o el número de intervalos considerados (m n/2 -----------► “i” determina clase en donde se encuentra la Me.

Ejemplo 40: Calcular e interpretar la mediana de los datos de la tabla N° 2. TABLA N° 13 N° de Trabajadores

N° de Empresas

Me=

F.

f

y,

0

2

2

1

4 12 -----------8 4

6 18 26 30

(5) «---------------------------------

3 4

TOTAL

-

30

Aquí vemos que n = 30 —► n/2 = 15

n

1 2 3

4 5 Entonces la primera frecuencia acumulada que excede a — = 15 es 18, esto es: 18 >15 F, >15 1 ----------►"{ = 3", la mediana se encuentra en la 3ra. clase Me = 2 trabajadores

Interpretación: El 50% de las pequeñas empresas tienen como máximo 2 trabajadores y el otro 50% supera dicho número. A.2.2. La mediana cuando la variable es continua: Para calcular la mediana cuando la variable es continua se utilizará la siguiente fórmula: w T1

Me

=

^ [ n i 2 — /%_,]

LIU) +

C, x ¿--------------LLJ

Se debe cumplir la siguiente relación: tr /

L

f,

“i”: detennina el intervalo en donde se encuentra la Me

Cuando:

F-—

2

La mediana está dada por:

Me = LI{j)

Ll„

C, n

F„

Además: Límite inferior del intervalo en donde se encuentra la Me. Amplitud o ancho del intervalo en donde se encuentra la Me. Número de observaciones de la muestra. Frecuencia acumulada inmediata anterior al intervalo en donde se encuentra la Me. f Frecuencia absoluta del intervalo en donde se encuentra la Me.

Ejemplo 41: Calculare interpretar la mediana de los datos de la tabla N° 6. Solución: TABLA N° 14

Gastos semanales

N° de

i

en dólares - LS (n

Turistas /,

F,

1

(400 - 520)

2

2

2 3 4 5

[520 [640 [760 [880

3 8 4 3

5 13 17 20

20

-

- 640) - 760) - 880) -1000]

Total

Vemos que n = 20 c=í> — = 10 y de acuerdo a la relación dada tenemos: 5 < 10 < 13 F,< 10 < F, -► i = 3, la mediana se encuentra en el 3er intervalo.

Reemplazando los

el

subíndice i = 3 en la fórmula y

valores

[w/2

-F2]

,n

correspondientes tenemos:

Me = ¿/(3) + C3 x

[10-5] 640+ 120 x

Me = $715

Me =

Interpretación: El 50% de los turistas gastaron como máximo $715 y el otro 50% supera dicho monto. B. Características: La mediana es un estadígrafo que no está afectada por valores extremos muy altos o muy bajos y por lo tanto es más representativa que la media aritmética, o cuando las distribuciones son poco simétricas. Es útil cuando los datos agrupados tienen clases abiertas en los extremos. Es una medida única; esto es, una distribución tiene solamente una mediana. 2.1.3. La Moda: Es una medida de tendencia central que corresponde al valor de la variable que tiene frecuencia máxima. Notación: Md. Una distribución puede ser amodal si no tiene ninguna moda, unimodal si tiene una moda, bimodal si tiene dos modas y multimodal si tiene tres o más modas. En consecuencia, es necesario considerar modas absolutas y modas relativas. A. Formas de Cálculo: A.1. Para datos no agrupados La moda será el valor que se repite el mayor número de veces. Ejemplo 42: Calcular e interpretar la moda délas edades en años de 11 personas: X,: 28,22,28,23,28,21,28,20,28,27,28 Solución: Observamos que el valor que se repite frecuentemente es 28. Entonces: Md = 28años Interpretación: El mayor número de personas tiene 28 años. Ejemplo 43: Calculare interpretar la moda del coeficiente intelectual expresado en puntaje del siguiente grupo de alumnos. X¡: 95,100,105,100,95,100,100,110,95 Solución: Md = 95y 100

Interpretación: El mayor número de alumnos tiene un coeficiente intelectual de 95 y 100 puntos. En este caso la serie es bimodal. A.2. Para datos agrupados A.2.1. La moda cuando la variable es discreta La moda será clase cuya frecuencia es máxima. Así: Md = Y, Tal que: £ . , < $ > £ + , ^—► “i” determina la clase en donde se encuentra la moda

Ejemplo 44: Calcular e interpretar la moda de los datos de la tabla N° 2. Solución: TABLA N° 15

N° de Trabajadores

N° de Empresas

y,

f,

0

2

1

4 12

3 4 TOTAL

©

-—

8 4 30

Observamos que la mayor frecuencia es 12 y se cumple que: ^—► “i” = 3 la moda se encuentra en la 3ra. clase. Por lo tanto:

Md = 2 trabajadores

4 < 12 > 8

Interpretación: El mayor número de pequeñas empresas tiene 2 trabajadores afiliados al SPP. A. 2.2. La moda cuando la variable es continua: Para calcular la moda cuando la variable es continua se utilizará la siguiente fórmula:

Md = LI( ) + C x ——— ' d,+d 2 Se debe cumplir la siguiente relación:

f-\ f M Además:

d, = f; - f;., d2 = í;-í+1

L,.

i" determina en intervalo en donde se encuentra la moda

Ejemplo 45: Calcular e interpretar la moda de los datos dados en la tabla N° 6 referidos a los gastos semanales en dólares de 20 turistas. Solución: TABLA N° 16 Gastos semanales en dólares

N° de Turistas

LS[¡)

/

[400 - 520)

2

[520 - 640) [640 - 760) *--------- — 8 [760 - 880) [880 -1000] TOTAL

3 4 3 20

Observamos en la tabla N° 16 que la mayor frecuencia es 8 y se cumple que: 3

4

\

f, < f, > f , ^ * i = 3. la Md. se encuentra en el tercer intervalo

d,=f, - f, = 8-3 = 5

d:=f, - f, =

8-4=4 Reemplazando el subíndice i = 3 en la fórmula y los valores correspondientes tenemos:

Md

= 640 + 120 x9

Md -

706.67 dólares

Interpretación: El mayor número de turistas gasta semanalmente 706.67 dólares. B. Características: No se encuentra afectada por valores extremos. Puede usarse cuando los datos presentan clases abiertas en los extremos. No es significativa a menos que la distribución contenga un gran número de datos y exista significativa repetición de alguno de ellos. Muchas veces la serie no tiene moda porque ningún valor se repite. Cuando la serie tiene dos, tres o más modas, se hace difícil su interpretación y comparación.

RELACIONES ENTRE LA MEDIA, MEDIANA Y MODA En una distribución unimodal, si la distribución es simétrica, entonces la media, mediana y moda son iguales (fig.2). Esto es:

x - Me - Mo

Md < Me < x fig. 1

x = Me = Md fig. 2

X < Me < Md

fig. 3

Si la distribución es asimétrica de cola derecha, entonces la moda es menor que la mediana y esta a su vez menor que la media (fig. 1) Si la distribución es asimétrica de cola izquierda, entonces la media es menor que la mediana y ésta a su vez menor que la moda (fig. 3). Para distribuciones unimodales y asimétricas, se tiene la siguiente relación empírica: x - Mo = 3(x - Me) Las tres medidas de tendencia central, media, mediana y moda, pueden calcularse también para distribuciones de frecuencias con intervalos de diferente longitud, siempre que puedan determinarse las marcas de clase (para la media) o el límite inferior Ll del intervalo para la mediana y la moda. 2.2. MEDIDAS DE POSICIÓN O CUANTILAS Son estadígrafos que dividen a una distribución de frecuencias en cuatro, diez o cien partes iguales. Los cuantilas más usados son: cuartiles, deciles y percentiles. 2.2.1. Cuartiles: Son estadígrafos que dividen a la distribución en cuatro partes iguales, cada una de ellas incluye el 25% de las observaciones. Si se estudia el 25% de las observaciones se dice que se está analizando el cuartil 1 (Q.) Q. se interpreta como el límite máximo del 25% de las observaciones inferiores, o como el límite mínimo del 75% de las observaciones superiores. Si se estudia el 50% de las observaciones se dice que se está analizando el cuartil 2 (Q,). Se interpreta como el límite máximo del 50% de las observaciones inferiores, o como el límite mínimo del 50% de las observaciones superiores (Q, = Me). Si se estudia el 75% de las observaciones se dice que se está analizando el cuartil 3 (Q,). Q3 se interpreta como el límite máximo del 75% de las observaciones inferiores, o como el límite mínimo del

25% de las observaciones superiores. Esquemáticamente se tiene: 25% 25%

25% 25% Total 100%

A. Formas de Cálculo: A.1. Para datos no agrupados El procedimiento que se emplea para calcular los cuartiles es similar al seguido n +1 para la mediana: en vez de considerar el lugar = se reemplaza por: l 2 Lugar = ------ , para el Q, 4 í Lugar = — (n + 1) , para el Q, 4 Si k{n + l)/4 no es exacta. Q< se obtiene interpolando linealmente los dos valores correspondientes a las dos observaciones entre las cuales se encuentra la fracción. Ejemplo 46: Al examinar los registros de facturación mensual de una empresa editora con ventas a crédito, el auditor toma una muestra de 11 facturas no pagadas. Las sumas que se adeudan a la compañía en soles son: 400,1800. 1100,700,700, 1000. 2100,500,3300,900 y 1200. Calcule e interprete Q., Q2, Q3 Solución: a) Ordenando los datos en forma ascendente: 400.500,700,700,900,1000,1100,1200,1800,210 0,3300 b) Ubicando el lugar en donde encuentra el Q,, Q2, Q3

3 ParaQ, _____► lugar = — (// + 1) = 9 4 c) Q, = S/.700, Q2 = S/.1000, Q3 = S/.1800 d) Interpretación: Q.: El 25% de las facturas tienen una deuda máxima de S/.700. Q:,: El 50% de las facturas tienen una deuda máxima de SI. 1000. Q,: El 75% de las facturas tienen una deuda máxima de SI. 1800. A.2. Para datos agrupados Trabajamos el desarrollo de los cuartiles cuando la variable es continua. A.2.1. Cuartil cuando la variable es continúa Para calcular el cuartil cuando la variable es continua se utilizará la siguiente fórmula: ZT

k

-* -

f F„

a =¿/(,>+c,x Se debe cumplir la siguiente relación:

-*■ “i": determina el intervalo en

donde se encuentra el Qk

Cuando:

Entonces:

Qk ~ LIU,

Donde: LIU)

Límite inferior del intervalo en donde se encuentra el Q,

C¡ :

Amplitud o ancho del intervalo en donde se encuentra el Qk n Número de observaciones de la muestra.

Frecuencia acumulada inmediata anterior al intervalo en donde se encuentra el Qk.

F¡.,:

f,

Frecuencia absoluta del intervalo en donde se encuentra Qk.

En general Q.

3, la distribución es leptokúrtica.

Otro estadígrafo de kúrtosis es: 2,

K=

. 3.-JL. 2(^00 ^o)

Si: Para la “curva normal” K = 0.2630 Una distribución será mesokúrtica si K tiende a 0.2630 por ambos lados. Si el valor de K se aleja hacia la derecha tendiendo a V 2, la distribución será leptokúrtica. Si se aleja hacia la izquierda tendiendo a cero, la distribución será platikúrtica. Puede ser útil observar el siguiente esquema para determinar la Kúrtosis. PLATIKURTICA

1/8

1/4

1 1

MESOCIJRTICA

' l—

0.125

1

02630

3/8

1/2

LI-PTOCURTICA

0.375

0.5

NOTA: Para las distribuciones notablemente discrepantes de la normal estas medidas pueden resultar contradictorias.

Ejemplo 61: Calcular e interpretar el coeficiente de Kurtósis para los datos dados en la tabla N°6. Solución: Utilizando el coeficiente de Kúrtosis 1) obtenemos:

_ 883505232 . 4

(.y")' (20122.11)2

Interpretación: Este valor indica que la distribución es platikúrtica. 2.6. DIAGRAMA DE CAJA (BOX PLOTS) Es una representación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, la desviación de la simetría y la desviación de las observaciones que se alejan de manera poco usual del resto de los datos (a este tipo de valores se le conoce como valores atípicos). El diagrama de caja se basa en la mediana (o en la media), los cuartiles y valores extremos. La caja representa el rango intercuartil que encierra el 50% de los valores y tiene la mediana (Me) dibujada dentro. El rango intercuartil tiene como extremos el percentil 75, P 75 (cuartil superior) y el percentil 25 P2S (cuartil inferior). Además de la caja se incluye la extensión de los datos mediante segmentos que se extienden de la caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos. Este recuadro se dibuja con el eje de la variable en forma horizontal o vertical, como se indica en la fig. 10: DIAGRAMA DE CAJA U

P7

5 Me P 25 L fig. 10

Respecto a: -

Centralización: observamos la ubicación de la mediana. La dispersión: observamos el rango intercuartil:

RI = P15 - P2$

La asimetría: observamos la comparación deMe -

P2S

^25 < ^75 - Me la distribución es asimétrica positiva. Si Me - P > P - Me la distribución es asimétrica negativa y si 2S

Me

-

P25

15

=

P2i - Me \a

distribución es simétrica.

con

P1S - Me

Si

Me-

Las colas observamos la longitud de los segmentos que salen de los lados de la caja las cuales localizan fuera de ellos sus valores atípicos. Los diagramas de cajas son muy útiles para analizar la variabilidad entre varias distribuciones que tienen la misma unidad de medida, mediante comparaciones gráficas. Tienen un gran impacto visual y son fáciles de comprender. Ejemplo 62: Los siguientes datos corresponden a los sueldos mensuales en soles en una muestra aleatoria de 50 trabajadores. 807 660

811 753

650 918

817 857

732 867

747 675

823 880

844 878

907 890

872

620 105 0 869

881 766

841

847

833

829

827

822

811

787

923

792

803

933

947

717

817

753

105 6

107 6

958

970

776

828

831

781

108 8

108 2

Analizar los datos utilizando un diagrama de caja. Solución: De los datos ordenados se observa en la fig. 11: Me = S/.832 P2S = 781 + 0.75 (787 - 781) = 785.5 P75 = 890 + 0.25 (907-890) = 894.25 Rl = 894.25 -785.5 Rl = 108.75 Extensión superior: P75 + 1.5 x Rl = 894.25 +1.5x108.75 = 1057.38 Entonces el dato máximo no atípico es 1056. Los datos atípicos en el lado superior son: 1076,1082,1088. Extensión inferior: P„-1.5xRI = 894.25- 1.5x108.75 = 731.13 Entonces el dato mínimo no atípico es 732. Los datos atípicos en el lado inferior son: 620,650,660,675, 717.

DIAGRAMA DE CAJA

1100

u 1000 900

P75 Me 800

P25 L

700

600

fig. 11

Además se observa en la fig. 11 que la distribución es asimétrica negativa ya que Me - PJ5> P75 - Me. NOTA: Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquéllos que se ubican fuera del intervalo P2S -1.5RI, P7S + 1.5RI, donde Rl = P 7S - P2S es el rango intercuartil. En este caso, el extremo inferior L es el dato mínimo no outliers y el extremo superior U es el dato máximo no outliers.

PROBLEMAS PROPUESTOS N° 2 1. Como Gerente de Ventas de IBM, usted desea calcular las medidas de tendencia central para los niveles de utilidad de dicha firma durante los últimos nueve meses, ya que las siguientes utilidades están dadas en miles de dólares. X,: 21.6; 22.3; -3.4; 21.6; 18.9; 17.9; -12.8; 23.1; 22.3 Se pide: a) Calcular la media, mediana y moda e interpretar. b) Calcular el rango, varianza, desviación estándar y coeficiente de variación e interpretar. 2. En un supermercado trabajan 35 mujeres con un salario promedio de S/.500.00 y 15 hombres que en promedio ganan un 30% más que las mujeres. ¿Cuál es el salario promedio de los empleados de dicho supermercado? 3. La siguiente tabla corresponde a las calificaciones de 30 alumnos en el curso de Estadística. Calificaciones Ll LS

N° de alummos f.

[05 - 08)

3

[08 [11 [14 [17

6 12 6 3

-

11) 14) 17) 20)

TOTAL

30

Se pide: a) Calcular la media, media y moda e interpretar. b) CalcularQ,, Q2 yQ3e interpretar. c) Calcular la varianza, desviación estándar y coeficiente de variación e interpretar. d) Calcular el coeficiente de asimetría e interpretar. e) Calcular el coeficiente de Kúrtosis e interpretar 4. Los trabajadores de una empresa solicitan en una convención colectiva que cada salario de sus afiliados sea aumentado según la ecuación:

Y¡ =1.2*,.+ 20

Se sabe que antes del reajuste el salario promedio mensual era $6 500.00. ¿Cuál sería el nuevo promedio del salario mensual de los trabajadores? 5. Las notas de un examen se tabularon en una distribución de frecuencias de cuatro intervalos de amplitud iguales a cuatro, siendo el dato mínimo igual a cuatro y las frecuencias relativas primera y tercera respectivamente 0.15 y 1. 35. Calcule la varianza de la distribución si su media es 12.4. 6. Los siguientes datos muestran los calificativos de 20 personas sometidas a una prueba de aptitud. Los 20 estudiantes fueron divididos en dos grupos, el grupo 1 calificó de 0 a 100 y elgrupo2de0a20: Grupo 1:86,81,79,73,95,86,94, 90,86, 88 Grupo 2:16,19,13,20,14,16,19,18,17,15 a) Calcule la media y la desviación estándar en cada grupo. ¿Cuál de los grupos es más homogéneo? 7. Los sueldos en dólares de 50 empleados de una empresa se dan en la siguiente tabla. Sueldo en dólares

{60 -100)

[100-140)

[140-180)

[180-220)

[220-260)

Empleados

8

10

20

7

5

Se plantea dos alternativas de aumento. La primera consiste en un aumento general $50. La segunda consiste en un aumento general del 30% del sueldo, además de una bonificación de $10. ¿Cuál de las dos propuestas conviene a los trabajadores si el interés es: a) Subir la media de los sueldos. b) Bajar la dispersión de los sueldos. 8. El gerente de ventas de una empresa ha registrado los siguientes montos de ventas de al menos SI. 100 en un determinado día. 139, 154,

222, 188,

261, 233,

209, 200,

258, 247,

204, 285,

177, 241,

227, 216,

198,

181,

194,

102,

199,

215,

212,

209,

218,

238,

197,

167,

223,

170,

194,

239,

193

267,

205,

199

400,

300,

100,

102,

11 5, 22 0, 27 6, 20 5, 27 0.

Haga el análisis descriptivo de los datos utilizando el diagrama de caja. 9. En una prueba de aptitud un investigador asigna a dos grupos de personas los siguientes “valores”. Grupo 1: 86, 89, 74, 73, 95, 86, 94, 90, 86,88, 74, 76, 75, 93, 92 Grupo 2: 88,95,60,100, 79, 93,90, 98,92, 75,65,68, 70, 73, 94 Utilizando el diagrama de caja, compare la variabilidad y la asimetría de los dos grupos ¿Cuál de las dos es más asimétrica?

CAPÍTULO 3 DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS Hasta ahora hemos visto cómo organizar y resumir informaciones correspondientes a una sola variable o característica de una población. Sin embargo, en la práctica muchas veces estamos interesados en analizar el comportamiento conjunto de dos o más variables. Aquí consideraremos aquellas situaciones en las que el investigador realiza la observación simultánea de dos caracteres en los elementos, obteniéndose de esta manera pares de resultados. Los distintos valores que pueden adoptar estos caracteres en estudio forman un conjunto de pares que denotaremos por (X, Y) y le llamaremos variable estadística bidimensional. 3.1 .TIPOS DE VARIABLE ESTADÍSTICA BIDIMENSIONAL Las variables estadísticas bidimensionales (X, Y) pueden ser: a) Ambas cuantitativas a. 1) X discreta e Y discreta (n° de hijos, n° de habitaciones), a.2) X continua e Y continua (edad en años, peso en kg). a. 3) X discreta e Y continua y viceversa (n° de hijos, edad en años). b) Ambas cualitativas b. 1) X nominal e Y nominal (estado civil, sexo). b.2) X ordinal e Y ordinal (nivel socio económico, grado de instrucción). b. 3) X nominal e Y ordinal y viceversa (estado civil, grado de instrucción). c) Una cuantitativa y otra cualitativa c. 1) X discreta e Y nominal y viceversa (n° de hijos, sexo). c.2) X discreta e Y ordinal y viceversa (n° de hijos, grado de instrucción). c.3) X continua e Y nominal y viceversa (edad en años, sexo). c.4) X continua e Y ordinal y viceversa (edad en año, grado de instrucción).

3.2. REPRESENTACIÓN DE LA INFORMACIÓN MEDIANTE TABLAS BIDIMENSIONALES Sea (X, Y) una variable estadística bidimensional tal que los distintos valores que toma Xe Y son: X : x„x2......x, Y :y„y2..........yK Una distribución bidimensional de frecuencias es un arreglo de los valores observados (x„ y,) (x2l y2),... (x„ yK), de la variable bidimensional (X, Y), con sus respectivas frecuencias, en una tabla de doble entrada, tal como se presenta a continuación en la tabla N° 19. TABLA N° 19

Donde: fij :

frecuencia absoluta del par (x¡, yj, V/ = l,r ; V/

Jt

frecuencia marginal del valorx¡ (/ = l.r)

j:

frecuencia marginal del valor

= \,k

f

y, (j = hk)

rk

número total de pares observados.

i=! j=i

Ejemplo 63: La siguiente tabla N° 20 muestra una distribución conjunta de trabajadores de una empresa por sexo según estado civil. TABLA N° 20 Distribución bidimensional de trabajadores por sexo según estado civil Sexo (Y) Masculino Estado'\^ Civil (X) Soltero 20

Femenino

Total

40

60

Casado

30

80

110

Viudo

10

5

15

5

10

15

65

135

200

Divorciado Total

3.3. DISTRIBUCIONES MARGINALES La tabla representada por la variable X y sus respectivas frecuencias marginales se llama distribución marginal de la variable X, y similarmente lo que representa a la variable Y y sus frecuencias marginales recibe el nombre de distribución marginal de la variable Y. Las distribuciones marginales obtenidas de la tabla de doble entrada N° 19 son: TABLA N° 21 Distribución marginal de X

TABLA N° 22

Ejemplo 64: Construir las distribuciones marginales para las variables X (estado civil) e Y (sexo) de la tabla N° 20. Solución:

TABLA N° 23

TABLA N° 24

Estado Civil X i. Soltero

N° de Trabaj. fi. 60

Casado Viudo Divorciado

110 15 15

Total

200

Sexo

N° de Trabaj.

Y

i

f

i

Masculino

65

Femenino

135

Total

200

3.4. FRECUENCIAS RELATIVAS BIDIMENSIONALES En la distribución unidimensional se expresan las frecuencias relativas por h, En el caso bidimensional las frecuencias relativas se expresan de la siguiente manera:

fh0 = — tal queO < hu < 1 n

También se tiene las frecuencias relativas marginales: ParaX: \~~

tal que O < h; < 1

n

'■

Para Y:

f.

= — tal que O ^ h7 =^ 1 n Ejemplo 65: Considerando la tabla N° 20 construir la distribución de frecuencias relativas, así como las frecuencias relativas marginales. Solución: TABLA N° 25 Distribución bidimensional de frecuencias relativas por sexo según estado civil Sexo (Y) Masculino Estado^^ Civil (X) Soltero 0.1

Femenino

Total

0.2

0.3

Casado

0.15

0.4

0.55

Viudo

0.05

0.025

0.075

Divorciado

0.025

0.05

0.075

Total

0.325

0.675

1.000

Vemos que las frecuencias relativas bidimensionales se obtienen así:

h =!”= — = 0.05 42 n 200

Interpretación de algunos valores de frecuencias relativas bidimensionales: h,,: El 10% de los trabajadores son solteros y de sexo masculino. h22 : El 40% de los trabajadores son casados y de sexo femenino. Las frecuencias relativas marginales para la variable X se obtuvieron así: h =

4

Á

=

_^L

=

o.3 ’• « 200

f 15 h. = — = —— = 0.075 n 200

Interpretación de algunos valores de frecuencias relativas marginales para la variable X: h,: El 30% de los trabajadores son solteros, h,: el 7.5% de los trabajadores son divorciados. Las frecuencias relativas marginales para Y se obtienen así:

1

2

h, = A = _^_ = o.325 n

200

*,.£^0.675 n 200

Interpretación de los valores de las frecuencias relativas para la variable Y. h,: el 32.5% de los trabajadores son de sexo masculino, h 2: el 67.5% de los trabajadores son de sexo femenino. 3.5. PROPIEDADES DE LAS FRECUENCIAS BIDIMENSIONALES

Sea n el número total de pares observados de la variable bidimensional (X,Y). Ver tabla N° 19. Cabe destacar las siguientes propiedades: a) La suma de las frecuencias absolutas es igual al número de pares observados, estoes:

Hf.'*

,=1 /=! b) La suma de las frecuencias relativas es igual a la unidad, es decir: rk

c) ¿ A =

/=i ¡=\

n

/=i

d)

Yjfj= n

i=i

e) ¿A, =1 i=i f) Z/7,=1

/=!

3.6. MEDIDAS ESTADÍSTICAS EN UNA DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS Las medidas en una distribución bidimensional de frecuencias se calculan cuando las variables son cuantitativas. 3.6.1.

Medias y Varianzas Marginales para las variables X e Y MEDIAS

¿ O,- - *)2 X f.

VARIANZAS

iz!_______________

£ ^ ->')x fj

c2 _>í_______________ 15 y—

n

n

NOTA: Si n (/) = — = 0.4 200 /;(//) = —= 0.5 200 L u e g o : P { ¡ u H ) = ?(/) + />(//) /*(/

u //) = 0.4 + 0.5 = 0.9

Si los eventos A, B y C son mutuamente excluyentes, la probabilidad de que ocurra al menos un evento es:

P{A u 5 u C) = P(A) + P(B) + P(C) n

A

B

P(AnBnC) = 0

Si los eventos A y B son traslapados o unidos (no mutuamente excluyentes). entonces la probabilidad de que ocurra Ao B está dada por:

P ( A vj B ) = P { A ) + P { B ) - P ( A n B )

Si Ay B son independientes:

P(A

KJ

B) = P(A) + P(B) - P(A) x P(B)

Ejemplo 82: La probabilidad que una persona ahorre en el Banco de Crédito es 0.5, la probabilidad de que ahorre en el Banco Continental es 0.4 y la probabilidad de que ahorre en ambos banco es 0.3. Hallar la probabilidad de que una persona ahorre en alguno de los bancos. Solución: Sean los eventos: A La persona ahorra en el Banco de Crédito B La persona ahorra en el Banco Continental A A B: La persona ahorra en ambos bancos. Además: P(A) = 0.5 P(B) = 0.4 P(An B) = 0.3 Entonces p(A u B) = p(A) + P(B) _ P(A n B)

P(AwB) =0.5+ 0.4-0.3 P(AuB) =0.6 Si los eventos A, B

y C son traslapados ocurridos, entonces la

probabilidad de que ocurra al menos un evento es: P (AuBuC) = P(A)rP(B)+P(C) - P (AnB) - P (AnC) - P(BnC) + P(AnBnC) n AB

IR

Si A, B y C son independientes, entonces: P(Ao>BuC)=P(A)+P(B)+P(C) -P(A)xP(B)-P(A)xP(C)-P(B)xP(C)+P(A) x P (B)xP(C)

Ejemplo 83: En la Universidad de Lima se publican tres revistas: A, B y C. El 30% de los estudiantes lee A, el 20% leeB, el 15% leeC, el 12% lee Ay B, el 9% Ay C, el 6% By C y finalmente 3% lee A, By C. Se pide calcular el porcentaje de estudiantes que lee al menos una de las revistas. Solución: Sean los eventos: A : El estudiante lee la revista A i-------------------------------\ P(A) = 0.30 B : El estudiante lee la revista B

i-------S P(B) = 0.20

C : El estudiante lee la revista C

i=í> P(C) = 0.15

A B: El estudiante lee la revista Ay B I==¡> P(A n B) = 0.12 A n C: El estudiante lee la revista AnC

P(A n C) = 0.09 t= >

B n C: El estudiante lee la revista B nC S P(B N C) = 0.06 A n B n C: El estudiante lee la revista A n BnC P(AnBnC) = 0.03

Entonces: P(A u B u C) = P(A) + P(B) + P(C) - P(AnB) - P(AnC) - P(BnC) + P(AnBnC) P(A uBuC)

= 0.30 +

0.20 + 0.15 -0.12-0.09-0.06 + 0.03 = 0.41 41% El 41 % de las personas lee al menos una de las revistas. 4.10.

TABLAS DE CONTINGENCIA YTABLAS DE PROBABILIDAD 4.10.1. Tablas de Contingencia.- Es una tabla de doble entrada que muestra la clasificación de eventos de los espacios muéstrales de dos experimentos aleatorios. (Ver pág. 96, tabla N° 19). 4.10.2. Tablas de Probabilidad.- Son aquéllas que se obtienen a través de las tablas de contingencia aplicando los criterios dados.

La siguiente tabla N° 28 de probabilidades muestra las probabilidades conjuntas y marginales para una tabla de contingencia de manera general:

TABLA N° 28

Ejemplo 84. La siguiente tabla N° 29 muestra la clasificación de los trabajadores de una empresa por categoría laboral según sexo.

TABLA N° 29 Distribución de trabajadores por categoría laboral según sexo Sexo

CATEGORÍA LABORAL

Total

Obrero(o) Empleado(E Funcionario ) (FU) Masculino (M) 150 30 120 Femenino (F) TOTAL a) b) c) d) e)

300

50

140

10

200

170

290

40

500

Si se elige un trabajador al azar, hallar la probabilidad de que: Sea obrero. Sea de sexo masculino y obrero. Sea empleado, si es de sexo masculino. Sea de sexo masculino, si es funcionario. Sea obrero o empleado.

Solución: Construyendo la tabla de probabilidades obtenemos los siguientes resultados.

TABLA N° 30 Tabla de probabilidades de los trabajadores por categoría laboral según sexo Sexo

CATEGORÍA LABORAL P(O)

P(M)

120/500=0.2 4 50/500 =0.10

P(E)

150/500 = 0.30 140/500 = 0.28 170/500=0.3 290/500=0.58 4

P(F) TOTAL

Total

P(FU) 30/500 = 0.06 10/500 = 0.02 40/500= 0.08

300/500=0. 60 200/500=0. 40 500/500=0. 10

Entonces: a) PÍO) = 0.34 b) P(M r\ O) = 0.24 c) l>(E/M)= P I £ n W >

s

P( M)

*

nMIFU)

0.60

.mnm=™.0j} P(FU)

0.08

e) P{Ovj E) = P(O) + P(E) - 0.34 - 0.58 = 0.92 4.11. TEOREMA DE BAYES Es un método que nos permite calcular la probabilidad de que un evento que ya ocurrió sea resultante de alguna causa. Para entender el Teorema de Bayes debemos estudiar. 4.11.1. Partición de un Espacio Muestral: Se denomina partición del espacio muestral Q a una colección de k evento A,, A 2, AK que sean mutuamente excluyentes y cuya unión es el espacio muestral, es decir, tales que verifican las siguientes condiciones: a)

P(A¡) > 0, para cada i=l, 2, ...k.

0Vi* j kk c) U A ¡ = Q ó £ P ( A , ) = l 1 í=1 b)

Aj n Aj =

Esquemáticamente:

fig. 12: Partición de Q 4.11.2. Probabilidad Total: Si k eventos A,, A2,...A«, constituyen una partición del espacio muestral Q, entonces para cualquier evento B en Q:

P(B) = £P(AinB) ¿=i

k P(B) = ^P(A¡)xP(B/Ai) i=i

Esquemáticamente:

ULADECH

129

fig 13: Relación entre el evento B y la partición defi 4.11.3. Teorema de Bayes: Si los k eventos: A., A2.. . . AK, constituyen una partición del espacio muestral Q , entonces para cualquier evento B de Q tal que P(B) > 0: P(A, IB)

=

nA )

' *^'A')

.paracada¡=1.2..............................k.

El Teorema de Bayes nos permite comparar la probabilidad previa (o a priori) P(A¡) con la probabilidad posterior (o a posteriori) P(A,/B). Esto es, P(A,/B) es la probabilidad de A, corregida o modificada por la ocurrencia del evento B. Si Aes un evento en Q tal que 0)y(B HD)? 21. Dada las condiciones del ejercicio (19), identifique los eventos que son: a) Mutuamente excluyentes. b) Colectivamente exhaustivos con respecto al género. 22. Si P(A) = 3/4, P(B) = 2/3 v P(A O B)=3/5, hallar: a) P(AuB) b)P(A-B) c)P(B-A) d)P(A/B) 23. La probabilidad de que un alumno apruebe el curso de estadística es 1/3, que apruebe el curso de matemática es 1/6 y de que aprueba ambos cursos es 1/8. ¿Cuál es la probabilidad de que apruebe al menos un curso? 24. En una cierta ciudad se publican tres diarios A, B y C. Supongamos que el 60% de las familias de la ciudad lee A, el 40% lee B y el 30% lee C. Supongamos también que el 20% de las familias de la ciudad lee A y B, el 10% lee Ay C, el 20% lee B y C y el 5% lee A, B y C. Determinar: a) ¿Qué porcentaje de familias lee por lo menos uno de los diarios? b) ¿Qué porcentaje de familias lee exactamente uno de los diarios? 25. Si P(A) = 0.3, P(B) = 0.2, Si A y B son independientes, determine las siguientes probabilidades: a)P(AnB) b) P(A/B) c)P(AuB) d)P(JÜB) e)P((An£)

26. Un club consiste de 150 miembros. Del total 3/5 son hombres y 2/3 son profesionales. Además, 1/3 de las mujeres son no profesionales. Se elige un socio al azar: a) Calcular la probabilidad de que sea hombre y profesional.

ULADECH

139

b) Calcular la probabilidad de que sea hombre, dado que es profesional. c) Calcular la probabilidad de que sea no profesional, si es hombre. d) Calcular la probabilidad de que sea mujery no profesional. 27. La siguiente tabla corresponde a la opinión ciudadana agrupada en tres categorías (a favor, en contra, indeciso) según género en una muestra de 210 habitantes de una ciudad. Género

Opinión

Total

A favor

En Contra

Indeciso

Hombre

41

39

20

100

Mujer

40

43

27

110

TOTAL

81

82

47

210

Si se elige un habitante al azar, calcular la probabilidad de que: b) Opine en contra, si es mujer, c) Sea mujer, si opina a favor, d) Opine a favor o en contra.

a) Opine a favor.

28. Los pedidos nuevos de los productos de una campaña varían en valor monetario, según la siguiente distribución de probabilidades: 4001Total Monto de la 01001- 2001- 30014000 5000 venta en $ 1000 2000 3000 Probabilidad

0.10

0.35

0.25

0.20

0.10

1.00

Obtenga las siguientes probabilidades: a) De que el nuevo pedido sea mayor de $2000. b) De que el nuevo pedido sea mayor de $1000 pero menor o igual a 4000. 29. En una universidad el 70% de los trabajadores son docentes y el 30% son empleados administrativos, de los trabajadores docentes el 60% son varones y de los empleados fig. 14

administrativos son varones el 40%. Si se elige aleatoriamente un trabajador, calcular la probabilidad de que: a) Sea varón. b) Sea mujer. c)Sea empleado administrativo. d) Sea docente, si es varón. e) Sea empleado administrativo, si es mujer. f)Sea docente y mujer.

ULADECH

.141

CAPÍTULO 5 DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES En el capítulo anterior se analizó el concepto de probabilidad. El objetivo era determinar la probabilidad de un evento. En este capítulo estudiaremos las distribuciones de probabilidades importantes. El comportamiento de una variable aleatoria queda descrito por su distribución de probabilidad. En muchas tareas estadísticas se busca determinar una distribución de probabilidad o modelo probabilístico que satisfaga un conjunto de supuestos para estudiar los resultados observados de un experimento aleatorio. NOTA: La variable aleatoria es una función que atribuye a cada evento elemental un número que no es aleatorio o imprevisible sino fijo y predeterminado. Distribución de probabilidad es una lista de todos los resultados posibles de algún experimento y de la probabilidad relacionada con cada elemento. Se pueden definir muchas distribuciones de probabilidad tanto de variable discreta como de variable continua. Hay algunas que tienen aplicaciones estadísticas importantes y que se estudiarán a continuación: 5.1. DISTRIBUCIONES DE PROBABILIDAD DE TIPO DISCRETO Entre las más importantes estudiaremos: la distribución de Bernoulli, Binomial y Poisson. 5.1.1. Distribución de Bernoulli Se llama prueba o ensayo de Bernoulli a todo experimento aleatorio que consiste de sólo dos resultados posibles mutuamente excluyentes, generalmente llamados: éxitos (E) y fracasos (F). Ejemplo 88: Lanzar una moneda al aire con los resultados: cara o sello. Elegir al azar un objeto fabricado con los resultados: defectuoso o no

Carmen Rosa Barreto Rodríguez

142

defectuoso. * Elegiral azar un alumno con los resultados: aprobado y desaprobado. El espacio muestral asociado al experimento aleatorio de Bernoulli se puede escribir como el conjunto: Q={E,F} La variable aleatoria X definida en £Í de manera que atribuye a E el valor 1 y a F el valor 0, se denomina variable aleatoria de Bernoulli. Si p = P [X = 1 ] es la probabilidad de éxito, donde 0 < p < 1 y q = P [X=0] = 1 - p es la probabilidad de fracaso, la distribución de probabilidad de Bernoulli de parámetro p está dada por: p x ( I -p)1'* , si x =

0, 1

0 , en otro caso Si X es una variable aleatoria con distribución Bernoulli de parámetro p, entonces lo denotaríamos porX—► B(1, P). La media y la varianza de la distribución de Bernoulli están dadas por: Media : |.i =p Varianza : 30) y el muestreo es con o sin sustitución en una población infinita (o con sustitución en una población finita de tamaño N), el error estándar es: at

=

ML £2

que se estima por:

pO - P)

Si el muestreo es sin sustitución en una población finita de tamaño N, el error estándares:

P(l-P) N-n

30 y n2>30). Entonce s:

A =(PiP2)-ZoxsPlP: L

i

=

( P i

P

2 )

+

z

o x

s

P

í

-

P

i

D o n d e :

=

\ M l +

E 2 ± l p

'

-

p

>

n

x

n

2

E j e m p

l o

1 1 8 : En los establec imientos penales de Lima ciertos médicos estudiar on dos tipos de reclusos . Una muestra de 300 internos del tipo I reveló que 50% era adicto a las drogas. En otra muestra aleatori a del tipo II de 240

internos , el 35% era adicto a las drogas. Construi r un interval o de confianz a del 99% para la diferenci a de las dos proporci ones poblacio nales. Solución : Las muestra s de internos tomadas para cada tipo revelan la siguient e informa ción: Tipo I

Tipo II

n

n, = 300

n2 = 240

P

p, = 0.50

p, = 0.35

Las difer enci as de prop orci one s mué stral es es: p,p2 = 0.50 0.35 = 0.15 El error está ndar de las difer enci as de prop orcio nes mué stral es es. 10.50x0 .50

S

nn

=

0.35 x0.6 5

1 -----------------------------+ ------------------------------

=0.0 4

v 300 240 Para un nivel de confi anza del 99% ; Z0 = 2.57 6 Los límit es de con fian za para la difer enci a de prop orci one s pobl acio nale s es: L, = 0.15 2.57 6x0.

04 = 0.05 L2 = 0.15 + 2.57 6x0. 04 = 0.25 Lueg o, el inter valo de confi anza del 99% para

Px-P2 es:

1. 05P

\~ P2 —

0.25 Dado que P\~Pi = 0 £ al interval o de confian za, lo que quiere decir que los tipos de reclusos son diferent es ante su adicción a las drogas. Los reclusos tipo I tienen mayor adicción a las drogas que los reclusos de tipo II.

NOT A: En caso de que las pobl acio nes N, y N2 fuer an finit as, se deb e corr egir: A*? i

( \1 \ N2-n2

^|-«i X £ H

I £

«i

«2

6.2. P RUEBA DE HIPÓTE SIS El objetivo es dar algunos método s que se usan para tomar decision es sobre una poblaci ón, a partir de los resultad os de

1*2-1 J

una muestra aleatori a escogid a de esa poblaci ón. Para llegar a tomar decision es estadíst icas se debe partir de afirmaci ones o conjetur as con respect o a la poblaci ón en la que estamo s interesa dos. Tales suposici ones pueden ser verdade ras o no. Una conjetur a hecha sobre una poblaci ón o de sus

paráme tros deberá ser sometid a a compro bación experim ental con el propósit o de saber si los resultad os de una muestra aleatori a extraída de esa poblaci ón contradi cen o no tal conjetur a. En esta sección estudiar emos prueba de hipótesi s para la media poblaci onal, proporci ón poblaci onal,

diferenc ia de medias poblaci onales y diferenc ia de proporci ones poblaci onales. Afin de entende r lo que sigue definire mos algunos término s: a) H i p ó t e s i s : S e ll a m a h i p ó t e s

i s a u n a s u p o s i c i ó n o c o n j e t u r a q u e s e f o r m u l

a c o n e l p r o p ó s i t o d e s e r v e r i f i c a d a . b) H i p ó t e s i s

E s t a d í s t i c a : E s u n s u p u e s t o o a l g u n a a f i r m a c i ó

n a c e r c a d e l a p o b l a c i ó n ( m o d e l o d e d i s t r i b u c

i ó n ) o d e s u s p a r á m e t r o s . U n a h i p ó t e s i s e s s i m p l e

c u a n d o l a h i p ó t e s i s e s t a d í s t i c a e s p e c i f i c a c o m

p l e t a m e n t e l a d i s t r i b u c i ó n , e s d e c i r e s p e c i f i c a

s u f o r m a f u n c i o n a l y l o s v a l o r e s d e t o d o s s u s p a r á m

e t r o s , c a s o c o n t r a r i o s e ll a m a h i p ó t e s i s c o m p u e s

t a . c) H i p ó t e s i s N u l a ( H 0

) : E s t a b l e c e q u e n o e x i s

t e d i f e r e n c i a s . E n e ll a s e s u p o n e q u e e l p a r á m e

t r o d e l a p o b l a c i ó n q u e s e e s t á e s t u d i a n d o t

i e n e d e t e r m i n a d o v a l o r y s e f o r m u l a c o n l a i n t

e n c i ó n d e r e c h a z a r l a . d) H i p ó t e s i s A l t e r n a t i v a

( H , ) : E s l a h i p ó t e s i s e s t a d í s t i c a q u e s u p o n e m o s

e s v e r d a d e r a y d e s e a m o s e s t a b l e c e r , e s u n a h i p ó t e

s i s d i f e r e n t e a l a h i p ó t e s i s n u l a . e) P r u e b a d e u

n a H i p ó t e s i s E s t a d í s t i c a : E s u n p r o c e d i m i e n t o p

a r a d e c i d i r s i s e a c e p t a o s e r e c h a z a u n a h i p ó t

e s i s e s t a d í s t i c a . f)

T i p o s d e e r r o r e s : A l r e a li z a r u n

a p r u e b a d e h i p ó t e s i s n o s a b e m o s s i e n u n a d e t e r

m i n a d a a c c i ó n ( r e c h a z o o a c e p t a c i ó n d e l a h i p

ó t e s i s n u l a ) c o m e t e m o s u n e r r o r o n o . Erro r Tipo I: Cons iste en rech azar la hipót esis nula cuan

do es verd ader a. Erro r Tipo II: Cons iste en acep tar la hipót esis nula cuan do es falsa . Si H0 es la hipótesi s nula (someti da a prueba) y H, es la hipótesi s alternati va, entonce s estas hipótesi s junto con las dos posibilid ades de decisión podemo s

DECISIÓN

esquem atizarlas en la siguient e tabla:

ESTADO DE LA NATURALEZA

Ho verdadera Aceptar Ho

1 - a Decisión

Correcta Rechazar Ho

a

error tipo I

Es obvio que quien toma las decision es quiere reducir al máximo las probabil idades de cometer cualquie ra de estos dos tipos de errores. Esto no es fácil, pues las probabil idades de cometer error tipo I y

Ho falsa P

error tipo II 1 -p Decisión

correcta

II son inversa mente proporci onales para cualquie r prueba dada. De ahí que, cuanto menor es el riesgo de cometer un error tipo I, tanto mayor es la probabil idad de cometer un error tipo II, y vicevers a. Sin embarg o dada la regla de decisión , es posible reducir ambos tipos de errores en forma simultá nea, aument

ando el tamaño de la muestra . g) N i v e l d e s i g n i f i c a c i ó n ( a ) : S e d e n o m i n a n

i v e l d e s i g n i f i c a c i ó n d e u n a p r u e b a d e h i p ó t e s

i s a l a p r o b a b il i d a d d e c o m e t e r u n e r r o r t i p o I .

a = P [ e r r o r t i p o I ] = P [ R e c h a

z a r H 0

/ H 0

e s v e r d a d e r a ] a =

P [ e r r o r t i p o I ] = P [ A c e p t a r H

| / H i e s f a l s a ] NOTA: La probabili dad de cometer un error tipo II se represe nta por p, es decir:

(3 = P[error tipo II] = P[Acepta r H0/ H0 falsa] P= P[error tipo II] = P[Rechaz ar Hi / H| es verdader a]

Los niveles de significa ción más usados son: 0C= 0.05 y 0.01 Estos dos números son usados tan frecuent emente que cuando H0 es rechaza da en

Ot= 0.05, podemo s decir que el resultad o es significa tivo, y cuando H0 es rechaza da en (X= 0.01, decimos que el resultad o es altamen te significa tivo. h) Tipos de prueba : Pru eba de cola izqu ierd a: Si la regió n de rech azo (R.R. ) está a la izqui

erda del punt o crític o C.

— R.R— C--------------------------R.A. fig. 31 Pru eba de cola dere cha: Si la regió n de rech azo (R.R. ) está a la dere cha del punt o critic o C.

-R.A.---------------C—R.R — fig. 32 Pru eba de dos cola s o bilat eral. Si la regió n de acep tació n (R.A. ) es un inter valo cerra do entr e los punt os crític o C, y C 2.

—R.R.-C-i-----------------------R.A.------------------------------C2-R.R-

fig. 33

i) Pasos de una prueba de hipótes is: 2. F o r m u l a c i ó n d e l a h i p ó t e s i s

n u l a y a l t e r n a t i v a d e a c u e r d o a l p r o b l e m a . 3. Espe cific ació

4.

5.

6.

7.

n del nivel de signi ficac ión. Sele cció n de la esta dísti ca de prue ba. Esta bleci mien to de los crite rios de deci sión. Reali zació n de cálc ulos. Tom a de deci sion es

6.2.1. Pr ueba de Hipótes is para la Media

Poblaci onal La media poblaci onal es un paráme tro de decisió n muy importa nte. Es de interés conocer si una media poblaci onal ha aument ado, disminu ido o ha perman ecido inaltera do, o tambié n podem os estar interesa dos en determi nar si una media poblaci onal es signific ativam ente mayor o

menor que un valor supuest o. Se present an los siguient es casos: CASO I: Uso de la estadís tica Z. I) M u e s t r a g r a n d e ( n > 3 0 ) , v a r i a n

z a p o b l a c i o n a l c o n o c i d a c r 2

, p o b l a c i ó n n o r m a l

o n o . II) M u e s t r a g r a n d e ( n > 3 0 ) , v a r i a n z a p o b l a c i

o n a l d e s c o n o c i d a ( < j 2

=

s 2

)

y p o b l a c i ó n n o r m a l

o n o . III) M u e s t r a p e q u e ñ a ( n < 3 0 ) , v a r i a n z a p o b l a

c i o n a l c o n o c i d a a 2

y p o b l a c i ó n n o r m a l . 2. Formul ación de hipótes is:

a) Ii0: n

> }i0 b

)

H0: | a< c

)

H0: n = H, : n < |! 0

H ,: n > |i0 H ,: p.

3. Nive l de signific ancia: a 4. Esta dística de prueba: Para i y iii

Z=

^ > « ( 0 . 1 ) a / J n

Para ii

Z=

— — — > « ( 0 , 1 ) s N n

5. Esta blecimi ento de los criterio s de decisió n: Prue b a d e c o l a i z q u i e r Prueba de cola derecha

d a

-z,.a 0

__R.R. _|--------------------------------R.A.-

R.A.: Zk > R.A.: Z k < Z,. a

acepta

,

se Hu .

R.R.: Z k > Z,.a,

se

rechaza H„.

Z,.a

,

acepta

se H0.

R.R.: Zk < Z,. a

,

se

rechaza H„.

Prueba bilateral R.R.: Z k < Z |.«/ 2 , se

R.A.: -Zi.a /2 < Z k rechaza H 0 .

6. de cálculos: Obtención

Realización del valor

_ R.R. .|------------------------------R.A----------------------------1_ R.R___

experimental. Para i y iii

x -n 0 K

v/4~n

Para ii

_x-[i0

K

shf c 7. Decisión: Se compara el valor experimental con el valor crítico. Si Zk

e R.A., se

acepta H0. Si Zk e

R.R., se

rechaza H0.

NOTA: Si se tiene una población finita de tamaño N, se corrige la estadística de prueba de la siguiente manera: a) Para i y iii:

b) Paraii

a lN -n ■JÜ

V N-1

s lN-n Ín-i

Prueba de cola derecha

La poblacional desconocida

(p2 = s2)

CASO II: Uso de la estadística t.

muestra es pequeña (n Ho b) H0: jo. < jj.0 c) H0: (i = n H,: fa< Ho H,: \ i > fio H,: [ i * |a0 2. Nivel de significancia: OC 3. Estadística de prueba:

_ d-fn Donde: (n-1) son los grados de libertad. 4. Establecimiento de los criterios de decisión: Prueba de cola izquierda:

-R.R.J----------------------------R.A.

R.A.: t k > - t,. o n ., , se acepta H 0 . R.R.:t k 1 i-a,n-i ?se rechaza H0.

Prueba bilateral:

__R.R___|________________R.A_____________________|_R.R._

R-A.: -t|-a/2,n-i á tk < , se acepta H(>. R.R. : tk< -t,.u,2,n-i O tk > t,^-2,n-i . se rechaza H„.

5. Realización de cálculos: _X-[X0

‘ " s/Jn

6. Decisión: Se compara el valor experimental con el valor crítico tk g R.A.. aceptamos H„.

Si tk e R.R., rechazamos H0.

Si

NOTA: Si se tiene una población finita de tamaño N se corrige la estadística de prueba. Así: *-H0

Ejemplo 119: La Gerencia del Banco de Crédito está planeando pasar los cargos a las cuentas corrientes en el saldo diario promedio. El gerente de cuentas preferenciales desea probar la hipótesis de que las cuentas tienen un promedio de $ 312.00. Selecciona una muestra de 200 cuentas, dando una media de $298.10 con s = $97.30con CC =0.01 Solución: Caso I- ii 1. Formulación de hipótesis :

H0 : \ i = 312 H, : fi* 312 2. Nivel de significancia :a = 0.01 3. Estadística de prueba:

sHn 4. Establecimiento de los criterios de decisión:

g/2 = 0.005 ___ R.R. 2.57 6

0

R.A.

R.A.: -2.576 < ¿v. < 2.576 . se acepta H„. R.R.: Z i < -2.576 o >2.576 . se rechaza H0.

g/2= 2.570.005 6 R.R_____

5. Realización de cálculos: ,^,298.1D-312_00 6. Decisión: -2.02 G R.A., aceptamos H0

202 97.30/^/200

= -

La diferencia entre el valor de la media muestral y el valor de la media poblacional es estadísticamente insignificante. Ejemplo 120: En una reunión informativa para una oficina corporativa, el gerente del hotel Embassy Suits en Atlanta reportó que el número promedio de habitaciones alquiladas por noche es de por lo menos 212. Es decir(-i> 212. Uno de los funcionarios corporativos considera que esta cifra puede estar algo sobreestimada. Una muestra de 150 noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que el gerente ha inflado su reporte, será amonestado severamente. Aun nivel de 1%, ¿cuál es el destino del gerente? Solución: Caso I-ii 1. Formulación de hipótesis:

H0 : \i > 212 H, : n< 212 2. Nivel de significancia: (X=0.01 3. Estadística de prueba: Z = ^—^-->«(0.1) s / 4. Establecimiento de los criterios de decisión:

-2.526

----R.R _|------------------------------ R.A--------------------------

R.A.: > -2.326 . se acepta H„. R.R.: Zj,

5. Realización de cálculos: ^20.3-212, ^ sl-Jn 45.5/V150 6 Decisión: Z = -2.88 G R.R. k

75 no contiene el signo igual.

1. Formulación de hipótesis: H 0 : |a < 75 Hj : fi > 75

2. Nivel de significancia: a = 0.02 3. Estadística de prueba: —7^->«(0,1)

s / -Jn

4. Establecimiento de los criterios de decisión:

R.A. -

R.A.: Zk < 2.059, se acepta

■ R.R. -

H0. R.R.: Zk > 2.059, se rechaza H0. Realización de cálculos: 80.23-75.00 80.23-75.00 = 1.15 Z = ■ - * s/-J¿ 45.67 / -s/ToO 45.67/10 Decisión: Z, = 1.15E R.A. A pesar de su estilo de vida decadente el estudiante típico no gasta más de $ 75.00. Tendrá que buscar otra forma de obtener más dinero de su casa. Ejemplo 122: Un distribuidor de bebidas plantea la hipótesis de que las ventas por mes promedian $ 12000. Diez meses seleccionados como muestra reportan una media de $ 11277 y una desviación estándar de $ 3772. Si se utiliza el valor (X del 5%, ¿qué puede concluir acerca de la impresión que tiene el distribuidor sobre las condiciones del negocio? Solución: Caso II 1. Formulación de hipótesis:

H0 : M = 12000

Hi : fj. *12000 2. Nivel de significancia , a =0.05 3. Estadística de prueba: t= r s t

—>

ta

x-fl0 / -v« n-\

4. Establecimiento de los criterios de decisión:

5.

R.A.: ti; e [-2.262. 2.262]. se acepta H0. R.R.: tk < -2.262 o tk > 2.262 . se rechaza H0.

Realización de cálculos:

x-\i 11277-12 000 -723 =-----------------------------=—=-------------= -0.61 sl-Jñ 3 772/VÍ0 1192.81 0

tk

6. Decisión: Z„ = -0.61G R.A. Las condiciones del negocio son estables, las ventas por mes no varían. 6.2.2. Prueba de Hipótesis para la Proporción Poblacional A menudo surgen situaciones en las que el muestreo es de proporciones en vez del valor medio de una población. En tal caso las observaciones son de naturaleza cualitativa. Cuando analizamos datos cualitativos, nos interesamos por verificar un supuesto acerca de la proporción de éxitos de la población (P). Esto implica que se ha propuesto un valor P previamente a la realización del estudio. El propósito del experimento es obtener evidencia estadística que apoye o rechace esta hipótesis. El procedimiento para la prueba de hipótesis para la proporción poblacional es similar al señalado por la media poblacional. Se presentan los siguientes casos, en muestras grandes (n > 30). CASOI: Población infinita, cualquiera que sea el tipo de muestreo. Población finita, si el muestreo es con reemplazamiento.

1. Formulación de hipótesis estadística:

a) H 0: P > P 0

H0 c) :P = P0 H, :P * P0

H,: P< P0 b) H„: P< P0 H i: P > P0

2. Nivel de significancia: a 3. Estadística de prueba:

Z = P~.ÜL «(0.1) I’oQo 4. Establecimient o de los criterios de decisión: Prueba de cola izquierda

R.R.

. R.A

R.A.: Zk > Z,.a, se acepta H„. R.R.: Zv < Z,.a, se

rechaz a H0. Prueba de cola derecha

___________R.R________________|_ R.A—

R.A.: Zk^ Z U a , se acepta H0. R.R.: Zk > Z,.a, se acepta H0.

Prueba bilateral

______R.R.------------------------------------R.A. _____________________ R.R.

R.A.:-Z Zk < Z,.« 2. se

acepta H„. R.R.:Z1 Z,.«a-se rechaza H„.

5. Realización de cálculos: •y...

P~P(,

Í5SL V «

6. Decisión SiZ, G R.A., se acepta H0. SiZ„ G R.R., se rechaza H(). Caso II: Población finita, cuando el muestreo es sin reemplazamiento. Se siguen todos los pasos del caso I, pero se incorpora el factor de corrección para población finita, entonces la “Estadística de Prueba” será:

Z = P~P° -> «(0,1)

Ín

s: I : >

¡rnQo

kA—1 y

Ejemplo 123: Una encuesta realizada en 1982 reveló que el 78% de quienes respondieron consideraron que estaban mejor financieramente que sus padres. Una encuesta más reciente (Apoyo, abril 1997) encontró que 370 de las 500 personas que respondieron pensaron que sus fortunas financieras eran mejores que la de sus padres. ¿Esto sugiere un descenso en la proporción de personas que consideran que están financieramente más estables de lo que

estaban sus padres? Pruebe la hipótesis a un nivel de significancia del 1 %. Solución: 1. Formulación de hipótesis: Hc: P = 0.78 H. : P0

>7(0.1)

4.

0 R.A.

Establecimiento de los criterios de decisión: -2.326 R.R._|_ R.A. : Si > -2.326. se acepta H„. R.R. : Si Zk < -2.326. se reclwit H 0. 5. Realización de cálculos:

370

Donde n =--------=

500

0.74

v P-K 0-74-0.78 -0.04 P0O0

6.

f0.78xQ.22 0.02

Decisión: Z„ = - 2 E RA; por lo tanto se acepta H„. No ha habido un descenso en la proporción de personas que consideran que estaban más estables que sus padres.

Ejemplo 124: Los directivos de un determinado programa de televisión pretender modificarlo si, por lo menos, un cuarto de los que tienen televisor no ven el programa regularmente. Una investigación encomendada a una empresa especializada mostró que, de 400 familias entrevistadas, 80 ven el programa regularmente. En base a estos datos ¿cuál debe ser la decisión de los productores? Ot = 5% Solución: 1. Formulación de hipótesis estadística: H0:P>0.25 H, : P < 0.25 2. Nivel de significación: Ot =0.05 3. Estadística de prueba: -

Z=

>«(0,1)

4. Establecimiento de los criterios de decisión:

-1.645 R.R.j.

0 R.A.

R.A.: Si Zk > - 1.645, aceptamos II„. R.R.: Si Zi, < -1.645, rechazamos H„

5. Realización de cálculos:

X : personas que no ven el programa X': personas que ven el programa

6. Decisión: Zk = 27.5 G R.A. Por lo tanto los productores deben modificar el programa. Ejemplo 125: De una lista de 2000 clientes de un banco comercial se seleccionó una muestra aleatoria para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas del servicio, 25 tenían quejas y 10 no opinaban al respecto. Tradicionalmente, el 5% tenía quejas del servido, sin embargo se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se quiere una probabilidad de 0.05 de cometer error tipo I? Solución: 1. Formulación de hipótesis: Hc: P = 0.05 H. : P > 0.05 2. Nivel de significancia: a =0.05 3. Estadística de prueba:

4 Establecimiento de los criterios de decisión:

o R.A.

R.A. : Si 7\ < 1.645. se acepta H„. R.R : Si Z\ > 1.645. se rechaza H„.

1.645

,J_ R.R_____

5. Realización de cálculos: X : el cliente tiene quejas X': el cliente no tiene quejas x

25 Donde /? = — = ——= 0.10 n 250

n:250 Luego:

6. Decisión: Zk = 5 > 1.645 G R.R.; por lo tanto rechazamos H 0. El porcentaje de quejas ha aumentado. 6.2.3. Prueba de Hipótesis para Poblacionales. Se presenta los siguientes casos:

la

Diferencia

de

Medias

CASO I: Uso de la Estadística Z i) Muestras grandes (n, > 30, n2 >30), varianzas poblacionales conocidas (crf y cj2" ) y poblaciones normales o no. ii) Muestras grandes (n, > 30, n2 > 30), varianzas poblacionales desconocidas pero iguales o,2 =ct2 (a,2 s s,2 y a/ = s] ) y poblaciones normales o no. iii) Muestras pequeñas (n, < 30,n 2 < 30), varianzas poblacionales conocidas y a2 ) y poblaciones normales. 1. Formulación de hipótesis:

a) H0 : |ii > |i2 b ) H 0 : M - i < ^ 2 c) H0 : m = H i : f-ii < |i2 H, : > |i2 H, : n, * fi2 2. Nivel de significancia: Ct

3. Estadística de prueba: Paraiyiii: Z

= —ii—ÍL_ «(0.1)

Paraii: Z=

X, - x 2

-► «(0.1)

s; s; n

4. Establecimiento de los criterios de decisión: Prueba de cola izquierda: R.A.: Zk ^ -Z|.a. se acepta H0.

R.R.: Zk < -Z].a, se rechaza H0. Prueba de cola derecha:

R.A.: Zk < Z|_a, se acepta H0. R.R.: Zk > Zi^x. se rechaza H0. Prueba bilateral:

R.A.: Zk s[-Zi.a/2 , Ziu/2 ], se acepta H0. R.R.: Zk < -Zi.a/ 2 o Zk > Zi-o/ 2 , se rechaza H0. 5. Cálculos: Paraiyiii:

Paraii: Z ,

6. Decisión: Se acepta o se rechaza H 0. Nota: Si las poblaciones respectivamente entonces:

son

finitas

de

tamaño

N,

y

N2

^ 7 *'

'

J

)

o,2

íM -

J

”,

I^

k

“I

í-v, -«,] N -1 J t

G¡ -x2 J

x,

[ ■> .y,' + ^-

n2 )

{ N2 -

1

J

-

n2

'l

N-,

K

-u

n

2

Ejemplo 126: En la Facultad de Ciencias Matemáticas de la U.N.M.S.M. se seleccionó una muestra aleatoria de 20 estudiantes (grupo A) de una población de estudiantes pertenecientes a familias en que ambos padres trabajan. Se seleccionó también una muestra aleatoria de 16 estudiantes (grupo B) de entre aquellos que pertenecen a familias en que solamente el padre trabaja. El análisis de rendimiento académico de los dos grupos dió los siguientes resultados: Grupo

Promedio Muestral

A

14

B

17

La experiencia muestra que las poblaciones de puntajes para ambos grupos están distribuidas en forma aproximadamente normal, con varianzas o* =36 y Og= 20 ¿Se puede concluir, con estos datos, que la media de la población de la que se seleccionó el grupo A es diferente a la media poblacional de la que se seleccionó el grupo B? Use a = 0.05 Solución: CASOI-i 1. Formulación de hipótesis H0:MA MB

=

H, :M MB

2. Nivel de significancia: (X =0.05 3

Estadística de prueba: —► n(0,1) V ».i n n

4. Establecimiento de los criterios de decisión: R.A.: Si

Zk

e [-1.96. 1.96]. se acepta H0.

R.R.: Si 5. Cálculos: Datos:

Zk

1.96, se rechaza H„.

nA = 20. nB = 16. =14 , x„ =17 aj = 36 , cr„2 = 20

= -1.71 ~=0

xA -Xn 6.

14-17

Decisión: Z< = -1.71 E R.A. por lo tanto se acepta H0, lo que quiere decir que en la Facultad de Ciencias Matemáticas los puntajes promedios generales de rendimiento de los estudiantes que pertenecen a familias en que ambos padres trabajan son iguales a los de los estudiantes que pertenecen a familias en que solamente trabaja el padre. Ejemplo 127: El director de presupuesto de una empresa deseaba determinar si había alguna diferencia en las cuentas de gastos de representación de los ejecutivos de dos departamentos de la empresa. Se seleccionó una muestra aleatoria de 30 cuentas de gastos del departamento 1 y 30 cuentas de gastos del departamento 2. Con los siguientes resultados:

Departamento 1

Departamento 2 x,

=

000 .v, =

Al nivel de significancia 200 0.01 ¿es más alto el gasto de representació n en el departamento 1?

Solución: CASO I - ii 1. Formulación de hipótesis:

H 0

: p , = p 2

H i :

33

S/. SI.

7

X2 = S/ ZSI s-,

=

S/.

27 900

9 000

m > p 2

2

Nivel de significancia : Ot =0.01

3. Estadística de prueba: .Y| ~X 2

4. Establ ecimie nto de los criteri os de decisió n: R.A. : Si

Zk

< 2.326. se acepta H 0.

R.R.: Si

Zk >

2.326. se rechaza H0. 5. Cálculos: Datos: n i

=

3 0 .

j e ,

= 3 3

0 0

0 .

s ,

=

7

2 0 0

n 2

=

3 0 ,

x 2

=

2 7

9 0 0 ,

s 2

=

9

0 0 0 Z

-Vi -x :

33 000 -27 900

6. Decisión; Z< = 2.42 E R.R. por lo tanto se rechaza H;. Los gastos de representación del departamento 1 son más altos que los gastos de representación del departamento 2. CASO ¡I: Uso de la Estadística t i) Muestras pequeña s (n. -1, _a

r

, se acepta H0. R.R. : tk < —

t, _ , se rechaza Hc. ct r

Prueba de cola derecha:

R.A.: tk < t,_a r , se acepta Ho. R.R. : tk >tj_a r , se rechaza H0. Prueba bilateral: R . A .

:

t k

e

[ —

t t

o /

2 , r

, t | a

/ 2

, r ] )

s e

a c e p t a

H 0

-

R . R .

:

t

k

t , 0

/

2

>

r ,

s e r e c h a z a

H 0

-

E j e m p l o 1 2 8 : Para verificar la suposición de que existe diferencia en el aprendizaje de matemática en los alumnos de dos aulas A y B de un colegio, se tomó una muestra aleatoria de cada aula y se les aplicó una

misma prueba de conocimiento, obteniéndose los puntajes que a continuación se indican: AulaA: 1 6 , 4 3 , 2 4 , 3 5 , 2 0 , 2 7 , 2 9 , 3 0 , 4 0 , 3 2 A u l a

B : 15,40,18,37,16, 29,30,45,20,36 Realizar la prueba al nivel de significación de 5%. Solución: Caso ll-i 1. Formulación de hipótesis H, : p-i = |i2 H, : JÍI * (i:

2. Nivel

de

significancia: Oí =0.05 3. Estadística prueba:

de

4. Estableci miento de los criterios de decisión: R.A.: Si tk G [-2.101. 2.101], se acepta II,.. R.R.: Si tfc < -2.101 o tk > 2.101. se rechaza II.,.

5. Cálculos: Para Grupo A: n ,

=

1 0 .

* > = 2 9 . 6 .

s ,

=

8 . 4 2

P a

r a

G r u p o

B : n 2

=

1 0 .

. 7 2 = 2

8 . 6 .

s 2

=

1 0 . 8 3

t k

=

0 . 2 3

6. Decisión: tK = 0.23 G R.A., se acepta H0 lo que quiere decir que no existe diferencia en el aprendizaje de matemática en las dos aulas Ay B. Ejemplo 129: Dos profesores enseñan a dos secciones A y B el mismo curso de matemáticas. Para comparar los promedios en las calificaciones obtenidas con los dos profesores se escogieron dos muestras aleatorias independientes de 9 notas de Ay 8 notas de B, dando los siguientes resultados. G r u p o A

: 0 2 , 1 8 , 1 0 , 2 0 , 1 7 , 0 5 , 1 2 . 1 6 . 1 1 G r u p o B : 1 2 , 1 6 ,

0 9 , 1 6 , 1 2 , 1 3 , 1 1 , 1 0 Suponga que las calificaciones con cada uno de los profesores se distribuyen normalmente con varianzas desconocidas pero diferentes (cr: *a;). Con un nivel de significación de 0.05, ¿es la calificación promedio de A más alta que la de B? Solución: Caso II -ii Sean X„, X2 ias variables aleatorias que representan las calificaciones de las seccionesAy

B, respectivame nte. Sesuponeque A, -> «((a,,o,2) yX -»m(h,.ct2) con cs{y a2 varianzas desconocidas pero diferentes. 2

1. Formu lación de hipóte sis Ho: ni = \xi

Hi: jni > (a2 2. Nivel de significancia: a =0.05 3. Estadística de prueba

s.2 s.}

Donde: s, = 6.06 , s2 = 2.56 n 2

= 9 Entonces:

8

A7, —

s{ /«, 2

2

z /rh

s

2

(6.06)2/ 2 9

(2.56)2 / 8

8

n, -1

. "l-1.

7

s

■/ n + V /«! / 2 r= r

=

1 1 . 0 3

=

1 1

E n t o n c e s :

[(6.06)2/9 + (2.56)2/8]2

4. Establecimiento de los criterios de decisión:

R.A________________ |— R.R. R.A. : Si tk < 1.796 , se acepta H„. R.R. : Si t k > 1.796 . se rechaza H„.

5. Cálculos Se que: x ,

=

1 2 . 3 3

,

s

tiene

,

=

6 . 0 6

x 2

=

1 2 . 3 8

,

s 2

= 2 . 5 6 Entonces: (12.33-! 2.38)

(6.06) 2

,

(2.56) V

98

6. Decisión: tk = - 0.02 pertenece a la región de aceptación, por lo tanto las calificacione s son iguales. 6.2.4. P rueba de Hipótes is para la Diferen cia de Medias Poblaci onales con Observ aciones

Paread as.

En la sección anterior se discutió la prueba de la diferencia entre la media de dos poblaciones independientes. Por lo tanto, las dos muestras (o grupos de datos) también eran independientes. En esta sección se desarrollará el procedimiento para analizar la prueba de dos muestras (o dos grupos de datos) que están relacionados; es decir, los resultados de la primera muestra no son independientes de la segunda. Esta característica de dependencia de las muestras ocurre ya sea porque se obtienen mediciones repetidas con elmismo grupo de artículos o individuos o porque los artículos o individuos están

apareados según alguna característica. Por lo tanto, no se puede usar como estadística de prueba la diferencia de medias muéstrales, pues no podemos obtener la varianza de la distribución de medias muéstrales. En consecuencia, se trabajará en cualquiera de estos casos con la diferencia entre los valores de las observaciones, es decir, trabajaremos con un nuevo conjunto de datos formado por las diferencias apareadas de las muestras, tal como se muestra en la siguiente tabla: TABLA N° 35 Muestra

Observación 1

12 x„ x21

Diferencia Di D,= x„ - x2l

X

I2 X22 D2= x12

2

i

X¡, x,2

n

xnl xn:

Donde: X , , : i é s i m o v a l o r e n l a m

-x22

D, = Xj, xi2

Dn= xnl. xn2

u e s t r a 1 X 2

, : i é s i m o v a l o r e n l a m u e s t r a

2 D, : X„ - X2l, la difere ncia entre el iésimo valor en la mues tra 1 y el iésimo valor en la mues tra 2. Además: ii

14

D = -^

n

£o;n(Df

Jsl

II-1

Trataremos el caso para muestras pequeñas (n 0 H i :

UD

*0

2. Nivel de significancia: 3. Estadística prueba:

de

D

t — ---------pr — >t,

SD /yfñ 4. Establecimiento de los criterios de decisión: Prueba de cola

izquierda : R.A. : Si tk > -t| _n . | , se acepta H„. n

R . R. : S i t k < -t, _a , Se re c h a z a H „. Prueba de cola derecha : R .A . : S i t k < t! _ se

an ) >

ac c p t a

H„. R.R. : S i t

k

> 11 .a n ,, se rechaza H„. Prueba bilateral: R.A. : Si tk €

[ -t, . a / 2 n.|, t | . a / 2 , n-|], se acepta H„.

R . R. : S i t k t | a / 2 n | , se re c h a z a H „. 5. Cálculos:

6. Decisión: Se acepta o se rechaza la hipótesis. Ejemplo 130: En estudios generales de ciencias de la PUCP se han escogido 12 pares de alumnos sobre la base de la similaridad de sus rendimientos. A un alumno de cada par le fue enseñando el curso de cálculo I por el método tradicional (X) y al otro por el método de talleres (Y). Estos alumnos dieron una prueba con los siguientes resultados: Par de alumnos

1

2

3

4

5

6

7

8

9

10

11

12

Tradicional (X,)

14

15

12

13

15

11

10

15

15

16

14

8

Talleres (Y;)

12

16

12

11

12

09

07

13

14

15

12

10

Diferencias (D,)

2

-1

0

2

3

2

o

2

1

I

2

_2

Pr u e

b a si lo s m ét o d o s s o n ig u al m e nt e ef e

ct iv o s. U s e Ct = 0. 0 5 S ol u ci ó n: 1. Formulación hipótesis H 0

:

de

j i o = 0 4. Establecimiento de los criterios de decisión H

R.A. : Si t k e[-2.201,2.201] R.R. : Si t k < - 2.201 o tk> 2.201 i

:

f ¿ D

*

0

2. Nivel

de

significancia: (X =0.05 3. Estadística de prueba:

t

=t

0.975,11

D

=2 201

1

0 ‘

=

1.25 tí

=■

D

2.84 1.54/^2 6. Decisión: tk= 2.84 £ R.R. por lo tanto, se rechaza H,,. Lo que quiere decir que los métodos son diferentes. sD/y[ñ

6.2.5. P rueba de Hipótes is para la Diferen cia de Proporc iones Poblaci onales Para probar hipótesis de dos proporciones poblacionales, cuando las muestras son grandes, se siguen los siguientes pasos:

1. Formulación de hipótesis H0 :P, > P2 H0 :Pi

H0 :Pi = P2 H1 : P 1 ^ P2

< P2 H1 : P1 < P2 H1 :P, > P2

2. Nivel de significancia: Ct 3. Estadística de prueba: P

1 Z=

IpO- p)

~ Pi

1 1 —+— 11. tu Donde: n,+n2

P =

\ 4. Establecimiento de los criterios de decisión: Prueba de cola izquierda:

R.A.: Zk > - Z \ . A , se acepta H0. R.R : Z k < - Z i-oc, se rechaza

-

-

H0. Prueba de cola derecha: R.A.: Z K < Zi.„, se acepta Hu. R.R : Zk > Zi.a, se rcchaz a H0-

Prueba bilateral:

R.A. : Si Zk s [Zi_a/2 , Z).a/2 ], se acepta H0.

R.R. : Si Z k < -Zi.a/2 o Zk > Z|.a/2, se rechaza

H0.

5. Cálculos:

P\~P 2

6. Decisión: Se acepta o se rechaza la hipótesis. Ejemplo 131: En una muestra de 500 hogares de Trujillo se encuentran que 50 de ellos están viendo vía satélite un programa especial de televisión. En Tarapoto, 28 hogares de una muestra aleatoria de 400 se encuentran viendo el mismo programa especial. ¿Puede rechazarse la suposición del patrocinador de que el porcentaje de hogares que está observando el programa especial es el mismo en las dos ciudades? Use CC =0.05 Solución: 1. Formulación de hipótesis: H„:P, = P 2 HI : Pi

2. Nivel de significancia: 01 = 0.05 3. Estadística de prueba: -> «(0.1)

Z =

P\ ~ P± 4. Establecimiento de criterios de decisión: R . A . : S i Z k e [-1.96. 1.96], se acepta Ho- R.R.: Si Z k 1.96. se rechaza Ho-

5. Cálculos: Datos:

Entonces:

p

=

^ 2- =------------=------= 0.087 n. + n-, 900 900

P: - P:

I(I1'

0.10-0.07

=

f11^

ñ(l-/3)i —+ — , 0.087x0.913 ---------------+-----

y ' U «:J v

V500 400./

6. Decisión: Zk = 1.5 G [-1.96, 1.96] entonces se acepta H«. El porcentaje de hogares que está observando el programa en las dos ciudades es el mismo. Ejemplo 132: Un sociólogo cree que la proporción de hombres que pertenece a un grupo socioeconómico determinado (grupo A) y que ve regularmente lucha en televisión difiere de un segundo grupo de hombres (grupo B) que también ve lucha. Muestras aleatorias simples de los grupos arrojan los siguientes resultados: Grupo

Tamaño de la muestra

A

150

B

200

Número de hombres que ven regularmente lucha en TV. 98 80

¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? Use a = 0.05 Solución: 1. Formulación de hipótesis: Uo:PA

=

PB

H, :PA*PB 2. Nivel de significancia: Ct = 0.05 3. Estadística de prueba: 4. Establecimiento de criterios de decisión: R.A.: Si Zk E [-1.96, 1.96] ,se acepta H0. R.R.: SiZk 1.96, se rechaza Ji 5. Cálculos: Datos:

nA = 150, xA = 98 => pA = 98/150 = 0.65 nB = 200, xB = 80 =* pB = 80/200 = 0.40 '}_xa+xb=

PA PB

98 + 80 _178_Q5I

nA+nB

150 + 200 350

0.2 5

Zk=5

6. Decisión: Z = 5 R.R. por lo tanto se rechaza H 0, lo que quiere decir que el grupo A difiere del grupo B en ver lucha en televisión. k

6.3. ANÁLISIS DE REGRESIÓN LINEAL SIMPLE El análisis de regresión tiene múltiples aplicaciones en la investigación, en los diferentes campos de la ciencia y en los trabajos prácticos, ya sean estos industriales, comerciales o profesionales. La regresión trata de establecer la forma de relación entre las variables es decir, estudia la relación funcional entre las variables( Y=f(X) o X=f(Y)), de modo que podamos predecir el valor de una con base en la otra las otras. Una función de regresión es lineal simple cuando las variaciones en la variable independiente provocan variaciones proporcionales en la variable dependiente. Y

= f (X) Donde: Y: Variable dependiente X: Variable Independiente Por ejemplo: Podemos estar interesados en predecir el consumo promedio de un conjunto de familias en base al ingreso de las mismas. Entonces: Y: Consumo X: Ingreso El análisis de regresión lineal simple consiste en estimar la función de regresión poblacional (F.R.P.) que responde a la siguiente expresión:

F.R.P. : Yj = p0 + piX¡+ £¡........................(1) Donde: Y : Variable dependiente X: Variable independiente p0 : Intercepto p, : Coeficiente pendiente £ j : Error aleatorio Con base en la función de regresión muestral (F.R.M.) F.R.M. y¡ =Pfl + P,x,+e,.................................(2) 6.3.1. Elección de una Relación Funcional Acá veremos el tipo de función matemática que mejor ha de representar la dependencia entre las variables. Dos son los métodos empleados: a) Una consideración analítica del fenómeno que nos ocupa (estudios anteriores). b) Un examen del diágrama de dispersión en forma gráfica de los datos observados, en esta forma es fácil tener una ¡dea de si existe o no existe regresión, si es lineal o curvilínea, esto puede permitir ahorrar tiempo y dinero, evitando trabajos estériles. Ver fig. 34. Y

---------------------------► x Diagrama de dispersión 6.3.2. El Método de los Mínimos Cuadrados Ordinarios (M.C.O) El principal interés radica en poder estimar la función de regresión poblacional (F.R.P.) con base en la función de regresión muestral (F.R.M.) de la manera más precisa posible. Existen varios métodos para construirla F.R.M., pero en lo concerniente al análisis de regresión el método más usado es el Método de los Mínimos Cuadrados Ordinarios (M.C.O.). Con este método se pueden obtener excelentes resultados, de hecho si la suposición común de normalidad T------►)!((),cr), el método de los mínimos cuadrados es equivalente al de máxima probabilidad.

La función de regresión poblacional no es observable directamente, es preciso estimarla a partir de una función de regresión muestral, motivo por el cual se explica a continuación cómo se expresa la función de regresión muestral lineal con dos variables para una muestra de tamaño n: F.R.M. y , = Donde:

$ o+ ¡5, *,.+£?,.......................................(2)

y, = y , + e , ................................................(3) e

= y i - y ,.............................................(4)

y.

es el valor estimado de

y¡

Lo que muestra que los residuos (e¡) son simplemente la diferencia entre los valores observados y los estimados. Ahora bien, dados n pares de observaciones de X e Y, se está interesado en determinar la F.R.M. de tal forma que esté tan cerca como sea posible al valor actual Y. El principio de los mínimos cuadrados escoge Poy Pi en forma tal que para

n

una muestra dada la resulte tan pequeña como sea posible. Es decir: n_2. t,.tt/, n.2 ], se acepta H0.

R.R. :

Si

tk < -t|.a/: n_2 o tk> t|-u/!>.n-2 .

6. Cálculos:

Donde:

s s e = si C ME

CME = --------------

n-2

SCE = SC\ -

SC ,

se

rechaza H0.

SC

,,

= ¿/-

y¡ ~

—

7. Decisión: Se acepta o rechaza la hipótesis Ejemplo 134: Probar si el coeficiente de regresión poblacional es diferente de 0 (P, *0), del ejemplo 133. Con 01= 0.1 1. Formulación de hipótesis: H0 :p, = 0 H, :p, * 0 2. Nivel de significancia: a=0.1 3. Estadística de prueba:

4. Establecimiento de los criterios de decisión: R.A. : Si tk e [2.132, 2.132] R.R. : Si tu 2.132 5. Cálculos: Donde: 5

Pi =0.09

SE

=2.05

5CV=508;

SCr=433.33;

SCV,= 460; SCE= 16.79

6. Decisión: /A.= 10.06 ER.R.iporlotantoserechazaHj.loquequieredecirque Pi*0. 6.4. ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE La correlación estudia la asociación o relación entre dos variables, es decir, medir el grado de relación entre ellas mediante un coeficiente o

índice. La medida del grado de asociación entre dos variables se llama coeficiente de correlación lineal simple. Cuando se extrae una muestra de n pares de observaciones (x ;, y.), i=1,2,...,n de la población (X,Y) no necesariamente independientes, el estimador puntual del coeficiente de correlación poblacional P es el coeficiente de correlación muestral r de Pearson, que se define por:

r>Y5.99, rechazamos H0, lo que quiere decir que la percepción de la madre sobre las relaciones de sus hijos y su nueva pareja dependen del tipo de unión (la asociación obtenida en la muestra es significativa).

b) Calculando

el coeficiente de contingencia:

x2 o

X¡+n

C = .

C = J———

=0.13 ' 6.15 + 373

El valor máximo que puede tomar C en este caso es:

k-1 2-

Gráficamente podemos observar:

1

C=0.13 0.356

0.71

En conclusión, el grado de asociación entre la percepción de la madre sobre las relaciones de sus hijos y sus nuevas parejas y el tipo de unión es baja (débil); es decir el grado de asociación entre dichas variables no es adecuado.

ULADECH

.411

PROBLEMAS PROPUESTOS N° 6 Intervalo de confianza para la media poblacional 1. Se decide estimar la media del nivel de ansiedad de todos los estudiantes preuniversitarios. Se supone que la población de los puntajes de la prueba se distribuye normalmente con desviación estándar igual a 10 puntos. a) Determinar el intervalo para una confianza del 95%, si una muestra aleatoria de tamaño 100 ha dado una media de 70 puntos. b) Si fi.se estima en 70 puntos con el nivel de confianza del 99%, ¿es el error de estimación puntual superior a 5 puntos? 2. El tiempo en minutos que utilizan los clientes en sus distintas operaciones en un banco local es una variable aleatoria cuya distribución se supone normal con una desviación estándar de 3 minutos. Se han registrado los tiempos de las operaciones de 9 clientes del banco resultando una media igual a 9 minutos. a) Hallar el nivel de confianza si la estimación de fj. es el intervalo de 7 a 13 minutos. b) Si f! se estima p o r x , calcular la probabilidad de que la media de los tiempos de todas las muestras de tamaño 9 esté 6.5 y 11.5 minutos. 3. Suponga que las alturas de los alumnos de la Facultad de Economía tienen distribución normal c o n a = 1 5 cm. Fue retirada una muestra de 100 alumnos obteniéndose x = 175 cm. Construir el intervalo de confianza para la verdadera altura media de los alumnos con 95% de confianza. 4. La Cámara de Comercio de una ciudad está interesada en estimar la media de la cantidad de dinero que gasta la gente que asiste a convenciones, considerando comida, alojamiento y entretenimiento por día. De las distintas convenciones que se llevan a cabo en la ciudad se seleccionaron a 16 personas aleatoriamente y se les preguntó la cantidad que gastaban por día. Se obtuvo la siguiente información en soles: 450, 575, 363, 448, 542, 389, 435, 674, 468, 352, 458, 384, 434, 546, 655, 560. Obtenga el intervalo de confianza del 99% para la media de cantidad de dinero que gasta diariamente la gente que asiste a convenciones e interprete el resultado.

Carmen Rosa Barreto Rodríguez

412

5. Una muestra aleatoria extraída de una población normal presenta una media muestral igual a 150, el número de observaciones es 21 y la varianza muestral es 100. Se pide: a) Construir un intervalo de confianza del 95% para la media poblacional. b) Si se utiliza la información de que la varianza poblacional es 100, calcular el intervalo de confianza del 95% para la media poblacional. c) ¿Por qué el intervalo calculado en (b) es más estrecho que en a? ¿Qué ocurrirá con ambos intervalos si se amplia el tamaño de muestra? Intervalo de confianza para la proporción poblacional 6. Con el objeto de estimar la proporción de televidentes que han visto el anuncio de un producto, se entrevistó a 400 telespectadores y resulto que 344 de ellos sí los habían visto. Encuentre un intervalo de confianza de 95% para la proporción de todos los espectadores que han visto la publicidad del producto. 7. De 209 clientes, 183 expresaron su satisfacción con los servicios bancarios ofrecidos por el Banco de Crédito en la ciudad de Chimbóte. ¿Cómo se compara estos resultados de un estudio anterior por parte de la Encuestadora Apoyo S.A., el cual estimó al 95% del nivel confianza que entre el 74.1 % y el 83.7% de sus clientes estaban satisfechos? 8. En un sondeo reciente de 250 personas que viven en Lima, 50 aprobaron el establecimiento de la pena de muerte para los delitos por terrorismo. Construir un intervalo de confianza del 99% para la proporción real de los limeños que están de acuerdo con la pena de muerte por terrorismo. 9. Si en una muestra de 600 estudiantes de economía, 360 son hijos de hombres de negocios. Obtenga un intervalo aleatorio con un nivel de confianza del 90% para la proporción de todos los estudiantes de economía que son hijos de hombres de negocios. El número de estudiantes de economía en todo el país se estima en 15 000. Intervalo de confianza para la diferencia de dos medias poblacionales 10. El consumo medio en gasolina de las familias de Lima en la última semana se ha estimado a través de una muestra aleatoria simple de 300 familias, obteniéndose para las mismas una media de 20 litros y una desviación estándar de 5 litros. Análogamente, en

ULADECH

.413

Trujillo se preguntó a 250 familias obteniéndose una media de 15 litros y una desviación estándar de 8 litros. Calcular una estimación para la diferencia entre los consumos medios con una confianza del 90%. ¿Cuál es el error cometido en esta estimación? 11. Se realizó un estudio para determinar la diferencia del Coeficiente Intelectual (Cl) entre los niños del Distrito de Chimbóte y de Nuevo Chimbóte. Se obtuvieron los siguientes resultados: n

X

S

Chimbóte

30

115

9

Nvo. Chimbóte

40

90

Distrito

16

Se sabe que el Coeficiente Intelectual (Cl) de las dos poblaciones está distribuido normalmente. Construir el intervalo de 95% de confianza para la diferencia de las dos medías poblacionales. 12. Se quiere estimar la diferencia entre los promedios de tiempo (en minutos) que utilizan los hombres y las mujeres para realizar un test de aptitud. Se aplica el test a 20 hombres y 25 mujeres dando las medias respectivas de 110 y 100 puntos. Suponga que las dos poblaciones son varianzas iguales a 100 y 64, respectivamente. a) Determine el intervalo de confianza del 99% para la diferencia de medias. b) ¿Es válida la afirmación W-1^=13? 13. Un inversionista hace un estudio sobre los gastos semanales para elegir una de las dos ciudades, Trujillo o Piura, para un centro comercial. En una muestrade21 hogares de la ciudad de Trujillo halló: .v = S400. s,= S210. En otra muestra de 16 hogares de la ciudad de Piura halló: .y = $380. s, =$60 . Suponga poblaciones normales con varianzas desconocidas pero diferentes. Usando un intervalo de confianza de 95%, ¿en cuál de las dos ciudades debería abrir la sucursal? 14. El departamento de admisión de una universidad desea estimar la diferencia entre las medias de las calificaciones de alumnos provenientes de dos preparatorias. Los resultados de las muestras aleatorias simples e independientes de las dos escuelas se ven en la siguiente tabla:

Carmen Rosa Barreto Rodríguez

414

Colegio Minerva

Colegio Universitario

n2 = 20

/7, = 26

xj - 12.72

= 18.02

5, = 0.38

= 0.45

a)¿Cuál es el estimado puntual de la diferencia entre las medias de las dos poblaciones? b) Determine un intervalo de confianza de 90% para la diferencia entre las dos medias poblacionales. Suponga poblaciones normales con varianzas desconocidas pero diferentes. 15. Se selecciona al azar cinco secretarias de la Universidad de Lima y se procede a registrar la velocidad en mecanografiar un texto (palabras por minuto) para cada secretaria. Luego, se les envía a un curso de perfeccionamiento y se vuelve a realizar la misma prueba. Los resultados obtenidos en ambos casos son los siguientes:

Secretaria

Antes

Después

1

80

82

2 3 4 5

70 85 62 82

77 79 68 84

Suponiendo que la característica en estudio sea normal, se puede estimar con un 95% de confianza que la velocidad de mecanografiado es superior luego de haber realizado el curso? 16. El año 1996 se vio caracterizado por el auge de la Bolsa de Valores producto de las medidas de política económica aplicadas por el gobierno las cuales promovieron un incremento de rentabilidad relativa de los valores transados en bolsa respecto de otras alternativas de inversión. Este fenómeno observado llega a ser cúspide en el mes de abril de dicho año, período en el cual se

ULADECH

.415

transan 576.4 millones de soles entre acciones y obligaciones. A continuación se presenta un cuadro resumen del movimiento bursátil para 1996 en los meses de abril y diciembre, respectivamente. SECTORES ABRIL DICIEMBRE Bancos Financieras Industriales Mobiliarios Mineras Seguros Servicios públicos Diversas Industrias laborales Mineras laborales

10.8

35.0

2.4 267.8 0.0 10.7 2.6 0.1 4.1 113.6 14.0

9.5 31.1 0.0 6.9 14.8 0.1 27.6 196.2 11.6

Suponiendo que la característica en estudio es normal, ¿será cierta la supremacía del mes de abril respecto del mes de diciembre en cuanto al movimiento bursátil promedio se refiere, a un nivel de confianza del 95%? Intervalo de confianza para la diferencia de dos proporciones poblacionales 17. Una empresa de estudios de mercado quiere estimar las proporciones de hombres y mujeres que conocen un producto promocionando a escala nacional. En una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60 mujeres están familiarizados con el artículo indicado. Construya el intervalo de confianza del 95% para la diferencia de proporciones de hombres y mujeres que conoce el producto. Con base en los resultados, ¿se estaría inclinando a concluir que existe una diferencia significativa entre las dos proporciones?. 18. En una muestra al azar de 700 mujeres, 300 indican que están a favor de la ayuda del Estado a los colegios privados. En una muestra al azar de 400 hombres, 100 indican a favor de lo mismo. Determinar un intervalo de confianza de 90% para la diferencia de

Carmen Rosa Barreto Rodríguez

416

proporciones de todas las mujeres y todos los hombres que favorecen tal ayuda. 19. Dos muestras aleatorias de 250 mujeres y 200 hombres indicaban que 75 mujeres y 80 hombres consumieron un nuevo producto unisex que acaba de salir al mercado. Utilizando un intervalo de confianza del 95%, ¿se puede aceptar que es igual la proporción de preferencias de mujeres y hombres en toda la población? Si no es así, ¿cuál es la relación? Prueba de hipótesis para la media poblacional 20. Se cree que el tiempo promedio que utilizan los alumnos del ciclo básico para realizar cierta prueba de aptitud tiene distribución normal cuya media es 15 minutos. Para comprobar la hipótesis respecto a la media se tomó una muestra aleatoria de 16 de tales alumnos y se encuentra un promedio de 16 minutos. Realice una prueba unilateral. a) Con el nivel de significación a =0.05, si sabe que G=3.2. b) Con el nivel de significación a=0.05, si s =3.2, se calcula de la muestra. 21. El gerente de ventas de una compañía afirma que sus vendedores venden semanalmente en promedio $1 500. Al nivel de significación del 5% pruebe la hipótesis del gerente versus la hipótesis del presidente de los vendedores que afirma que el promedio de las ventas semanales es mayor, si una muestra de 36 vendedores ha dado una media igual a $1 510 y una varianza igual a $900 en una semana. 22. Una empresa de servicio postal garantiza a su empresa que puede reducir el tiempo promedio necesario para recibir un paquete a menos de 2.5 días, que es lo que usted experimenta actualmente. Después de utilizar la nueva compañía en 17 ocasiones, el tiempo de entrega promedio fue de 2.2 días y la desviación estándar fue de 0.9 días. ¿Debería cambiar su firma a la nueva empresa de mensajería? Sea (X= 1%. 23. El representante de un grupo comunitario informa a una persona que proyecta crear un centro comercial que el ingreso promedio familiar en la zona es de S/.1500. Supóngase que para el tipo de zona en cuestión se puede suponer que el ingreso familiar está distribuido normalmente y que la desviación estándar se puede aceptar como Cf = S/.200 basándose en un estudio anterior. Para una muestra aleatoria de n= 10 familias se ha encontrado que el ingreso medio por familia es de x = 1 400 . Probar que el ingreso

ULADECH

.417

medio familiar en la zona es diferente de S/.1500 al nivel de significación del 5%. 24. Es conocido por referencias históricas que las calificaciones de los trabajadores de la empresa telefónica tienen un valor promedio de 200 puntos y una desviación estándar de 16 puntos. Sin embargo, en fechas recientes se evaluó a un grupo de 64 trabajadores, que obtuvieron una puntuación media de 203.5. Dentro de un nivel de confianza del 95%, ¿puede decirse que la puntuación de este grupo es igual a 200 puntos, o, por e! contrario, la puntuación de este grupo es diferente a la referencia histórica de 200 puntos? Prueba de hipótesis para la proporción poblacional 25. Un político supone que menos del 60% de los votos de su territorio le son favorables. Con el fin de verificar su conjetura selecciona una muestra representativa compuesta de 200 votantes y aplica una encuesta, obteniéndose 100 respuestas a su favor. Probar que estos resultados confirman la creencia del político, es decir, que los votos favorables de su territorio son menos del 60%. Use a = 0.05. 26. Una revista “X" (marzo 2002) informó que la insatisfacción laboral estaba alcanzando proporciones de epidemia. Un estimado del 70% de los trabajadores del Perú cambiarían de trabajo si pudieran. Si esto es cierto en los trabajadores de su empresa, usted planea instituir un programa para mejorar la moral de los empleados. Ud. descubre que 1020 trabajadores de una muestra de 1500 expresan su insatisfacción con su trabajo. ¿A un nivel de significancia del 5% debería Ud. implementarel programa? 27. El gobierno sostiene que el 15% de las familias de una determinada región obtiene menos del salario mínimo establecido. Una muestra al azar de 60 familias dio como resultado 12 familias en tales condiciones. Probar que el gobierno no tiene razón. Use Ct = 0.05. 28. Se cree que al menos el 65% de los habitantes de cierta ciudad favorece un nuevo proyecto. ¿Qué conclusión se puede sacar si solo 120 de los de una muestra de 200 residentes apoyan dicho proyecto? Usea = 0.01. Prueba de hipótesis para la diferencia de dos medias poblacionales 29. Tienes una muestra aleatoria de tamaño n de una población normal. Prueba la siguiente hipótesis al nivel de significancia de 0.01. Indica claramente el valor de la estadística de prueba y la decisión tomada. H0 :

Hx = Hy

H|:|ax*|iy nx

= 45, ny = 60,

x=-2A, y

= -1,

Carmen Rosa Barreto Rodríguez

418

av = 2. a, = 8. 30. El Ministerio de Vivienda ha encargado un estudio a una empresa de mercadeo sobre el precio de las viviendas nuevas en dos distritos de Lima: A y B. La empresa encargada de realizar el estudio ha recogido información sobre el precio del m2 de 45 viviendas de promotoras distintas seleccionadas al azar en el distrito A y de 40 viviendas, también elegidas aleatoriamente en las promociones de vivienda nueva existente, en el distrito B. En la muestra aleatoria de viviendas del distrito A, el precio medio del m 2 ha resultado ser de 980 soles con una desviación estándar de 90 soles, mientras que en la muestra B, el precio del m2 y la desviación estándar son respectivamente de S/.950 y S/.70 ¿Puede aceptarse que en los dos distritos no hay diferencia en el precio del m 2 de las viviendas diferencia en el precio de nueva construcción para un nivel de significación del 5%? 31. Se quiere determinar la diferencia entre los tiempos promedios en minutos que utilizan los hombres y las mujeres para realizar una determinada tarea. Con este fin se escogen 16 hombres y 16 mujeres, resultando los tiempos promedios respectivos 40 y 35 minutos, y desviaciones estándar respectivas de 9 y 8 minutos. Suponga que las poblaciones de ambos tiempos son independientes y se distribuyen normalmente con varianzas iguales. Al nivel de significación del 1%, ¿es el tiempo promedio de hombres mayor al tiempo promedio de mujeres? 32. El gasto telefónico medio mensual en una muestra de 10 usuarios elegidos al azar en una ciudad ha resultado ser S/. 90 y la desviación estándar, S/.11. En otra ciudad se ha tomado, de modo independiente, otra muestra de 12 usuarios y los valores obtenidos para la media y desviación estándar muéstrales han sido respectivamente S/.80 y S/.10 ¿ Proporcionan estos datos suficiente evidencia estadística, ai nivel de significancia del 5%, a favor de la hipótesis de que el gasto medio en la primera ciudad es más alto que el gasto medio en la segunda? Suponer que las varianzas de las variables que indican los gastos telefónicos en ambas ciudades son desconocidas pero diferentes. 33. La duración media de una muestra de 10 bombillas es x = 1250 horas, con una desviación estándar muestral de S = 115 horas. Se cambia el material del filamento por otro nuevo, entonces, de una muestra de 12 bombillas se obtuvo una duración media de y = 1340 horas, con una desviación estándar muestral ^ = 106 horas. Las poblaciones son normales con varianzas desconocidas pero x

ULADECH

.419

diferentes. A un nivel de significancia del 5% ¿ha aumentado la duración media de las bombillas? 34. Dos conjuntos "idénticos" de 50 empleados se inscriben en dos programas diferentes de capacitación y luego se les practica una prueba de aptitudes. La diferencia promedio en los puntajes es de 13.5, con una desviación estándar en tales diferencias de 4.3 ¿Qué se concluye sobre la relativa eficacia de los programas de formación adicional? Use Ot =0.05. 35. Un analista de sistemas está aprobando la posibilidad de usar un nuevo sistema de computadora. El analista cambiará el procesamiento al nuevo sistema solo si hay pruebas de que el nuevo sistema usa menos tiempo para el procesamiento que el sistema antiguo. A fin de tomar una decisión se seleccionó una muestra de siete trabajos y se registró el tiempo de procesamiento, en segundos, en los dos sistemas con los siguientes resultados: Trabajo Nuevo Viejo 1

7

5

2 3 4 5 6 7

3 9 8 7 6 11

2 6 7 4 7 8

Al nivel de significancia del 1% ¿usa el nuevo sistema menos tiempo para el procesamiento? Prueba de hipótesis para la diferencia de dos proporciones poblacionales 36. Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres, pero el personal de producción del programa piensa que es igual el porcentaje de televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres

Carmen Rosa Barreto Rodríguez

420

estaban viendo el programa especial de televisión, considerarse significativa la diferencia al nivel 0t = 0.05?

¿puede

37. Un investigador que trabaja con un departamento correccional cree que entre los jóvenes encarcelados por actos de violencia, el porcentaje de ellos que fue educado en hogares superpoblados está muy por encima del 10% respecto del porcentaje de personas encarceladas por todos los demás crímenes que se educaron en hogares superpoblados. Para obtener evidencia que apoye esta teoría, el investigador tomó muestras aleatorias independientes de los registros de los últimos cinco años en los dos tipos de criminales y obtuvo los siguientes resultados: Tipo de delito

Tamaño de muestra

Número de jóvenes educados en hogares superpoblados

Actos de violencia

200

132

Todos los demás

300

147

¿Proporciona estos datos evidencia suficiente como para fundamentar la opinión del investigador al nivel de significancia del 5%? 38. Una agencia de publicidad realizó un estudio para comparar la efectividad de un anuncio en la radio en dos distritos. Después de difundir dicho aviso, se realizó una encuesta telefónica con 600 personas seleccionadas al azar, que viven en cada uno de los distritos, resultando proporciones 20% y 18%, respectivamente. Verificar al nivel de significación del 5% si son iguales las proporciones de personas que escucharon dicho aviso en los dos distritos mediante una prueba unilateral. Regresión y correlación lineal simple 39. Se efectuó un estudio en donde se relacionan los puntajes de aptitud con la productividad en un establecimiento industrial, después de tres meses de entrenamiento del personal. Sus postulantes elegidos al azar obtuvieron los seis pares de puntaje de aptitud y productividad que se indica en la tabla que se anexa:

ULADECH

.421

Productividad

Puntaje de aptitud (X)

(Y)

.9

23

12

30

15

33

17

35

20

40

23

45

Se pide: a) Haga el diagrama de dispersión y analice la linealidad de las variables. b) Estime el modelo de regresión lineal estimado. c) Interprete P,. d) Pruebe si el coeficiente de regresión poblacional es diferente de cero (P, * 0) con un nivel de significancia de 5%. e) Calcule el coeficiente de determinación r e interprete. f) Grafique la linea de regresión estimada sobre el diagrama de dispersión. g) Determine la productividad esperada para un trabajador cuyo puntaje de aptitud es de 50. 2

40. Una teoría financiera popular sostiene que existe una relación directa entre el riesgo de una inversión y el rendimiento que promete. El riesgo de una inversión se mide por medio del valora . A continuación se presentan los rendimientos y valores Oí para 10 acciones ficticias sugeridas por la empresa de inversiones CPI ¿Estos datos parecen confirmar esta teoría financiera de una relación directa? Acción

1

2

3

4

5

6

7

8

9

10

Rendimiento %

5.4

8.9

2.3

1.5

3.7

8.2

5.3 0.5

1.3

5.9

Valor a

1.5

1.9

1.0

0.5

1.5

1.8

1.3 0.5

0.5

1.8

Se pide: a) Hacer el diagrama de dispersión para analizar la correlación positiva.

Carmen Rosa Barreto Rodríguez

422

b) Hallar el coeficiente de correlación para confirmar la pregunta dada. c) Probar si el coeficiente de correlación poblacional P es diferente de cero(P^O)con cx= 0.05. 41. Como analista de “Coca-Cola", su trabajo es utilizar los datos proporcionados aquí para saber si los cambios en los precios son efectivos para promover las ventas. Estos datos se tomaron en los mercados de prueba seleccionados en toda la región para el precio de cada botella y las respectivas ventas realizadas. Las ventas están dadas en miles de soles. Precio en soles

2.10 3.52 2.10 2.55 3.50 2.00 3.50 2.99 2.99 2.25

rx) Ventas de Coca-cola en

35 25 21 19 23 31 24 31 20 19

miles (Y)

a) Graficar el diagrama de dispersión b) ¿Existe correlación? Explique. c) ¿La correlación es positiva o negativa? 42 El número de horas de estudio invertidas y las calificaciones finales en un curso de matemáticas de una muestra de 8 alumnos ha dado los siguientes resultados: Alumno Horas de estudio Calificación

A, 14 12

A,

A.

A,

A,

A„

A-

A,

16

22

20

18

lo

18

22

13

15

14

13

11

14

16

a) Determinar la recta de regresión de la calificación sobre el número de horas de estudio invertidas. b) Calcular el grado de asociación y determine si es significativo al nivel del 5%. 43. Las calificaciones de un grupo de estudiantes en el examen parcial (X) y en el examen final (Y) fueron los siguientes:

ULADECH

.423

X

12 08

10

13 09 14

17

11 18 12

Y

15 13

12

13 11 12

15

12 17 15

a) Determine la ecuación de regresión lineal de Y en X, b) Pruebe la significación de la pendiente poblacional con a = 0.05 44 Con ¡os siguientes datos muéstrales: Coeficiente de

135

115

95

100

110

120

125

130

140

16

13

12

12

14

14

15

15

18

inteligencia IQ(X)

Notas de un examen (Y)

a) Hallar la ecuación de regresión lineal de Y en X. b) Determine el grado de asociación entre Xe Y. c) Pruebe la hipótesis (P= 0) contra la hipótesis (P =£ 0) con a = 0.05. Prueba de Independencia Chi-Cuadrado 45. Se selecciona una muestra de 800 votantes y se les califica de acuerdo a su nivel de ingresos como: bajo medio, alto, y según su opinión a una reforma impositiva en: a favor, en contra, sin decisión. Las frecuencias observadas se dan en la siguieiil«í t.YvIa: OPINIÓN

A favor En contra Sin decisión

INGRESOS BAJO

MEDIO

ALTO

200

130

70

60 40

60 60

80 100

Son independientes la opinión de los votantes y su nive! de ingresos. Use a =0.05. 46. Se realizó un estudio para determinar si el tamaño de la familia depende del nivel de educación del padre. La muestra se clasificó de acuerdo al nivel de educación y al número de hijos, en la siguiente tabla:

Carmen Rosa Barreto Rodríguez

Nivel de Educación

424

Número de Hijos 0a 1

2

3

4

5 a más

Primaria

20

18

12

14

30

Secundari a Superior

50 12

25 6

18 4

16 8

24 12

Con estos datos ¿se puede inferir que el tamaño de la familia es independiente del nivel de educación del padre? Use a =0.05. 47. Con la finalidad de averiguar si las bajas notas finales obtenidas en el curso de Estadística General es producto de las pocas horas dedicadas al estudio del curso durante el ciclo, se obtuvo la siguiente información: [0-5)

[5-10)

[0-3)

25

15

8

1

49

[3-6) [6-9)

20 15

10 8

11 15

3 10

44 48

Total

60

33

34

14

141

Horas dedicadas al curso

[10-15) [15-20)

Total

Pruebe la hipótesis correspondiente. Use a =0.05. 48. Una encuesta para evaluar la política educativa del ramo se llevó a cabo con 218 padres de familia de tres estratos sociales A, B y C de una pequeña comunidad. Ante la pregunta ¿está Ud. de acuerdo con la política educativa del Ministerio?, se obtuvieron las siguientes respuestas:

ULADECH

.425

Respuesta

Estrato A

B

C

Total

SI

22

24

20

66

NO

50

42

60

152

Total

72

66

80

218

Realice la prueba de hipótesis correspondiente. Use a =0.05.

49. En un estudio sobre el uso de sistemas operativos se han seleccionado al azar a 240 profesores universitarios (PU), 165 profesionales técnicos (PT) de grado medio que trabajan en la industria y 163 personas con cargos directivos (CD) en empresas. A cada uno de los seleccionados se le ha preguntado cuál es el sistema operativo (A, B o C) que utiliza habitualmente en su trabajo con ordenadores. Los resultados se resumen en la siguiente tabla: A

B

C

PU

52

130

58

PT CD

42 28

60 60

63 75

¿Hay suficiente evidencia estadística al nivel de significancia 5% para concluir que existe alguna asociación entre el status profesional y la preferencia por un sistema operativo?

Carmen Rosa Barreto Rodríguez

426

CAPÍTULO 7 INTRODUCCION A LAS TÉCNICAS DE MUESTREO El muestreo es una herramienta de la investigación científica. Su función básica es determinar qué parte de la realidad en estudio de la población debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido al hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo de una parte de ella se llama error de muestreo. Obtener una muestra adecuada significa lograr una visión simplificada de la población, que reproduzca de algún modo sus rasgos básicos. 7.1. TIPOS DE MUESTREO Se dividen en dos grandes grupos: muestreo probabilístico y no probabilístico. 7.1.1. Métodos de Muestreo Probabilístico: Los métodos de muestreo probabilístico son aquéllos que se basan en el principio de la equiprobabilidad. Es decir, aquéllos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Solo estos métodos de muestreo probabilístico nos asegurarán la representatividad de la muestra extraída y son por lo tanto los más recomendables. A continuación le mostraremos los tipos de muestreo probabilístico, así como sus características, ventajas e inconvenientes. TABLA N° 36

Características Ventajas Inconvenientes Métodos de muestreo probabilístic o Se selecciona una Sencillo y de fácil com- Requiere que se posea Muestreo muestra de tamaño n prensión. de antemano un Aleatorio de una población de N Cálculo rápido de listado completo de Simple

unidades, cada medias y varianzas. toda la población. segmento tiene una Se basa en la teoría Cuando se trabaja con probabilidad de estadística, y por tanto muestras pequeñas es inclusión igual y existen paquetes posible que no conocida de n/N. informáticos para represente a la analizarlos datos. población adecuadamente.

ULADECH

.427

Conseguir un listado Fácil de aplicar. Si la constante de de los N elementos No siempre es muestreo está asociada de la población. necesario tener un con el fenómeno de Determinar el tamaño listado de toda la interés, las muestral n. población. estimaciones obtenidas Definir un intervalo Cuando la población a partir de la muestra k=N/n. Elegir un está ordenada pueden contener sesgo número aleatorio, r, siguiendo una de selección. entre 1 y k (r = tendencia conocida, arranque aleatorio). asegura una cobertura Seleccionar los de unidades de todos elementos de la lista. los tipos. En ciertas ocasiones Tiende a asegurar que Se ha de conocer la Muestreo resultará conveniente la muestra represente distribución en la Aleatorio de las Estratificado estratificar la muestra adecuadamente a la población según ciertas variables población en función variables utilizadas de interés. Para ello de unas variables para la estratificación. debemos conocer la seleccionadas. composición Se obtienen estratificada de la estimaciones más población objetivo a precisas. muestrear. Una vez Su objetivo es calculado el tamaño conseguir una muestra muestral apropiado, lo más semejante éste se reparte de posible a la población manera proporcional en lo que a la o las entre los distintos variables estratificadas estratos definidos en la se refiere. población usandovarias una Es Se realizan muy eficiente El error estándar es Muestreo fases de muestreo cuando la población es mayor que en el Aleatorio (polie- muy grande y muestreo aleatorio Conglomerad sucesivas tápico). dispersa. simple o estratificado. o La necesidad de No es preciso tener un El cálculo del error listados de las listado de toda la estándar es complejo unidades de una etapa población, sólo de las se limita a aquellas unidades primarias de unidades de muestreo muestreo. seleccionadas en la etapa anterior. Muestreo Aleatorio Sistemático

7.1.2. Métodos de Muestreo No Probabilístico A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aún siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se selecciona a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. Entre los más conocidos se tiene: a) Muestreo por cuotas También denominado en ocasiones “accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de

Carmen Rosa Barreto Rodríguez

428

la población y/o de los individuos más “representativos” o “adecuados” para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas “cuotas” que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Chimbóte. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. b) Muestreo opinático o intencional Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras “representativas” mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales en zonas que en anteriores votaciones han marcado tendencias de voto. c) Muestreo casual o incidental Se trata de un proceso en el que el investigador seleccionada directa e intencionalmente a los individuos de la población. El caso más frecuente de este procedimiento es utilizar como muestra a los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particulares el de los voluntarios. d) Bola de nieve Se localiza a algunos individuos, los cuales conducen a otros, y éstos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones “marginales”, delincuentes, sectas, determinados tipos de enfermos, etc. 7.2. 7.2.1.

CÁLCULO DELTAMAÑO MUESTRAL Para el Muestreo Aleatorio Simple

a) Cuando el parámetro es la media poblacional (fi ). Característica de la población

Tamaño de la población infinito o desconocido.

Tamaño de muestra

-V’

e

ULADECH

.429

Tamaño de la población finita. n

Z^x^xN Zt0/2X o2+e2x(N-1)

Donde: n

Tamaño de la muestra.

N

Tamaño de la población.

7

Límite de confianza requerido según la distribución de Gauss Zo.975= 1.96 para a=0.05; Z0.995 = 2.576 para a = 0.01 a

Valor de la varianza poblacional. En caso de no conocerse se estima por la varianza muestral (s 2).

e

Error que se prevé cometer.

Ejemplo 137: Muchos abogados que trabajan en oficinas de Lima también trabajan en casa o en su oficina durante los fines de semana. ¿De qué tamaño debe ser una muestra para estimar la media poblacional del tiempo que se trabaja los fines de semana, con un margen de error de 10 minutos? Emplee un nivel de confianza del 95%. Suponga que el valor de la desviación estándar poblacional es de 45 minutos. Solución: Obteniendo los datos necesarios para hallar el tamaño muestral. g =

45

minutos o2 =

2025

minutos2.

l-a=0.95

->a/2 = 0.025->Zo.975= 1 96

e = 10

minutos

Tamaño de la población infinito o desconocido. Entonces:

(1.96)2 x 2025

n =------------ ------=

Carmen Rosa Barreto Rodríguez

430

(10)2 n = 77.7 £ 78

abogados,

b) Cuando el parámetro es la proporción poblacional (P). Característica de la población

Tamaño de la población infinito o desconocido.

Tamaño de la población finito.

Tamaño de muestra

n=

Z,Lx

PxQ

Z?.ali xPxQxN ZLi: xPxQ + e\(N — Y)

n

Tamaño de la muestra.

N

Tamaño de la población.

Z|.a/2 Límite de confianza requerido según la distribución de Gauss Zow = 1-96 para a -0.05: Z0995 =2.576 para a = 0.01 P

Valor de la proporción poblacional que tiene una característica dada. En caso de no conocerse se estima por la proporción muestral (p). En la opción más desfavorable se considera P = 0.5, que hace mayor el tamaño muestral.

Q

1-P

e

Error que se prevé cometer.

Ejemplo 138: Una encuesta de The Wall Street Journal y NBC reunió datos acerca de cómo consideran los estadounidenses la calidad de la información en los diarios y en TV (The Wall Street Journal, 27 de junio de 1997). Una de las preguntas fue si el encuestado cree que lo que se dice de la economía de los Estados Unidos es equilibrado, demasiado negativo o demasiado positivo. Los estimados preliminares son que un 50% de la

ULADECH

.431

población cree que la economía es equilibrada. ¿Qué tamaño de muestra se recomienda para que el margen deseado de error sea de 3.3%. Emplee el 95% del nivel de confianza. Solución: Obteniendo los datos necesarios para hallar el tamaño de muestra. p = 0.5 q = 0.5 1

- a = 0.95 a = 0.05 Z0.975 =

1 .96

e = 0.033

Tamaño de la población infinito o desconocido. Entonces: z

0.97SxP*q e2

(1.96)2 x 0.5 x 0.5 (0.033)

^”2

n = 881.9 = 882 personas. 7.2.2. Para el Muestreo Aleatorio Sistemático El tamaño de la muestra se puede calcular mediante el muestreo aleatorio simple y luego proceder a usar la técnica adecuada para la selección de la muestra. 7.2.3. Para el Muestreo Aleatorio Estratificado La distribución de la muestra en función de los diferentes estratos se llama afijación y puede ser de diferentes tipos: - Afijación simple: a cada estrato le corresponde igual número de elementos. - Afijación proporcional: la distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

N,

n,

= —-xn

N

'

Afijación óptima: se tiene en cuenta la previsible dispersión de los resultados, de modo que se considere la proporción y la dispersión típica. Tiene poca aplicación ya que no se suele conocer la desviación. Ejemplo 139: Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación de la reforma educativa ha tenido entre

Carmen Rosa Barreto Rodríguez

432

los padres de una determinada provincia. A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los 10000 niños escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios privados parroquiales y 1000 a colegios privados no parroquiales. Como estamos interesados en que en nuestra muestra estén representados todos los tipos de colegio, realizamos un muestreo estratificado empleando como variable de estratificación el tipo de centro. Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso parece más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño de los estratos. Por consiguiente, calculamos qué proporción supone cada uno de los estratos respecto de la población para poder reflejarlo en la muestra. Colegios públicos: — = = o.60 ;V 10000 Colegios privados parroquiales: — = ^000 _ N 10000

Q

~ , W’ 1000 Colegios privados no parroquiales: =------------= 0.10

N 10000

Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el tamaño muestral. Colegios públicos: ”i

N

x

^

=

^

N2

Colegios privados parroquiales: n2 = — x / i = 0.30x600 = 180 Colegios privados no parroquiales: «3 - — f x « - 0.10x600 - 60 7.2.4. Para El MuestreoAleatorio por Conglomerado Se puede elegir los conglomerados mediante el muestreo aleatorio simple o sistemático. Cuando se observa todas las unidades elementales en las agrupaciones muéstrales, tenemos lo que se conoce como muestreo MONOETÁPICO. Cuando se extrae una muestra de las unidades elementales de las agrupaciones, tenemos el llamado muestreo BIETÁPICO. Cuando el muestreo se lleva en varias etapas se conoce como POLIETÁPICO.

ULADECH

.433

Ejemplo 140: En una investigación en la que se trata de conocer el grado de satisfacción laboral de los profesores de instituto necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que el número de profesores por instituto es aproximadamente de 35, los pasos a seguir serían los siguientes: 1. Recoger un listado de todos los institutos. 2. Asignar un número a cada uno de ellos. 3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que nos proporcionarán los 700 profesores que necesitamos. PROBLEMAS PROPUESTOS N° 7 1. ¿De qué tamaño debe ser una muestra para poder tener el 95% de confianza de que el error muestral es del 5% a menos? Suponga que la desviación estándar de la población es de 0.25. 2. Hallar el tamaño de muestra para estimar la media de una población con los siguientes datos:

N = 10000 e =15 1 - a = 0.95 a =25 3. Para conocer la proporción de familias de una ciudad que tiene problemas judiciales por hipoteca de su vivienda con una entidad bancaria. se nuir-re calcular una muestra aleatoria de tamaño n Calcule el valor mínimo de n para garantizar que a un nivel del 95%, el error de estimación sea menor que 0.05. (como se desconoce la proporción, se ha de tomar el caso más desfavorable, que será 0.5) 4. Calcular el tamaño de muestra si:

N = 5000 e = 0.03 1 - a = 0.99 p = 0.6 5. Se cree que los sueldos anuales iniciales de egresados de licenciatura en administración de empresas pueden tener una desviación estándar aproximada de $2000 dólares. Suponga que se desea un estimado de intervalo de 95% de nivel de confianza para la media del sueldo anual inicial. De qué tamaño debe tomarse la muestra, si el margen de error es: a) $500

b)$200 c)$100

6. El Departamento de Vivienda y Desarrollo Urbano de Estados Unidos publica datos acerca del alquiler mensual de viviendas

Carmen Rosa Barreto Rodríguez

434

con una recámara en áreas metropolitanas. La desviación estándar de la renta mensual es aproximadamente de $80 dólares. Suponga que se debe seleccionar una muestra de áreas metropolitanas para estimar la media de la población de la renta mensual de viviendas con una recámara. Emplee el nivel de confianza de 95%. a) ¿De qué tamaño debe ser la muestra para que el margen de error deseado sea de $25 dólares? b) ¿De qué tamaño debe ser la muestra para que el error deseado sea de 515 dólares? 7. Se pidió a una muestra de 200 personas identificar su principal fuente de información de noticias, 110 dijeron que esa fuente es los noticieros televisivos. ¿Qué tamaño debe tener una muestra para estimar la proporción de la población, con un margen de error igual a 0.05 y un nivel de confianza de 95%?

* * * *

8. En un instituto de enseñanza secundaria se ofertan los siguientes tipos de enseñanza: Ciclos de grado superior: 110 alumnos. Bachillerato: 162 alumnos. Ciclo grado superior: 210 alumnos. 2o ciclo de enseñanza secundaria obligatoria: 338 alumnos. Se pretende valorar las faltas de ortografía que cometen los alumnos del centro mediante una prueba de dictado de un texto de 20 líneas. Las pruebas se pasarán a una muestra de 50 alumnos para minimizar el costo en tiempo y medios. ¿Qué muestreo llevaría a cabo?

9. De una población de 1000 personas, elija una muestra de 100 mediante: a) Un muestreo aleatorio simple. b) Mediante un muestreo aleatorio sistemático.

APÉNDICE

ULADECH

.435

Tabla I: Tabla de la Distribución Binomial Acumulada

n=5 0 X

1 2 3 4

n = 10

X

0.05

0.10

0.95 1 0.99 9 1.00 0 1.00 0 1.00 0

0.77 4 0.97 7 0.99 9 1.00 0 1.00 0

0.590 0.32 8 0.919 0.73 7 0.910 0.94 2 1.000 0.99 3 1.000 1.00 0

0.25

P

0.30

0.40

0.50

0.60

0.60

0.70

0.75

0.80

0.90

0.95

0.99

0.237 0.16 8 0.633 0.52 8 0.896 0.83 7 0.984 0.96 9 0.990 0.99 8

0.07 8 0.33 7 0.68 3 0.91 3 0.99 0

0.03 1 0.18 8 0.50 0 0.81 2 0.96 9

0.01 0 0.08 7 0.31 7 0.66 3 0.92 2

0.01 0 0.08 7 0.31 7 0.66 3 0.92 2

0.00 2 0.03 1 0.16 3 0.47 2 0.83 2

0.00 1 0.01 6 0.10 4 0.36 7 0.76 3

0.00 0 0.00 7 0.05 8 0.26 3 0.67 2

0.00 0 0.00 0 0.00 9 0.08 1 0.41 0

0.00 0 0.00 0 0.00 1 0.02 3 0.22 6

0.000

0

0.904

0.599 0.349 0.107 0.056

0.028 0.006 0.001

1

0.996

0.914 0.736 0.376 0.244

0.149 0.046 0.011

2

1.000

0.988 0.930 0.678 0.526

0.383 0.167 0.055

3

1.000

0.999 0.987 0.879 0.776

0.650 0.382 0.172

4

1.000

1.000 0.998 0.967 0.922

0.850 0.633 0.377

5

1.000

1.000 1.000 0.994 0.980

0.953 0.834 0.623

6

1.000

1.000 1.000 0.999 0.996

0.989 0.945 0.828

7

1.000

1.000 1.000 1.000 1.000

0.998 0.988 0.945

8

1.000

1.000 1.000 1.000 1.000

1.000 0.998 0.989

9

1.000

1.000 1.000 1.000 1.000

1.000 1.000 0.999

1 2 3 4 5 6 7 8 9 10 11 12 13 14

n = 20

0.20

0.25

P

0.05

0

0.10

0.20

0.01

n = 15

X

0.01

0.30

0.40

0.50

0.80

0.90

0.95

0.000 0.000 0.001 0.049

0.60

0.70

0.75

0.99

0.00 0 0.00 2 0.01 2 0.05 5 0.16 6 0.36 7 0.61 8 0.83 3 0.95 4 0.99 4

0.00 0 0.00 0 0.00 2 0.01 1 0.04 7 0.15 0 0.35 0 0.61 7 0.85 1 0.97 2

0.000 0.000

0.000 0.000

0.000

0.000 0.000

0.000 0.000

0.000

0.000 0.000

0.000 0.000

0.000

0.004 0.001

0.000 0.000

0.000

0.020 0.006

0.000 0.000

0.000

0.078 0.033

0.002 0.000

0.000

0.224 0.121

0.013 0.001

0.000

0.474 0.322

0.070 0.012

0.000

0.756 0.624

0.264 0.086

0.004

0.944 0.893

0.651 0.401

0.096

p 0.01

0.05

0.10

0.20

0.25

0.30

0.40

0.50

0.60

0.70

0.75

0.80

0.90

0.95

0.99

0.86 0 0.90 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0

0.46 3 0.82 9 0.96 4 0.99 5 0.99 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0

0.20 6 0.54 9 0.81 6 0.94 4 0.98 7 0.99 8 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0

0.03 5 0.16 7 0.39 8 0.64 8 0.83 6 0.93 9 0.98 2 0.99 6 0.99 9 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0

0.01 3 0.08 0 0.23 6 0.46 1 0.68 6 0.85 2 0.94 3 0.98 3 0.99 6 0.99 9 1.00 0 1.00 0 1.00 0 1.00 0 1.00 0

0.00 5 0.03 5 0.12 7 0.29 7 0.51 5 0.72 2 0.86 9 0.95 0 0.98 5 0.99 6 0.99 9 1.00 0 1.00 0 1.00 0 1.00 0

0.00 0 0.00 5 0.02 7 0.09 1 0.21 7 0.40 2 0.61 0 0.78 7 0.90 5 0.96 6 0.99 1 0.99 8 1.00 0 1.00 0 1.00 0

0.00 0 0.00 0 0.00 4 0.01 8 0.05 9 0.15 1 0.30 4 0.50 0 0.69 6 0.84 9 0.94 1 0.98 2 0.99 6 1.00 0 1.00 0

0.00 0 0.00 0 0.00 0 0.00 2 0.00 9 0.03 4 0.09 5 0.21 3 0.39 0 0.59 7 0.78 3 0.90 9 0.97 3 0.99 5 1.00 0

0.00 0 0.00 0 0.00 0 0.00 0 0.00 1 0.00 4 0.01 5 0.05 0 0.13 1 0.27 8 0.48 5 0.70 3 0.87 3 0.96 5 0.99 5

0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 1 0.00 4 0.01 7 0.05 7 0.14 8 0.31 4 0.53 9 0.76 4 0.92 0 0.98 7

0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 1 0.00 4 0.01 8 0.06 1 0.16 4 0.35 2 0.60 2 0.83 3 0.96 5

0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 2 0.01 3 0.05 6 0.18 4 0.45 1 0.79 4

0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 1 0.00 5 0.03 6 0.17 1 0.53 7

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.010 0.140

Carmen Rosa Barreto Rodríguez 0.01

X

0.10

0.20

0.25

0.30

0.40

0.50

0.60

0.70

0

0.818 0.358

0.122 0.012 0.003

0.001 0.000 0.000 0.000 0.000

1

0.983 0.736

0.392 0.069 0.024

0.008 0.001 0.000 0.000 0.000

2

0.999 0.925

0.677 0.206 0.091

0.035 0.004 0.000 0.000 0.000

3

1.000 0.984

0.867 0.411 0.225

0.107 0.016 0.001 0.000 0.000

4

1.000 0.997

0.957 0.630 0.415

0.238 0.051 0.006 0.000 0.000

5

1.000 1.000

0.989 0.804 0.617

0.416 0.126 0.021 0.002 0.000

6

1.000 1.000

0.998 0.913 0.786

0.608 0.250 0.058 0.006 0.000

7

1.000 1.000

1.000 0.968 0.898

0.772 0.416 0.132 0.021 0.001

8

1.000 1.000

1.000 0.990 0.959

0.887 0.596 0.252 0.057 0.005

9

1.000 1.000

1.000 0.997 0.986

0.952 0.755 0.412 0.128 0.017

10

1.000 1.000

1.000 0.999 0.960

0.983 0.872 0.588 0.245 0.048

11

1.000 1.000

1.000 1.000 0.999

0.995 0.943 0.748 0.404 0.113

12

1.000 1.000

1.000 1.000 1.000

0.999 0.979 0.868 0.584 0.228

13

1.000 1.000

1.000 1.000 1.000

1.000 0.994 0.942 0.750 0.392

14

1.000 1.000

1.000 1.000 1.000

1.000 0.998 0.979 0.874 0.584

15

1.000 1.000

1.000 1.000 1.000

1.000 1.000 0.994 0.949 0.762

16

1.000 1.000

1.000 1.000 1.000

1.000 1.000 0.999 0.984 0.893

17

1.000 1.000

1.000 1.000 1.000

1.000 1.000 1.000 0.996 0.965

18

1.000 1.000

1.000 1.000 1.000

1.000 1.000 1.000 0.999 0.992

19

1.000 1.000

1.000 1.000 1.000

1.000 1.000 1.000 1.000 0.999

0.01

0.10

0.30

n = 25 0

X

0.05

436

0.05

0.20

0.25

0.40

0.50

0.60

0.70

0.75

0.80

0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 0 0.00 1 0.00 4 0.01 4 0.04 1 0.10 2 0.21 4 0.38 3 0.58 5 0.77 5 0.90 9 0.97 6 0.99 7

0.000 0.000 0.000 0.000

0.90

0.95

0.99

0.75

0.80

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.001 0.000 0.000 0.000 0.003 0.000 0.000 0.000 0.010 0.000 0.000 0.000 0.032 0.000 0.000 0.000 0.087 0.002 0.000 0.000 0.196 0.011 0.000 0.000 0.370 0.043 0.003 0.000 0.580 0.133 0.016 0.000 0.794 0.323 0.075 0.001 0.931 0.608 0.264 0.017 0.988 0.878 0.642 0.182

0.90

0.95

0.99

0.778 0.277 0.072 0.004 0.001

0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000

1

0.974 0.642 0.271 0.027 0.007

0.002 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000

2

0.980 0.873 0.537 0.098 0.032

0.009 0.000 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000

3

1.000 0.966 0.764 0.234 0.096

0.033 0.002 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000

4

1.000 0.993 0.902 0.421 0.214

0.090 0.009 0.000 0.000 0.000 0.000 0.000 0.000

0.000 0.000

5

1.000 0.999 0.967 0.617 0.378

0.193 0.029 0.002 0.000 0.000 0.000 0.000 0.000

0.000 0.000

6

1.000 1.000 0.991 0.780 0.561

0.341 0.074 0.007 0.000 0.000 0.000 0.000 0.000

0.000 0.000

7

1.000 1.000 0.998 0.891 0.727

0.512 0.154 0.022 0.001 0.000 0.000 0.000 0.000

0.000 0.000

8

1.000 1.000 1.000 0.953 0.851

0.677 0.274 0.054 0.004 0.000 0.000 0.000 0.000

0.000 0.000

9

1.000 1.000 1.000 0.994 0.929

0.811 0.425 0.115 0.013 0.000 0.000 0.000 0.000

0.000 0.000

10

1.000 1.000 1.000 0.983 0.970

0.902 0.586 0.212 0.034 0.002 0.000 0.000 0.000

0.000 0.000

11

1.000 1.000 1.000 0.994 0.980

0.956 0.732 0.345 0.078 0.006 0.001 0.000 0.000

0.000 0.000

12

1.000 1.000 1.000 0.998 0.997

0.983 0.846 0.500 0.154 0.017 0.003 0.000 0.000

0.000 0.000

13

1.000 1.000 1.000 1.000 0.999

0.994 0.922 0.655 0.268 0.044 0.020 0.002 0.000

0.000 0.000

14

1.000 1.000 1.000 1.000 1.000

0.998 0.966 0.788 0.414 0.098 0.030 0.006 0.000

0.000 0.000

15

1.000 1.000 1.000 1.000 1.000

1.000 0.987 0.885 0.575 0.189 0.071 0.017 0.000

0.000 0.000

16

1.000 1.000 1.000 1.000 1.000

1.000 0.996 0.946 0.726 0.323 0.149 0.047 0.000

0.000 0.000

17

1.000 1.000 1.000 1.000 1.000

1.000 0.999 0.978 0.846 0.488 0.273 0.109 0.002

0.000 0.000

18

1.000 1.000 1.000 1.000 1.000

1.000 1.000 0.993 0.926 0.659 0.439 0.200 0.009

0.000 0.000

19

1.000 1.000 1.000 1.000 1.000

1.000 1.000 0.998 0.971 0.807 0.622 0.383 0.033

0.001 0.000

20

1.000 1.000 1.000 1.000 1.000

1.000 1.000 1.000 0.994 0.910 0.786 0.579 0.098

0.007 0.000

21

1.000 1.000 1.000 1.000 1.000

1.000 1.000 1.000 0.998 0.967 0.904 0.766 0.236

0.034 0.000

22

1.000 1.000 1.000 1.000 1.000

1.000 1.000 1.000 1.000 0.991 0.968 0.902 0.463

0.127 0.002

23

1.000 1.000 1.000 1.000 1.000

1.000 1.000 1.000 1.000 0.980 0.993 0.973 0.729

0.358 0.026

24

1.000 1.000 1.000 1.000 1.000

1.000 1.000 1.000 1.000 1.000 0.999 0.996 0.928

0.723 0.222

Tabla II: Tabla de la Distribución de Poisson Acumulada.

ULADECH

X

.437

.1

.2

0

0.905

1

0.995

2

1.000

0.81 9 0.98 2 0.99 9 1.00 0

3 4

.3

X ____________________ .4

.5

.6

.7

.8

.9

1.0

0.741 0.670

0.607

0.549

0.497

0.449

0.407

0.368

0.963 0.938

0.910

0.878

0.844

0.809

0.772

0.736

0.996 0.992

0.986

0.977

0.966

0.953

0.937

0.920

1.000 0.999

0.998

0.997

0.994

0.991

0.987

0.981

1.000

1.000

1.000

0.999

0.999

0.998

0.996

1.000

1.000

1.000

0.999

5 6

X

1.000 2.0

3.0

4.0

5.0

6.0

7.0

8.0

9.0

10.0

15.0

20.0

0

0.135

0.050

0.018

0.007

0.002

0.001

0.000

0.000

0.000

0.000

0.000

1

0.406

0.199

0.092

0.040

0.017

0.007

0.003

0.001

0.000

0.000

0.000

2

0.677

0.423

0.238

0.125

0.062

0.030

0.014

0.006

0.003

0.000

0.000

3

0.857

0.647

0.433

0.265

0.151

0.082

0.042

0.021

0.010

0.000

0.000

4

0.947

0.815

0.629

0.440

0.285

0.173

0.100

0.055

0.029

0.001

0.000

5

0.983

0.961

0.785

0.616

0.446

0.301

0.191

0.116

0.067

0.003

0.000

6

0.995

0.966

0.889

0.762

0.606

0.450

0.313

0.207

0.130

0.008

0.000

7

0.999

0.988

0.949

0.867

0.744

0.599

0.453

0.324

0.220

0.018

0.001

8

1.000

0.996

0.979

0.932

0.847

0.729

0.593

0.456

0.333

0.037

0.002

9

0.999

0.992

0.968

0.916

0.830

0.717

0.587

0.458

0.070

0.005

10

1.000

0.997

0.986

0.957

0.901

0.816

0.706

0.583

0.118

0.011

11

0.999

0.995

0.980

0.947

0.888

0.803

0.697

0.185

0.021

12

1.000

0.998

0.991

0.973

0.936

0.876

0.792

0.268

0.039

13

0.999

0.996

0.987

0.966

0.926

0.864

0.363

0.066

14

1.000

0.999

0.994

0.983

0.959

0.917

0.466

0.105

15

0.990

0.998

0.992

0.978

0.951

0.568

0.157

16

1.000

0.999

0.996

0.989

0.973

0.664

0.221

1.000

0.998

0.995

0.986

0.749

0.297

18

0.999

0.998

0.993

0.819

0.381

19

1.000

0.999

0.997

0.875

0.470

1.000

0.998

0.917

0.559

21

0.999

0.947

0.644

22

1.000

0.967

0.721

23

0.981

0.787

24

0.989

0.843

25

0.994

0.888

26

0.997

0.922

27

0.998

0.948

28

0.999

0.966

29

1.000

0.978

17

20

30

0.987

31

0.992

32

0.995

33

0.997

34

0.999

35

0.999

36

1.000

Carmen Rosa Barreto Rodríguez

438

000

a w W W W M N W K) K) W _K> M K» _k -k _k _k -A -x _* -» o O O O O O O O O O ¿> Ó ¿3 ¿> Ó Ó O O ¿> O J J -* J-» -* -A -k -A _N> Ñ> JO ro K> N> _N> K> N K» K> ¿> ¿J W ¿í W U U M J O ’(í) 00 Vj o» OI i, ii M o '(f « Vj "o w ík W N O «í 00 ’-«J O» "o< A W M O O ’•* N W ik Üi m » "(O "o ro W A W 'J 00 *(C O ’•* M W ik W OI Vj O) 'jo o *-* M w

O O OOO O O OOOO O O OO OO O OO O OO OO O OOO OO O OOO OO O O OO O O O O O O O poo o o o o o o oo o ooo o o oo o oo bbbb(ob(oio'«(oio'(obbio'(Oub(oio(OUÍ»bcD 00)fcOIWOOW'JWOWO'JinW

oo op oo ooo pop po oooo ooo po op op oppp p ppo pppp oo ppoo ooo pppp p op oo ooo oopo po oooo

0 b

bbbbbbbbbbbbiobbbbbbbbbb«ba^^sin'o)(»uibi(n&ikii.uuuíoNÍo^'>>^libbbbbbbbbbbbbbbbbbbbbb ID(0(CU)lD(ílDU)li)(I)( 001C0»'JS 0'«&WN)OC0tnA-‘l0|JlNI0UlM0JikOI0Ul-‘SbO'JUOCSWW-*(0S(nUlikWMr0JJ-‘OOOOOOOOOOO

i i 5 i c i o ( o c s c o > v j o ) ( fl A r o « ) ( n w M - ‘ f r O ) ( 7 i 6 i O i k o i m w c o - ‘ _ K o w i o - * u u i » a i O ) (n cBo wo cs io - ‘ (nw uw«) www w coK)' Ju octo )i» uK )- i- ‘o ooo

'!UlU^-4K)(nO)VlOOO)ftOlCOU)U)AUIA'J(OIOOlOOOIO>k-kO^SNCOOOK)COWIOOUIU) 01kK)UiaauOl^OlK)-i|OfrOlfrOOUl^UlO)U(OSUlW OOOO00000000000000000000000000000000000OOOOOOopoppppppppppoooopooooooo bbbbbbbbbbbbbbbbioiobbbbóoóocDa^ssbóibinúiiniu^fr'uuuioMro^^aabbbbbbbbbbbbbbbbbbbbbb lDlDU)lDlDC0U)lDlí)(DU)a)t»C 0'JS0)ln^UK)OCB0ltkr0l00)U(0(JIK)03AOI0ül-i'JUOIT)UO'4ülW-íU0>l(nWAWWW-‘-‘-‘OOOOOOOOOOO (0l0(0C0a)NlCnirHkK)l 00>W09N)W'J*J»í0CDC0a)01-*wtK)0JK)WSSC0NWNéi'J-»‘gin0>CíW-*ausftí0(0lk>|a>|WO»J0likWK)-‘-*OOOO 00OU0>0>UfrSKJ 0)030)^K)< 0MfrOi00Oi-kCBOOM(D0iK)Ul0)0)-»C0(0&M&0>WO)‘>l^A'JOK)K)00(0&U&MUa)0)UiU

0 0 «) K '4ViD.aMK)0)'l0I^K)00 )

0000000000000000000000000000000000000000000000000000000000000000000000 Í0bbbbbbbbbbbbbbbbbbbbbb'oonb>iss*alklkl 4bbbbbbbbbbbbbbbbbbbbbb lDICl0U5lDUJl0l0lD(J3U)llJa)a)SM 0)UifcWN)O(fi'lfcf 0(0(JIUO(Jl(v)l 0Ut-‘a)t»OSWIfimWO'JUl(0OID'J 0)UlfrWNM-‘-*OOOOOOOOOOOO (OU)(OIDCOOO>IOIOi^K)OMh)COU) 0>COCO*4UCOOOO)UO)'J-iK)COa)(OOWCOlkMUOl-*(OU)^ 0)U^^UO)-kOIK)IO'>JOissÍJiai(f'wif'&ffcUuk)K)k)N)JJJjbbbbbbbbbbbbbbbbbbbbbb UI({ll0(OlO(OIDIlllOip(O(OCOOO'J^OIUiAUK)OU)SVilO(S*IUO* 4UOOÍ>Oa)UUO)MO'J(>KJOlO'4OIUllkUK)K)-k-‘OOOOOOOOOOOO U)lfU)lDtOW' 10101ilK)0'JUlOW'JU)U)COWlí>IOK)OmiOOOJWOW4.UlO)ik^Uia)Oi»-»U)OUIÍ'JSO*.-*OOK)0100>N)lO'JWftUM -*-*0000 'jmí>iK)C0ÍkSl0lDOlSÍkW0JW(»-i-‘UlN)-i(0UHDCDAültk(X)JftO'"IWIfiW-*C0ÍkO01l0lilUlMU)-gftf0O0»'J0lfcfcWI 0l0-‘-*OOOOOOOOOOOO (0(0(OIOOJO'* 4SO>fcN>0'JfttOfc'iU)OlOO>-kftK4COMWMCOU0100(0(000-*WO)-»>ÍO)'J-iO)»(«OOWOtOOK>«OWMIO-v|w5wN-‘aOOOO ■go)AN(Oiicooooi(0(J){DK)a)fca)U)üiftwwi).u>-*(OWí.K)Coo)05'gci)>ll0r0^&U«>00¿.UU(nNI0CDI0^UII0UI-tl00l0lUK)K}^^OOOO SOlAKXOUKO^-kCD-tlO-kOlWOOlOOlnOlCO^roO^Ui-tfrAUIOOtOIOXO-iA^frOONOIOXOUiOtOCOtONtfrÜltoAOS&UI-klOKXXIIO-tUi-iCaaiAu

0000000000000000000000000000000000000000000000000000000000000000000000 bbbbbbbbbbbbbbbbbbbbbbaba»bssstnaioi(«inikAuuwk)Mkjjl*l*l*^bbbbobbbbbbbobbbbbobob ID(OlOlfi(í)lOlOlOUJ(¡)«)lDaiCOOI'J(7l010t|i(0-»lf'JUlWO'JA-‘OlAO(nM' 4Wr, tfiaCOUlWlDOUkMOW'JUtftUUNJ-i-aOOOOOOOoOOOO (0-‘OACO( 0'Jfc'J«>«>J'JMN)W'/i«'lk-*OroO>M-‘MWOOO'IOJO¿(OüiJCOO)«WrON-i>aOOOO 'MO)VlK) (0(n(ONM(OK)->fr 00001WOIUl09N'JOO>40CDtOI'JOOU»(niO-iWOI>4.JU&OIK)OUOOUOOK)Ulfr>J¿.rOOO)IOOO-kOOOO-iUI-*COOl^U

0 0 vi

000000000000000000000000opooooopopopopopopooooopoooooooooooooooooooooo bbbbiobbbbbbbbbbbbbbbbbbaiaóob^ssbbbúiói^&uwwioMM^^lilk^bbbbbbbbbbbbbbbbbbbbbb (i)U)U)iDii)U)u)U)(D(ciíioM03CO'j(n(nwikw-*(Ocouiw-‘Cow-‘C06-‘'jwmwo)ui-‘OiA-icsa)í.-»ocoo)ü'i»wwfo-*^aoooooooooooo lC(I)(D(OU 5Cna3S(TIWW-*(»ül-i(Tlli)KJWK) 0(J)(0-*U)010K)-‘U5fCOO-‘^0)COIOK)Ul-*a)SU)WO(DOWlOSCn>JOU03U-*COO)6WK)K )-»-»0000 SO)OlUOO)OWW-*ÜU>JAN)-itOWUllOO)K)SOIÍÜ' 01W'JO^OWÜlO-iO)SOO)OWSAW-‘OWCOi»-»(fW-»U)COO)WSOHD'JSOÜOSOiíiW

p

u)(íifibbbbbbbbbbbbbbbbbbbbcoÓ 3Co»S'Jso>biff>inwik^wuwNNfo^l*jjibbbbbbbbbbbbbbbbbbbbbbb (fU)U)(D(D(flOU)U)(í;U)(OCoaCO'J'Jf)ülfcWJOCO(JlUJCOWN)»ül-‘'JW 01K)a)ik-‘S|k-*COO)U->UMÍO-‘-*JOOOOOOOOOOOO J-‘WK)OOWW^N'lJftWWftikWOONS»ftO»a'J'JOOWOOWWOIU)WOOA-i>COO>ikWNJJ -‘0000 «'JWU001-‘fcikfOffl(nO'i>('IO)WWJIO'JülO-*IOUWlOik( 0'JJW(íarJiOyaoiJO)S-‘(DOülW-‘lfiOl'JAWUUOfr&eoOIO)«HiO'JWWNJ

03

1 1 600

p pppp pp ppp pp ppp pp pp ppp pp ppp pp ppp pp pppp p pppp pop op pppp pp po ooo ooooo ooo ooo

b

ULADECH

.439

Carmen Rosa Barreto Rodríguez

440

ULADECH

.441

Carmen Rosa Barreto Rodríguez

442

ULADECH

.443

Carmen Rosa Barreto Rodríguez

444

ULADECH

.445

Carmen Rosa Barreto Rodríguez

446

ULADECH

.447

z

0

1

2

3

4

5

6

7

8

9

0.0 0.1

0.0000 0.0797

0.0080 0.0876

0.0160 0.0955

0.0239 0.1034

0.0319 0.1113

0.0399 0.1192

0.0478 0.1271

0.0558 0.1350

0.0638 0.1428

0.0717 0.1507

0.2

0.1585

0.1663

0.1741

0.1819

0.1897

0.1974

0.2051

0.2128

0.2205

0.2282

0.3

0.2358

0.2434

0.2510

0.2586

0.2661

0.2737

0.2812

0.2886

0.2961

0.3035

0.4

0.3108

0.3182

0.3255

0.3328

0.3401

0.3473

0.3545

0.3616

0.3688

0.3759

0.5

0.3829

0.3899

0.3969

0.4039

0.4108

0.4177

0.4245

0.4313

0.4381

0.4448

0.6

0.4515

0.4581

0.4647

0.4713

0.4778

0.4843

0.4907

0.4971

0.5035

0.5098

0.7

0.5161

0.5223

0.5285

0.5346

0.5407

0.5467

0.5527

0.5587

0.5646

0.5705

0.8

0.5763

0.5821

0.5878

0.5935

0.5991

0.6047

0.6102

0.6157

0.6211

0.6265

0.9

0.6319

0.6372

0.6424

0.6476

0.6528

0.6579

0.6629

0.6680

0.6729

0.6778

1.0

0.6827

0.6875

0.6923

0.6970

0.7017

0.7063

0.7109

0.7154

0.7199

0.7243

1.1

0.7287

0.7330

0.7373

0.7415

0.7457

0.7499

0.7540

0.7580

0.7620

0.7660

1.2

0.7699

0.7737

0.7775

0.7813

0.7850

0.7887

0.7923

0.7959

0.7995

0.8029

1.3

0.8064

0.8098

0.8132

0.8165

0.8198

0.8230

0.8262

0.8293

0.8324

0.8355

1.4

0.8385

0.8415

0.8444

0.8473

0.8501

0.8529

0.8557

0.8584

0.8611

0.8638

1.5

0.8664

0.8690

0.8715

0.8740

0.8764

0.8789

0.8812

0.8836

0.8859

0.8882

1.6

0.8904

0.8926

0.8948

0.8969

0.8990

0.9011

0.9031

0.9051

0.9070

0.9090

1.7

0.9109

0.9127

0.9146

0.9164

0.9181

0.9199

0.9216

0.9233

0.9249

0.9265

1.8

0.9281

0.9297

0.9312

0.9328

0.9342

0.9357

0.9371

0.9385

0.9399

0.9412

1.9

0.9426

0.9439

0.9451

0.9464

09476

0.9488

0.9500

0.9512

0.9523

0.9534

2.0

0.9545

0.9556

0.9566

0.9576

0.9586

0.9596

0.9606

0.9615

0.9625

0.9634

2.1

0.9643

0.9651

0.9660

0.9668

0.9676

0.9684

0.9692

0.9700

0.9707

0.9715

2.2

0.9722

0.9729

0.9736

0.9743

0.9749

0.9756

0.9762

0.9768

0.9774

0.9780

2.3

0.9786

0.9791

0.9797

0.9802

0.9807

0.9812

0.9817

0.9822

0.9827

0.9832

2.4

0.9836

0.9840

0.9845

0.9849

0.9853

0.9857

0.9861

0.9865

0.9869

0.9872

2.5

0.9876

0.9879

0.9883

0.9886

0.9889

0.9892

0.9895

0.9898

0.9901

0.9904

2.6

0.9907

0.9909

0.9912

0.9915

0.9917

0.9920

0.9922

0.9924

0.9926

0.9929

2.7

0.9931

0.9933

0.9935

0.9937

0.9939

0.9940

0.9942

0.9944

0.9946

0.9947

2.8

0.9949

0.9950

0.9952

0.9953

0.9955

0.9956

0.9958

0.9959

0.9960

0.9961

2.9

0.9963

0.9964

0.9965

0.9966

0.9967

0.9968

0.9969

0.9970

0.9971

0.9972

3.0

0.9973

0.9974

0.9975

0.9976

0.9976

0.9977

0.9978

0.9979

0.9979

0.9980

3.1

0.9981

0.9981

0.9982

0.9983

0.9983

0.9984

0.9984

0.9985

0.9985

0.9986

3.2

0.9986

0.9987

0.9987

0.9988

0.9988

0.9988

0.9989

0.9989

0.9990

0.9990

3.3

0.9990

0.9991

0.9991

0.9991

0.9992

0.9992

0.9992

0.9992

0.9993

0.9993

3.4

0.9993

0.9994

0.9994

0.9994

0.9994

0.9994

0.9995

0.9995

0.9995

0.9995

TABLA IV: Tabla de la Distribución Central Normal Estándar - Valor Crítico Z ^ 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 a 1-a Z

,_ a 2

0.0005

0.90

0.95

0.975

0.99

0.995

0.9975

0.999

0.9995

1.645

1.960

2.241

2.576

2.807

3.023

3.291

3.481

Carmen Rosa Barreto Rodríguez

448

TABLA V:ULADECH Tabla de la Distribución T Student con v Grados de Libertad Valor

.449

Crítico t i-a.u

a

0.10

0.05

0.025

0.01

0.005

1-a

0.90

0.95

0.975

0.99

0.995

0.001

63.66 9.925

0.002 5 0.997 5 10.99 75

U

*0.90

to. 95

to.975

10.99

10.995

1 2

3.078 1.886

6.314 2.920

12.71 4.303

31.82 6.965

127.3 14.02

318.3 22.33

3

1.638

2.353

3.182

4

1.533

2.132

2.776

4.541

5.841

7.453

10.21

3.747

4.604

5.598

5

1.476

2.015

7.173

2.571

3.365

4.032

4.773

6

1.440

5.893

1.943

2.447

3.143

3.707

4.317

7

5.208

1.415

1.895

2.365

2.998

3.499

4.029

4.785

8

1.397

1.860

2.306

2.896

3.355

3.833

4.501

9

1.383

1.833

2.262

2.821

3.250

3.690

4.297

10

1.372

1.812

2.228

2.764

3.169

3.581

4.144

11

1.363

1.796

2.201

2.718

3.106

3.497

4.025

12

1.356

1.782

2.179

2.681

3.055

3.428

3.930

13 _

1.350

1.771

2.160

2.650

3.012

3.372

3.852

14

1.345

1.761

2.145

2.624

2.977

3.326

3.787

15

1.341

1.753

2.131

2.602

2.947

3.286

3.733

16

1.337

1.746

2.120

2.583

2.921

3.252

3.686

17

1.333

1.740

2.110

2.567

2.898

3.222

3.646

18

1.330

1.734

2.101

2.552

2.878

3.197

3.610

19

1.328

1.729

2.093

2.539

2.861

3.174

3.579

20

1.325

1.725

2.086

2.528

2.845

3.153

3.552

21

1.323

1.721

2.080

2.518

2.831

3.135

3.527

22

1.321

1.717

2.074

2.508

2.819

3.119

3.505

23

1.319

1.714

2.069

2.500

2.807

3.104

3.485

24

1.318

1.711

2.064

2.492

2.797

3.091

3.467

25

1.316

1.708

2.060

2.485

2.787

3.078

3.450

26

1.315

1.706

2.056

2.479

2.779

3.067

3.435

27

1.314

1.703

2.052

2.473

2.771

3.057

3.421

28

1.313

1.701

2.048

2.467

2.763

3.047

3.408

29

1.311

1.699

2.045

2.462

2.756

3.038

3.396

30

1.310

1.697

2.042

2.457

2.750

3.030

3.385

40

1.303

1.684

2.021

2.423

2.704

2.971

3.307

50

1.299

1.676

2.009

2.403

2.678

2.937

3.261

60

1.296

1.671

2.000

2.390

2.660

2.915

3.232

70

1.294

1.667

1.994

2.381

2.648

2.899

3.211

80

1.292

1.664

1.990

2.374

2.639

2.887

3.195

90

1.291

1.662

1.987

2.368

2.632

2.878

3.183

100

1.290

1.660

1.984

2.364

2.626

2.871

3.174

200

1.286

1.653

1.972

2.345

2.601

2.838

3.131

500

1.283

1.648

1.965

2.334

2.586

2.820

3.107

co

1.282

1.645

1.960

2.326

2.576

2.807

3.090

0.999 10.999

TABLA VI: Tabla de la Distribución T Student con v Grados de Carmen Barreto Libertad Valor Rosa Crítico [i.a,2.uRodríguez

0.10

0.05

0.02

0.01

0.005

0.002

0.001

l — a

0.90

0.95

0.98

0.99

0.995

0.998

0.999

u

to. 95

to.975

^ 0.99

10.995

to.9975

to.999

to.9995

1

6.314

12.71

31.82

63.66

127.3

318.3

636.6

2

2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782

4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060

6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552

9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807

22.33 10.21 7.173 5.893 5.208 4.785 4.501 4.297 4.144

2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.678 2.660 2.648 2.639 2.632

14.09 7.453 5.598 4.773 4.317 4.029 3.833 3.690 3.581 3.497 3.428 3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.135 3.119 3.104 3.091 3.078 3.067 3.057 3.047 3.038 3.030 2.971 2.937 2.915 2.899 2.887 2.878

2.626

2.871

3.174

2.601

2.838

3.131

2.586 2.576

2.820 2.807

3.107 3.090

31.60 12.92 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 3.850 3.819 3.792 3.768 3.745 3.725 3.707 3.690 3.674 3.659 3.646 3.551 3.496 3.460 3.435 3.416 3.402 3.390 3.340 3.310 3.291

a

3

4 5 6

7 8 9 10 11 12 13

1.771

14

1.761 1.753 1.746 1.740 1.734

15 16 17

18 19 20 21 22 23

24 25 26 27 28 29 30 40 50 60 70 80 90 100 200

1.729

1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.676

2.056 2.052

1.667 1.664 1.662

2.048 2.045 2.042 2.021 2.009 2.000 1.994 1.990 1.987

1.660

1.984

1.653

1.972

1.671

500

1.648

1.965

00

1.645

1.960

2.539

2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.403 2.390 2.381 2.374 2.368 2.364 2.345 2.334 2.326

2.797

4.025

3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.385 3.307 3.261 3.232 3.211 3.195 3.183

450

TABLA VII: Tabla de la Distribución Chi Cuadrado con ü grados de libertad Valor Crítico X^.a u

u

X2 A

X2

0.99

X2 A

0.975

X2

* 0.95

X2

0.90

X2 0.75

X2

X2

A

A

0.50

0.25

X2 0.10

X2

0.05

X2 A

X2 0.01

X2

0.005

1

0.995 7.88

6.64

5.02

3.84

2.71

1.32

0.455

0.102 0.0158 0.0039

2

10.60

9.21

7.38

5.99

4.61

2.77

1.39

0.575

0.211

0.103

3

12.84

11.35

9.35

7.81

6.25

4.11

2.37

1.21

0.584

0.352

0.025 0.001 0.0002 0 0.050 0.0201 6 0.216 0.115

4

14.84

13.28

11.14

9.49

7.78

5.39

3.36

1.92

1.06

0.711

0.484

0.297

0.207

5

16.75

15.09

12.83

11.07

9.24

6.63

4.35

2.67

1.61

1.15

0.831

0.554

0.412

6

18.55

16.81

14.45

12.59

10.65

7.84

5.35

3.45

2.20

1.64

1.24

0.872

0.676

7

20.28

18.48

16.01

14.07

12.02

9.04

6.35

4.25

2.83

2.17

1.69

1.24

0.989

8

21.96

20.09

17.54

15.51

13.36

10.22

7.34

5.07

3.49

2.73

2.18

1.65

1.34

9

23.59

21.67

19.02

16.92

14.68

11.39

8.34

5.90

4.17

3.33

2.70

2.09

1.73

10

25.19

23.21

20 48

18.31

15.99

12.55

9.34

6.74

4.87

3.94

3.25

2.56

2.16

11

26.76

24.73

21.92

19.68

17.28

13.70

10.34

7.58

5.58

4.57

3.82

3.05

2.60

12

28.30

26.22

23.34

21.03

18.55

14.85

11.34

8.44

6.30

5.23

4.40

3.57

3.07

13

29.82

27.69

24.74

22.36

19.81

15.98

12.34

9.30

7.04

5.89

5.01

4.11

3.57

14

31.32

29.14

26.12

23.69

21.06

17.12

13.34

10.17

7.79

6.57

5.63

4.66

4.07

15

32.80

30.58

27.49

25.00

22.31

18.25

14.34

11.04

8.55

7.26

6.26

5.23

4.60

16

34.27

32.00

28.85

26.30

23.54

19.37

15.34

11.91

9.31

7.96

6.91

5.81

5.14

17

35.72

33.41

30.19

27.59

24.78

20.48

16.34

12.79

10.09

8.67

7.56

6.41

5.70

18

37.16

34.81

31.53

28.87

25.99

21.61

17.34

13.68

10.87

9.39

8.23

7.01

6.26

19

38.58

36.19

32.85

30.14

27.20

22.72

18.34

14.56

11.65

10.12

8.91

7.63

6.84

20

40.00

37.57

34.17

31.41

28.41

23.83

19.34

15.45

12.44

10.85

9.59

8.26

7.43

21

41.40

38.93

35.48

32.67

29.62

24.94

20.34

16.34

13.24

11.59

10.28

8.90

8.03

22

42.80

40.29

36.78

33.92

30.81

26.04

21.34

17.24

14.04

12.34

10.98

9.54

8.64

23

44.18

41.64

38.08

35.17

32.01

27.14

22.34

18.14

14.85

13.09

11.69

10.20

9.26

24

45.56

42.98

39.36

36.42

33.20

28.24

23.34

19.04

15.66

13.85

12.40

10.86

9.89

25

46.93

44.31

40.65

37.65

34.38

29.34

24.34

19.94

16.47

14.61

13.12

11.52

10.52

26

48.29

45.64

41.92

38.89

35.56

30.44

25.34

20.84

17.29

15.38

13.84

12.20

11.16

27

49.64

46.96

43.19

40.11

36.74

31.53

26.34

21.75

18.11

16.15

14.57

12.88

11.81

28

50.99

48.28

44.46

41.34

37.92

32.62

27.34

22.66

18.94

16.93

15.31

13.57

12.46

29

52.34

49.59

45.72

42.56

39.09

33.71

28.34

23.57

19.77

17.71

16.05

14.26

13.12

30

53.67

50.89

46.98

43.78

40.26

34.80

29.34

24.48

20.60

18.49

16.79

14.95

13.79

40

66.77

63.69

59.34

55.76

51.81

45.62

39.34

33.66

29.05

26.51

24.43

22.16

20.71

50

79.49

76.15

71.42

67.50

63.17

56.33

49.34

42.94

37.69

34.76

32.36

29.71

27.99

60

91.95

88.38

83.30

79.08

74.40

67.00

59.34

52.29

46.46

43.19

40.48

37.48

35.54

70

104.2 0 166.3 0 128.3 0 140.2 0

100.4 0 112.3 0 124.1 0 135.8 0

95.02

90.53

85.53

77.58

69.34

61.70

55.33

51.74

48.76

45.44

43.28

106.6 0 118.1 0 129.6 0

101.9 0 113.1 0 124.3 0

96.58

88.13

79.34

71.14

64.28

60.39

57.15

53.54

51.17

107.6 0 118.5 0

98.65

89.34

80.62

73.29

69.13

65.65

61.75

59.20

109.1 4

99.34

90.13

82.36

77.93

74.22

70.06

67.33

80 90 100

BIBLIOGRAFÍA

0.000 0.010 0.072

1. ÁVILA ACOSTA, Roberto. 2001. Estadística Elemental. Edit. Estudies y Ediciones R.A. Lima - Perú. 2. CÓRDOVA ZAMORA, Manuel. 2002. Estadística Inferencial. Edit. Moshera S.R.L. 2da. Edición. Lima - Perú. 3. CÓRDOVA ZAMORA, Manuel. 2000. Estadística Descriptiva y Aplicaciones. 4ta. Edición. Lima - Perú. 4. COMPENDIO 2003. Sistema Nacional de Estadística. 5. DEVORE, Jay L. 2001. Probabilidad y Estadística para Ingeniería y Ciencias. 5ta. Edición. Edit. Litográfica Ingramex. S.A. 6. GARCÍA ORE, Celestino. 1997. Distribuciones y Estadística Inferencial. Edit. Princeliness E.IR.L. 1ra. Edición. Lima - Perú. 7. GENE V. Glass, JULIAN C. Stanley. 1986. Métodos Estadísticos Aplicados a las Ciencias Sociales. Edit. Prentice Haría. México 8. HERNANDEZ SAMPIERI y otros. 2003. Metodología de la Investigación. Edit. MacGraw Hill Interamericana Editores. México. 9. SIERRA BRAVO, Restituto. 1991. Diccionario Práctico de Estadística y Técnicas de la Investigación Científica. Edit. Paraninfo. Madrid. 10. TORRES BARDALES, C. 2000. Orientaciones Básicas de Metodología de la Investigación Científica. Edit. Libros y Publicaciones. 7ma. Edición. Lima - Perú. 11. WEBSTER Alien, L. 2000. Estadística Aplicada a los Negocios y Economía. Edit. Me. Graw Hill. 3ra. Edición. Santa Fe. Bogotá Colombia.

BANCO DE PREGUNTAS ESTADÍSTICA 1. a) b) c) d)

Identifique cada una de las siguientes variables según su clasificación: Tiempo de servicio en años. Expectativas laborales. Tamaño de las empresas. N° de ofertas laborales.

a) b) c) d)

Rpta.: Variable cuantitativa continua Variable cualitativa nominal. Variable cualitativa ordinal. Variable cuantitativa discreta. 2. Identificar la unidad de observación y la variable de estudio en el siguiente enunciado: Población de ingenieros civiles según sus ingresos en soles: Unidad de observación:............................................................................................... Variable:..............................................................................................

a) b) c) d)

Selecciona una respuesta: Unidad de observación: Ingenieros - Variable en estudio: sueldo en soles. Unidad de observación: Ingenieros - Variable en estudio: Ingresos en dólares. Unidad de observación: Ingenieros civiles - Variable en estudio: Ingresos en soles. n.a. Rpta. c

3. Una variable cuantitativa discreta se caracteriza porque sus valores a tomar son contables. a) Verdadero b) Falso Rpta. a 4. Los siguientes datos corresponden a una muestra aleatoria de 40 egresados de la ULADECH CATÓLICA de la ciudad de Chimbote según su número de ofertas laborales laborales en el año 2011: 2 5 3 3 2 4 1 2 2 3

a) b) i) ii) iii)

3

3

3

4

5

3

2

4

3

3

4

4

4

4

2

3

2

3

3

4

5

1

5

5

2

2

3

1

4

2

La información fue obtenida mediante una encuesta realizada por Gerencia de Gestión de Calidad. Conteste las siguientes preguntas: ¿Cuántos egresados han tenido 3 ofertas laborales o menos? ¿Qué porcentaje de egresados han tenido 4 ofertas laborales o más? Respuestas: 16, 35% 35 y 26% 26 y 35%

iv) n.a. Rpta. iii

0 0 0 1

[1400 - 1800)

o 0 4 1

5. El Director Ejecutivo del Hospital La Caleta Chimbóte, tiene que presentar un informe descriptivo sobre el sueldo de los trabajadores de dicho hospital para tomar decisiones sobre pedidos constantes de aumento de sueldo, por el tiempo de servicio que tienen en el hospital y la profesionalización adquirida. Ayude al Director Ejecutivo del Hospital La Caleta de Chimbote a preparar el informe descriptivo calculando las medidas de tendencia central: media, mediana y moda, de acuerdo a la distribución adjunta a continuación: N° de trabajadores Sueldo mensual en soles LI - LS 10 80

[1800 - 2200)

120

[2200 - 2600)

80

[ 2600 - 3000)

10

Total

300

Seleccione una respuesta: a) i) Media= S/.2500 ii) Mediana=S/1900 iii) Moda=S/. 2000 b) i) Media= S/.2000 ii) Mediana=S/. 2000 iii) Moda=S/. 2000 c) i) Media= S/. 1900 ii) Mediana=S/1900 iii) Moda=S/. 1900 d) n.a. Rpta: c 6) El gerente de una empresa analiza las ventas mensuales en dólares de sus promotores en los últimos 6 meses y decidirá contratarlos para los próximos 6 meses siguientes si sus ventas son regulares, las cuales se dan a continuación: X¡: 5000, 4500, 4800, 4600, 6000 i) Calcular la medida de dispersión adecuada para dar respuesta a ii) ii) ¿Qué decisión tomara el gerente? Seleccione una: a) i) s=601.66 dólares. ii) El gerente decidirá contratar los promotores para los próximos meses. b) i) v(x)=362,000. ii) El gerente decidirá no contratar los promotores para los próximos meses. c) i) cv=12.08%. ii) El gerente decidirá contratar los promotores para los próximos meses. d) n.a. Rpta. c 7. En estadística una muestra es una pequeña parte de la población seleccionada al azar mediante un método de muestreo. a) Verdadero b) Falso Rpta.: a 8. El coeficiente de variación es una medida de dispersión relativa exenta de unidades y expresada en porcentaje. a) Verdadero b) Falso Rpta.: a

9. La fuente es lugar, institución o persona de donde se obtienen las variables. Seleccione una respuesta: a) Verdadero b) Falso Rpta.: b

i) ii) iii) iv) a)

10. Los datos de la variable tipos de violencia familiar: Violencia física, violencia sexual y violencia emocional, se deben graficar a través de: polígono de frecuencias gráfico de sectores circulares gráfico lineal n.a. Seleccione una respuesta: i b) ii c) iii d) iv Rpta.: b

BANCO DE PREGUNTAS ESTADÍSTICA APLICADA - ESTADÍSTICA INFERENCIAL BIOESTADÍSTICA 1. Utilizar cálculo directo a) P(Z < 2.65)

Si X-------------> n(0,1), hallar: b) P(Z < 5.20)

c) P(Z < -1.36)

d) P(-1.65 < Z < 1.65) Rpta.: a) 0.996 b) 0

c) 0.0869 d) 0.9011

2. El nivel de significancia es es el error que se comete cuando el investigador no acepta la hipótesis nula siendo ésta verdadera en la población. a) Verdadero b) Falso Rpta.: a 3. a) b) c) d)

Una suposición básica de todas las estadísticas inferenciales es la siguiente: la(s) muestra (s) deben ser seleccionados al azar las mediciones deben estar en una escala de intervalo tamaño de la muestra debe ser mayor que 30 la hipótesis nula es verdadera

Rpta.: d 4. Un tipo de hipótesis nula es una hipótesis: a) experimental que no implica pruebas empíricas b) estadística que asume que existen diferencias de varios tamaños entre los efectos de diferentes tratamientos. c) experimental que ha sido declarada incompatible con los datos empíricos. d) estadística que indica que no hay diferencias entre los efectos de los tratamientos. Rpta.: d 5. Si la hipótesis nula es rechazada: a) la hipótesis de investigación es rechazada c) la hipótesis de investigación es aceptada c) los resultados de la investigación no pueden ser interpretados d) la hipótesis de investigación se ha demostrado Rpta.: c

6. El intervalo de confianza para un determinado parámetro es calculado a través de una muestra aleatoria de la población. a) Verdadero b) Falso Rpta.: a

a) b) c) d)

7. El establecimiento de un intervalo de confianza del 95% permite que un investigador indique los valores que abarcan: todos menos el 95% de las puntuaciones de la muestra el 95% de las puntuaciones de la muestra el 95% de los parámetros de la población los parámetros de la población en un 95% de estos casos Rpta.: b

8. a) b) c) d)

El propósito de un intervalo de confianza es el de: determinar si una relación es de importancia práctica. evaluar la validez de las puntuaciones. el rango de puntuaciones de la muestra. establecer los límites de los parámetros de la población. Rpta: d

9. a) b) c) d)

La magnitud del error de muestreo de una media depende de: el tamaño de la media de la muestra y el tamaño de la muestra tamaño de la muestra y la propagación de la muestra propagación de la muestra y la magnitud de la media el tamaño de la media de la población y tamaño de la muestra Rpta.: d

10. El propósito de la estadística inferencial es la siguiente para: a) describir los resultados de un estudio. b) comprobar si los resultados apoyan la hipótesis de la investigación. c) permitir inferencias de resulta dos de la muestra a una población. d) verificar la exactitud de la estadística descriptiva. Rpta.: c

GUÍA DIDÁCTICA

GUIA DIDACTICA ASIGNATURA ESTADISTICA

GUIA DIDACTICA

índice 1. Presentación de la Guía Didáctica 2. Presentación del Equipo Docente 3. Introducción a la Asignatura 4. Requisitos previos 5. Estrategias para el aprendizaje 5.1 Orientaciones para el Aprendizaje 5.2 Orientaciones para la tutoría 5.3 Medios y Materiales 6. Evaluación / instrumentos de evaluación

1. Presentación de la Guía Didáctica Estimado estudiante: Bienvenido a la Guía Didáctica de la asignatura de Estadística: El presente apartado busca orientarlo en la propia estructura de la Guía Didáctica, el cual le ayudará a conocer, estructurar y organizar su aprendizaje en el tiempo, según los requerimientos propios de la asignatura. La Guía Didáctica tiene las siguientes partes: • •

• • • -

•

Presentación de la Guía Didáctica: Busca orientarlo en la propia estructura de la Guía Didáctica. Presentación del Equipo Docente: Señala al docente que han elaborado la Guía y Unidades Didácticas de la asignatura, indicando su experiencias profesionales al respecto. Introducción a la Asignatura: Explica el sentido de la asignatura y su importancia en su formación docente y futuro desempeño profesional. Requisitos previos: Indica las asignaturas que son pre requisitos que serán necesarios en el desarrollo del aprendizaje. Estrategias para el aprendizaje: Señala la estrategia metodológica a utilizar en la asignatura. Orientaciones para el Aprendizaje: Orienta al estudiante durante cada semana de estudio, para el logro del aprendizaje. Orientaciones para la tutoría: Indica la función de las tutorías presenciales, síncronas y asíncronas de la asignatura. Medios y Materiales: Señala los medios físicos y virtuales así como los materiales a utilizar en la asignatura. Evaluación / instrumentos de evaluación: Señala los criterios de evaluación por unidad didáctica y los instrumentos a utilizar.

GUIA DIDACTICA

2. Presentación del Equipo Docente La docente que ha laborado la Guía y Unidades Didácticas y responsable de la implementación de la Asignatura, es Carmen Rosa Barreto Rodríguez quién es Lic. en Estadística por la Universidad Nacional de Trujillo, Mg. En Ciencias con Mención en Docencia Universitaria e Investigación Educativa y en la actualidad se encuentra cursando estudios de Doctorado en la Universidad Nacional del Santa. Carmen Rosa Barreto Rodríguez se ha desempeñado como Docente Auxiliar de la Universidad Nacional del Santa en las asignaturas de Estadística, Estadística Aplicada y Probabilidad y Estadística, y en la actualidad es Docente Ordinario - Categoría Asociado de la Universidad Católica Los Ángeles de Chimbote adscrita a la Escuela de Ingeniería de Sistemas de y es Docente Titular de las asignaturas de Estadística, Estadística Aplicada, Estadística Aplicada a la Educación, Estadística Inferencial y Bioestadística en la modalidad presencial y a distancia. Es autora de los libros Estadística Básica - Aplicaciones y Series de Tiempo y Números Índices.

Para comunicarse con el docente, podrá realizarlo a través de su correo electrónico [email protected].

3. Introducción a la Asignatura La asignatura busca que usted:

Aplique los conceptos y técnicas de estadística para el análisis y toma de decisiones adecuadas de situaciones reales en su entorno profesional.__________ La asignatura se organiza en tres (3) unidades de aprendizaje y se desarrollará con el Texto de Estadística Básica - Aplicaciones, las cuales puede observar a continuación:

4 6 1

Unidad Objetivo Didáctic Especifico/ a Competencia

Temas Ejes

I Unidad Presentar e interpretar información estadística mediante distribuciones de frecuencias y gráficos estadísticos

II unidad

Calcular interpretar medidas tendencia central de conjunto datos observados

Semana de Resumen Estudio

Páginas de texto “Estadística Básica25 - 47 Estadística. 1 ° 2° 3° 4° Elaboración e Aplicaciones” Términos de 5°-6° interpretan de estadística. semana distribuciones Recolección de frecuencias de datos para un conjunto de Distribucion datos es de observados. frecuencias Gráficos Elaboración e estadísticos interpretan de gráficos estadísticos para un conjunto de datos observados.

e La media aritmética de un de

La mediana

La moda

7°-8°-9°- Cálculo e 10° interpretación semana de la media aritmética, mediana y moda de un conjunto de datos observados.

53 - 67

GUIA DIDACTICA

conjunto de datos observados

Medidas asimetrí a

de

Medidas forma

de

11°-12°-

semana

o

de

Cálculo e interpretació n las de medidas de dispersión, medidas de asimetría y medidas de cúrtosis de un conjunto de datos.

7 7 7 7

n u e d a m r

r fo

III Unidad

Medias dispersi ón

i 3

Calcular e interpretar medidas de dispersión y de

La primera unidad desarrolla las técnicas estadísticas básicas para la elaboración de distribuciones de frecuencias y gráficos de un conjunto de datos recolectados. La segunda unidad desarrolla los procedimientos estadísticos básicos para el cálculo e interpretación de la media aritmética, mediana y moda de un conjunto de datos observados. La tercera unidad desarrolla los procedimientos estadísticos básicos para el cálculo e interpretación de las medidas de dispersión, medidas de asimetría y cúrtosis.

Para el desarrollo de las unidades en mención se utilizará el Texto de "Estadística Básica - Aplicaciones” como medio didáctico para orientar y guiar el aprendizaje el cual ilustra los técnicas estadísticas y procedimientos que permitirán el desarrollo de los contenidos dados en el Silabo Plan de Aprendizaje de Estadística,

4 6 3

Bienvenidos a la asignatura de Estadística Aplicada.

4. Requisitos Previos La asignatura exige haber aprobado la asignatura de Matemática y Lógica (Contabilidad, Administración, Administración Turística y Derecho) o Matemática para Educadores (Educación), del I Ciclo de estudio.

5. Estrategias para el Aprendizaje

La estrategia para el aprendizaje se centra en el aprendizaje significativo y colaborativo con una comprensión de la realidad integral mediada por el mundo. Para el logro del aprendizaje se ofrecerá casos para resolver, de tal manera que favorezca el desarrollo de las actividades y de la investigación propia de la asignatura. Se articulará la estrategia del aprendizaje con el Modelo Didáctico de la ULADECH Católica, el cual se grafica a continuación:

4 6 4

GUIA DIDACTICA

El Modelo Didáctico se ha planificado en el tiempo, según el siguiente gráfico:

Semanas de Estudio 1

2

3 4 UNIDAD I

5.1

5

6

7

8 9 UNIDAD II

10

11

12 13 14 UNIDAD III

15

Orientaciones para el Aprendizaje

A continuación se detalla las orientaciones del aprendizaje por semana de estudio utilizando el Texto de Estadística Básica-Aplicaciones:

4 6 5

Unidad Didáctic a

Objetivo Especifico/ Competencia

I Unidad

Presentar e interpretar información estadística mediante distribuciones de frecuencias y gráficos estadísticos

Temas Ejes

Semana de Resumen Estudio

Páginas de texto “Estadístic a BásicaAplicacione Estadística. 1 ° 2° 3° 4° Inicie analizando s 25 - 47 Términos de 5°-6° el SPA (sílabo y estadística. semana Planes de Recolección Aprendizaje) de datos ingresando al EVA Pregrado (campus virtual). Elabore e intérprete de distribuciones de frecuencias y gráficos estadísticos para un conjunto de datos observados. Participe en la tutoría asincrona de la 1° semana de estudio a través del foro, que se encuentra en el campus virtual. Distribucion es de frecuencias

Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 3° semana de estudio.

4 6 6

Gráficos estadísticos

GUIA DIDACTICA

semana de estudio a través del campus virtual. Desarrolle la actividadde investigación formativa 01 y preséntela la4° semana de estudio a travésdel campus virtual. Participe del foro de responsabilidad social 01 en la 4° semana de estudio a través del campus virtual. Participe en la tutoría presencial de la 4° semana de estudio. Participe en la tutoría asíncrona de la 5° semana de estudio a través del foro, que se encuentra en el campus virtual. Desarrolle el trabajo de aplicación sobre gráficos estadísticos y preséntelo la 6° semana de estudio a través del campus virtual. Participe del examen en línea de la primera unidad en la 6° semana de estudio a través del campus virtual

4 6 7

II unidad Calcular e e La media 7°-8°-9°- Calcule interprete la interpretar 10° aritmética medidas de semana media aritmética, mediana y moda. tendencia central de un conjunto de Participe en la datos observados tutoría síncrona a través del chat que se encuentra La mediana

en el campus virtual, en la 7° semana de estudio.

La moda

Desarrolle el trabajo de aplicación sobre la media aritmética y preséntelo en la 7° semana de estudio a través del campus virtual.

53 - 67

Participe en la tutoría presencial de la 8° semana de estudio. Desarrolle la actividad de investigación formativa 02 y preséntela la 8° semana de estudio a través del campus virtual. Participe del foro de responsabilidad social 02 en la 8° semana de estudio a través del campus virtual. Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 9°

46 8

Desarrolle el trabajo de aplicación sobre la mediana y GUÍAen la 10° moda semana DIDÁCTICAde estudio y preséntelo a través del campus virtual.

III Unidad

Medidas forma

de

7 8 i 7 7

Calcular e Medias de 11°-12°interpretar dispersión 13°-14°medidas de 15° dispersión y de semana forma de un Medidas de conjunto de datos asimetría observados

Participe del examen en línea de la unidad 02 en la 10° semana de estudio a Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 11° semana de estudio. Desarrolle el trabajo de aplicación sobre medidas de dispersión y preséntelo en la 11° semana de estudio a través del campus virtual.

Participe en la tutoría presencial de la 12° semana de estudio. Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 13° semana de estudio. Desarrolle la

actividadde investigación formativa 03 y

46 9

preséntela la13° semana de estudio a travésdel campus virtual. Participe del foro de responsabilidad social 03 en la 13° semana de estudio a través del campus virtual. Desarrolle el trabajo de aplicación sobre medidas de forma y preséntelo en la 14° semana de estudio a través del campus virtual. Participe en la tutoría asincrónica de la 15° semana de estudio a través del foro, que se encuentra en el campus virtual.

5.2

Participe del examen en línea de la unidad 03 en la 15° semana de estudio a través del campus virtual.

Orientaciones para la Tutoría

Durante el desarrollo de la asignatura se realizarán las siguientes tutorías:

Tutoría asincrona: Es la comunicación que realizará el docente tutor a través de foros, desde la cual usted podrá consultar con las dudas que tenga sobre los temas a tratar durante el desarrollo del aprendizaje según cada semana de estudio. Las tutorías asíncronas se realizarán en las siguientes se

Tutoría síncrona: Es la comunicación en línea desde la cual usted podrá comunicarse con el docente, para realizar las consultas que usted estime pertinente.

Tutoría presencial: Es la orientación presencial que usted recibirá en el Centro Uladech más cercano al lugar donde se encuentra. Las tutorías señaladas se organizan en el tiempo, de la siguiente manera:

Semanas de Estudio 1 TAS

2

3 4 TS TP UNIDAD I

5 TAS

6

7 TS

8 9 TP TS UNIDAD II

10

11 TS

12 13 14 TP TS UNIDAD III

15 TAS

Leyenda: TAS: Tutoría asíncrona (foros) TS: Tutoría síncrona (chat) TP: Tutoría presencial No olvide asistir a la tutoría presencial y comunicarse con el docente a través de la tutoría asíncrona y síncrona.

5.3

Medios y Materiales 47 0

Materiales Físicos: Usted contará con la Guía Didáctica y el Texto de la

GUÍA DIDÁCTICA

asignatura Medios virtuales:

Usted contará con el EVA (Entorno Virtual Angelino), desde el cual podrá acceder a la asignatura. Para tal hecho, deberá requerir su usuario y clave en la administración de la Sede Chimbote o su respectiva Filial ULADECH Católica.

8. Evaluación / Instrumentos de Evaluación Los criterios de evaluación de la Modalidad a Distancia, por cada Unidad Didáctica o de Aprendizaje son los siguientes: • • • •

Actividades formativas de la carrera Actividad de investigación formativa Actividad de responsabilidad social Examen sumativo

60% 10% 10% 20%

Los exámenes sumativos serán en línea como a continuación se detalla: 4° semana 8° semana 12° semana Examen en línea Examen en línea Examen en línea Para rendir el examen en línea, tendrá que acceder al campus virtual.

GUIA DIDACTICA ASIGNATURA ESTADISTICA APLICADA 47 1

índice 1. Presentación de la Guía Didáctica 2. Presentación del Equipo Docente 3. Introducción a la Asignatura 4. Requisitos previos 5. Estrategias para el aprendizaje 5.1 Orientaciones para el Aprendizaje 5.2 Orientaciones para la tutoría 5.3 Medios y Materiales 6. Evaluación / instrumentos de evaluación

47 2

GUÍA DIDÁCTICA

1. Presentación de la Guía Didáctica Estimado estudiante: Bienvenido a la Guía Didáctica de la asignatura de Estadística Aplicada El presente apartado busca orientarlo en la propia estructura de la Guía Didáctica, el cual le ayudará a conocer, estructurar y organizar su aprendizaje en el tiempo, según los requerimientos propios de la asignatura. La Guía Didáctica tiene las siguientes partes: • •

• • • -

•

Presentación de la Guía Didáctica: Busca orientarlo en la propia estructura de la Guía Didáctica. Presentación del Equipo Docente: Señala al docente que han elaborado la Guía de la asignatura, indicando su experiencias profesionales al respecto. Introducción a la Asignatura: Explica el sentido de la asignatura y su importancia en su formación docente y futuro desempeño profesional. Requisitos previos: Indica las asignaturas que son pre requisitos en el desarrollo del aprendizaje. Estrategias para el aprendizaje: Señala la estrategia metodológica a utilizar en la asignatura. Orientaciones para el Aprendizaje: Orienta al estudiante durante cada semana de estudio, para el logro del aprendizaje. Orientaciones para la tutoría: Indica la función de las tutorías presenciales, síncronas y asíncronas de la asignatura. Medios y Materiales: Señala los medios físicos y virtuales así como los materiales a utilizar en la asignatura. Evaluación / instrumentos de evaluación: Señala los criterios de evaluación por unidad didáctica y los instrumentos a utilizar.

2. Presentación del Equipo Docente La docente que ha laborado la Guía Didáctica y responsable de la implementación de la Asignatura, es Carmen Rosa Barreto Rodríguez quién es Lic.en Estadística por la Universidad Nacional de Trujillo, Mg. En Ciencias con Mención en Docencia Universitaria e Investigación Educativa y en la actualidad se encuentra cursando estudios de Doctorado en la Universidad Nacional del Santa. Carmen Rosa Barreto Rodríguez se ha desempeñado como Docente Auxiliar de la Universidad Nacional del Santa en las asignaturas de Estadística, Estadística Aplicada y Probabilidad y Estadística, y en la actualidad es Docente Ordinario - Categoría Asociado de la Universidad Católica Los Ángeles de Chimbote adscrita a la Escuela de Ingeniería de Sistemas de y es Docente Titular de las asignaturas de Estadística, Estadística Aplicada, Estadística Aplicada a la Educación, Estadística Inferencial y Bioestadística en la modalidad presencial y a distancia. Es autora de los libros Estadística Básica - Aplicaciones y Series de Tiempo y Números Índices. Para comunicarse con el docente, podrá realizarlo a través de su correo electrónico [email protected].

3. Introducción a la Asignatura

4 7 4

La asignatura busca que usted: Adquiera el dominio de conceptos y técnicas de estadística inferencial, para aplicarlos en investigaciones de su especialidad.__________________________________

GUÍA La asignatura se organiza en tres (3) unidades de aprendizaje y se desarrollará DIDÁCTICA con el Texto de Estadística Básica - Aplicaciones, las cuales puede observar a continuación: Unidad Objetivo Didáctic Especifico/ a Competencia

I Unidad

Temas Ejes

Semana de Resumen Estudio

Páginas de texto “Estadística BásicaUtilizar Distribución 1 ° 2° 3° 4° Uso adecuado Aplicaciones” adecuadamente normal 5° de las tablas las tablas general. semana estadísticas de estadísticas de Distribución la distribución las normal 148 -167 distribuciones normal Distribución continuas estándar, t t student. importantes. student y chi cuadrado. Distribución chi cuadrado.

4 7 5

l

o

Realizar Prueba de adecuadamente hipótesis para la

o

Estimar Intervalos de 6°-7°-8°-9°- Cálculo e adecuadamente confianza 10° interpretación intervalos de para la media semana adecuada de confianza y el poblacional y intervalos de tamaño de tamaño de confianza para muestra muestra. la media poblacional y proporción poblacional, así como el tamaño de Intervalos de muestra confianza respectivo para la usando las proporción formulas del poblacional y muestreo tamaño de aleatorio muestra. simple.

4

II unidad

173 - 183

y

272 - 273

Desarrollo adecuado d e

4 7 6

prueba de hipótesis III Unidad

media poblacional. Prueba de hipótesis para la proporción poblacional.

semana

prueba d e hipótesis la para media y proporción poblaciona GUÍA l.

195 - 213

DIDÁCTICA

La primera unidad desarrolla la metodología para el uso de tablas estadísticas de las distribuciones continuas importantes, tales como la distribución normal estándar, distribución t student y distribución chi cuadrado, las cuales sirven de apoyo para los temas subsiguientes de estadística inferencial. La segunda unidad desarrolla la metodología estadística para estimar intervalos de confianza para la media poblacional usando la estadística z y t y proporción poblacional usando la estadística z y para calcular el tamaño de muestra de una población usando las formulas del muestreo aleatorio simple. La tercera unidad desarrolla el procedimiento estadístico para realizar prueba de hipótesis para la media poblacional usando la estadística z y t y proporción poblacional usando la estadística z.

4 7 7

Para el desarrollo de las unidades en mención se utilizará el Texto de "Estadística Básica - Aplicaciones” como medio didáctico para orientar y guiar el aprendizaje el cual ilustra los técnicas estadísticas y procedimientos que permitirán el desarrollo de los contenidos dados en el Silabo Plan de Aprendizaje de Estadística Aplicada.

Bienvenidos a la asignatura de Estadística Aplicada.

4. Requisitos Previos

La asignatura exige haber aprobado la asignatura de Estadística de II ciclo de estudios.

5. Estrategias para el Aprendizaje

La estrategia para el aprendizaje se centra en el aprendizaje significativo y colaborativo con una comprensión de la realidad integral mediada por el mundo. Para el logro del aprendizaje se ofrecerá casos para resolver, de tal manera que favorezca el desarrollo de las actividades y de la investigación propia de la asignatura. Se articulará la estrategia del aprendizaje con el Modelo Didáctico de la ULADECH Católica, el cual se grafica a continuación:

4 7 8

GUÍA DIDÁCTICA

El Modelo Didáctico se ha planificado en el tiempo, según el siguiente gráfico:

Semanas de Estudio 1 2 3 UNIDAD I

4

5

6

7

8 9 UNIDAD II

10

11

12 13 14 UNIDAD III

4 7 9

15

5.1

Orientaciones para el Aprendizaje

A continuación se detalla las orientaciones del aprendizaje por semana de estudio utilizando el Texto de Estadística Básica-Aplicaciones: Unidad Didácti ca I Unidad

Objetivo Especifico Utilizar adecuadament e las tablas estadísticas de las distribuciones continuas importantes.

Temas Ejes Distribución normal general. Distribución normal estándar

Distribución t student. Distribución chi cuadrado.

Semana de Estudio 1°-2°-3°4°-5° semana

Resumen Inicie analizando el SPA (sílabo y Planes de Aprendizaje) ingresando al EVA Pregrado (campus virtual).

Página de texto 148 -167

Utilice adecuadament e las tablas estadísticas de la distribución normal estándar, t student y chi cuadrado en ejercicios propuestos. Participe en la tutoría asincrónica de la 1° semana de estudio a través del foro, que se encuentra en el campus virtual. Desarrolle la práctica calificada sobre distribución normal y preséntela la 2° semana de estudio a través del campus virtual. Participe en la tutoría síncrona a través del chat que se

48 0

GUIA DIDACTICA en la 3° semana de estudio

Desarrolle la actividad de investigación formativa 01 y preséntela la 3° semana de estudio a través del campus virtual. Participe del foro de responsabilidad social 01 en la 3° semana de estudio a través del campus virtual. Participe en la tutoría presencial de la 4° semana de estudio. Desarrolle la práctica calificada sobre distribución t student y chi cuadrado y preséntela la 4° semana de estudio a través del campus virtual. Participe en la tutoría asincrónica de la 5° semana de estudio a través del foro, que se encuentra en el campus virtual. Participe del examen en línea de la primera unidad en la 5° semana de

estudio a través del campus virtual

48 1

II unidad

Estimar adecuadament e intervalos de confianza y el tamaño de muestra

Intervalos de 6°- 7°-8°-9°confianza 10° semana para la media poblacional y tamaño de muestra.

173 - 183 Calcule e y interprete intervalos de confianza para 272 - 273 la media y proporción poblacional, así como el tamaño de muestra usando el muestreo aleatorio simple. Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 7° semana de estudio. Desarrolle la práctica calificada sobre intervalos de confianza para la media poblacional y tamaño de muestra y preséntela en la 7° semana de estudio a través del campus virtual. Participe en la tutoría presencial de la 8° semana de estudio. Desarrolle la actividad de investigación formativa 02 y preséntela la 8° semana de

48 2

del virtual.

campus

Participe del foro GUIA de responsabilidad DIDACTICA social 02 en la 8° semana de estudio a través del campus virtual. Intervalos de confianza para la proporción poblacional y tamaño de muestra.

Participe en la tutoría síncrona a través del chat que se encuentra en el campus virtual, en la 9° semana de estudio. Desarrolle la práctica calificada sobre intervalos de confianza para la proporción poblacional y tamaño de muestra y preséntela en la 9° semana de estudio a través del campus virtual.

III Unidad

Realizar adecuadament e prueba de hipótesis

Prueba de hipótesis para la media poblacional.

Participe del examen en línea de la unidad 02 en la 10° semana de estudio a través del campus virtual. 195 11°-12°-13°- Realice 14°-15° adecuadament 214 semana e prueba de hipótesis para la media y proporción poblacional.

Participe en la tutoría síncrona

48 3

Prueba de hipótesis para la proporción poblacional.

Participe en la tutoría presencial de la 12° semana de estudio.

a través del chat que se encuentra en el campus virtual, en la 11° semana de estudio.

Desarrolle la actividad de investigación formativa 03 y preséntela la 13° semana de estudio a través del campus virtual. Participe del foro de responsabilidad social 03 en la 13° semana de estudio a través del campus virtual.

Desarrolle la práctica calificada sobre prueba de hipótesis para la media y proporción poblacional y preséntela en la 14° semana de estudio a través del campus virtual. Presente un caso de aplicación sobre prueba de hipótesis en la 15° semana de

48 4

estudio a través del campus virtual. Participe en la tutoría asincrónica de la 15° semana de estudio a través del foro, que se encuentra en el campus virtual. Participe del examen en línea de la unidad 03 en la 15° semana de estudio a través del campus virtual.

5.2

Orientaciones para la Tutoría

Durante el desarrollo de la asignatura se realizarán las siguientes tutorías:

Tutoría asincrona: Es la comunicación que realizará el docente tutor a través de foros, desde la cual usted podrá consultar con las dudas que tenga sobre los temas a tratar durante el desarrollo del aprendizaje según cada semana de estudio. Las tutorías asincronas se realizarán en las siguientes se

Tutoría síncrona: Es la comunicación en línea desde la cual usted podrá comunicarse con el docente, para realizar las consultas que usted estime pertinente.

Tutoría presencial: Es la orientación presencial que usted recibirá en el Centro Uladech más cercano al lugar donde se encuentra.

Las tutorías señaladas se organizan en el tiempo, de la siguiente manera:

Semanas de Estudio 1 TAS

2

3 4 TS TP UNIDAD I

5 TAS

6

7 8 9 TS TP TS UNIDAD II

10

11 TS

12 13 14 TP TS UNIDAD III

Leyenda: TAS: Tutoría asíncrona (foros) TS: Tutoría síncrona (chat) TP: Tutoría presencial No olvide asistir a la tutoría presencial y comunicarse con el docente a través de la tutoría asíncrona y síncrona.

15 TAS

5.3

Medios y Materiales

Materiales Físicos: Usted contará con la Guía Didáctica y el Texto de la asignatura Medios virtuales: Usted contará con el EVA (Entorno Virtual Angelino), desde el cual podrá acceder a la asignatura. Para tal hecho, deberá requerir su usuario y clave en la administración de la Sede Chimbote o su respectiva Filial ULADECH Católica.

8. Evaluación / Instrumentos de Evaluación Los criterios de evaluación de la Modalidad a Distancia, por cada Unidad Didáctica o de Aprendizaje son los siguientes: • • • •

Actividades formativas de la carrera Actividad de investigación formativa Actividad de responsabilidad social Examen sumativo

60% 10% 10% 20%

Los exámenes sumativos serán en línea como a continuación se detalla: 4° semana 8° semana 12° semana Examen en línea Examen en línea Examen en línea Para rendir el examen en línea, tendrá que acceder al campus virtual.