Estadistica Aplicada a La Educacion

ESTADÍSTICA APLICADA A LA EDUCACION ELABORADO POR: INGENIERA: JESSICA LISET MARTÍNEZ AGOSTO DE 2014 SANTA ANA, EL SALV

Views 237 Downloads 68 File size 5MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADÍSTICA APLICADA A LA EDUCACION

ELABORADO POR: INGENIERA: JESSICA LISET MARTÍNEZ

AGOSTO DE 2014 SANTA ANA, EL SALVADOR, CENTROAMÉRICA

INDICE INTRODUCCION.................................................................................................1 UNIDAD 1:........................................................................................................1 “NOCIONES PRELIMINARES”............................................................................1 1.1

RELACIÓN DE LA ESTADÍSTICA Y EL MÉTODO CIENTÍFICO.......................2

1.1.1

Definición y Objeto de la Estadística...............................................................2

1.1.2

Para qué sirve la Estadística..........................................................................3

1.1.3

El método científico....................................................................................3

1.1.4

El proceso experimental...............................................................................5

1.2

CONCEPTOS BÁSICOS.............................................................................7

1.3

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL.............................................8

1.3.1

Tipos de Estadística....................................................................................8

1.3.2

Universo, Población y Variable......................................................................9

UNIDAD 2:......................................................................................................13 “ORGANIZACIÓN DE LOS DATOS”..................................................................13 2.1

FUENTES Y MÉTODOS DE RECOLECCIÓN DE DATOS...............................14

2.2

NOCIÓN DE VARIABLE. CLASIFICACIÓN................................................20

2.3

ESCALAS ESTADÍSTICAS.......................................................................21

2.4

DISTRIBUCIÓN DE FRECUENCIAS..........................................................23

2.5

PRESENTACIÓN, TABULAR Y GRAFICAR................................................32

UNIDAD 3:......................................................................................................39 “ANÁLISIS ESTADÍSTICO”................................................................................39 3.1

MEDIDAS DE TENDENCIA CENTRAL......................................................40

3.1.1

La Media Aritmética.................................................................................42

3.1.2

La Mediana............................................................................................45

3.1.3

La Moda................................................................................................47

3.1.4

La Media Armónica..................................................................................47

3.1.5

La Media Geométrica................................................................................48

3.2

MEDIDAS DE VARIABILIDA O DISPERSION.............................................51

3.2.1

El Recorrido...........................................................................................52

Ingeniera Jessica Liset Martínez

1

3.2.2

La Desviación Típica o Estándar..................................................................53

3.2.3

El Coeficiente De Variación........................................................................55

3.2.4

APLICACIONES.....................................................................................56

UNIDAD 4:......................................................................................................58 “ELEMENTOS DEL CÁLCULO...........................................................................58 DE PROBABILIDADES”....................................................................................58 4.1

TECNICAS DE CONTEO.........................................................................59

4.1.1

Métodos de Conteo...................................................................................62

4.2

DEFINICION Y MEDICION DE PROBABILIDAD.........................................77

4.2.1

Probabilidad...........................................................................................77

4.2.2

Experimento...........................................................................................82

4.2.3

Espacio Muestral......................................................................................82

4.3

INDEPENDENCIA ESTADÍSTICA.............................................................83

4.3.1

Tipos de Eventos o Sucesos........................................................................83

4.4

PROBABILIDAD CONDICIONAL.............................................................85

4.4.1

Definición de probabilidad condicionada........................................................85

UNIDAD 5:......................................................................................................89 “DISTRIBUCIONES DE PROBABILIDAD”..........................................................89 5.1

VARIABLE ALEATORIA..........................................................................90

5.2

CONCEPTOS BASICOS...........................................................................90

5.3

DISTRIBUCIONES DE PROBABILIDAD....................................................98

5.3.1

Distribución Binomial...............................................................................98

5.3.2

Distribución Normal...............................................................................101

5.3.2.1 Áreas Bajo la Curva Normal..................................................................104 5.3.2.2 Porcentaje Entre dos Datos Nominales.....................................................106 BIBLIOGRAFÍA...........................................................................................118

INTRODUCCION

Ingeniera Jessica Liset Martínez

2

Lind, Mason y Marchal (2001) en su libro “Estadística para administración y contaduría” hacen referencia a una cita de H.C.Well, un escritor e historiador inglés, quien dijo hace más de 100 años que “para ser un buen ciudadano, el pensamiento estadístico sería un día tan importante como saber leer”. Estos mismos autores afirman que Well no mencionó los negocios porque apenas comenzaba la revolución francesa, sin embargo, aseguran que si ese escritor tuviera hoy la posibilidad de hacer un comentario sobre las estadísticas seguramente diría que “el pensamiento estadístico es necesario no sólo para ser un buen ciudadano, sino también para la toma de decisiones acertadas en los negocios”. La estadística la aprendemos desde la educación básica, no obstante, pareciera que no encontráramos el valor y la utilidad que ella tiene en la vida diaria. Aun en las circunstancias más comunes de nuestro día a día empleamos estadística para la toma de decisiones, por ejemplo, cada vez que vamos a bañarnos si disponemos de un calentador de agua abrimos el chorro durante un rato hasta que comienza a salir el agua caliente, metemos la mano, probamos la temperatura, decidimos si se agrega más agua fría o no y cuando consideramos que la temperatura es adecuada decidimos entrar a la regadera. En este caso tomamos una decisión basándonos en una muestra,

esta

cotidianidad es una de las técnicas empleadas por la estadística. Estadística es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos, los resultados del análisis y la interpretación nos permiten predecir determinados acontecimientos que nos pueden favorecer en la administración de una empresa. Por ello la importancia de esta unidad curricular dentro del plan de formación “Administración y Gestión” la cual te brindará herramientas para toma de decisiones acertadas en los diferentes procesos administrativos.

Ingeniera Jessica Liset Martínez

2

UNIDAD 1: “NOCIONES PRELIMINARES”

Ingeniera Jessica Liset Martínez

1

1.1

RELACIÓN DE LA ESTADÍSTICA Y EL MÉTODO CIENTÍFICO 1.1.1

Definición y Objeto de la Estadística

La Estadística tiene por objeto la recolección, presentación, análisis e interpretación de observaciones o mediciones hechas sobre un conjunto de objetos, personas, procesos, fenómenos, etc. Comúnmente es considerada como una colección de hechos numéricos expresados en términos de una relación, y que han sido recopilados a partir de otros datos numéricos. A continuación se te presenta un cuadro con definiciones de estadística planteadas por diferentes autores en diferentes años: Autor

Gini, 1953

Yale y Kendal, 1954

Kendall y Buckland ,1980

Murria R. Spiegel, 1991

Lind, Mason y Marchal, 2001

Definición La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos Un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis La ciencia de reunir, organizar, presentar, analizar e interpretar datos para ayudar a tomar las mejores decisiones

¿Consideras que ha habido una diferencia u avance notorio a través de los años en las definiciones de estadística presentadas en el cuadro anterior? Ingeniera Jessica Liset Martínez

2

Quizás el hecho más curioso que resalta de las definiciones anteriores es: ¿La estadística es una ciencia o una técnica? En la actualidad se considera como un poderoso auxiliar en la investigación. Por ello estudiaremos la estadística como un conjunto de métodos que nos permiten evaluar datos cualitativos y cuantitativos. Entendiendo por dato cuantitativo a aquel que está expresado de forma numérica, por ejemplo: la edad, el peso, las calificaciones, etc. Mientras los datos cualitativos reflejan, como su nombre lo indica, cualidades, características del objeto que se analiza por ejemplo: Categorizar las los niveles de inasistencias de un trabajador en muchas o pocas, la estatura en bajo, mediano o alto, opinar sobre un producto calificándolo de muy bueno, bueno, regular o deficiente, etc.1 1.1.2

Para qué sirve la Estadística

Ya hemos visto que la Estadística se encuentra ligada a nuestras actividades cotidianas. Sirve tanto para pronosticar el resultado de unas elecciones, como para determinar el número de ballenas que viven en nuestros océanos, para descubrir leyes fundamentales de la Física o para estudiar cómo ganar la ruleta. La Estadística resuelve multitud de problemas que se plantean en ciencia:  Análisis de muestras. Se elige una muestra de una población para hacer inferencias respecto a esa población a partir de lo observado en la muestra (sondeos de opinión, control de calidad, etc.).  Descripción de datos. Procedimientos para resumir la información contenida en un conjunto (amplio) de datos.  Contraste de hipótesis. Metodología estadística para diseñar experimentos que garanticen que las conclusiones que se extraigan sean válidas. Sirve para comparar las predicciones resultantes de las hipótesis con los datos observados (medicina eficaz, diferencias entre poblaciones, etc.).  Medición de relaciones entre variables estadísticas (contenido de gas hidrogeno neutro en galaxias y la tasa de formación de estrellas, etc.)  Predicción. Prever la evolución de una variable estudiando su historia y/o relación con otras variables.

1.1.3

El método científico

Citando a Martin Gardner: “La ciencia es una búsqueda de conocimientos fidedignos acerca del mundo: como se estructura y cómo funciona el universo (incluyendo los seres vivos)”. La información que maneja la ciencia es amplia, al ser amplio su ámbito. Pero se suele reunir en tres apartados: los hechos, las leyes y las teorías. No es una partición estancada, aunque podemos entender aquí nos referimos con algún ejemplo. Los hechos se refieren a casos específicos y únicos. Por ejemplo la Tierra tiene una luna (satélite natural). 1 De material elaborado por Márquez Zambrano, Luisa Ingeniera Jessica Liset Martínez

3

La primera ley de Kepler (ya que estamos con planetas) es un buen ejemplo de ley: los planetas describen orbitas elípticas en torno al Sol, que ocupa uno de los focos de la elipse. Como se ve, frente al hecho, concreto y único, la ley se refiere a muchos casos, como lo son los planetas que orbitan en torno al Sol. La generalización de la ley de Kepler permite aplicarla a cualquier par de cuerpos ligados por la gravedad. Una teoría es una abstracción, con entidades inobservables, que explica hechos y leyes. Por ejemplo la teoría newtoniana de la gravitación. En ella se habla de fuerzas (o de campos gravitatorios) que no son entes observables, pero esta teoría explica hechos y leyes. Sucede que el conocimiento científico no es completamente seguro en ninguna de las precedentes categorías. Podría existir otra luna en torno a la Tierra. O, como sabemos, la teoría newtoniana de la gravitación no es completa, porque no da cuenta de algunos fenómenos. De ahí vino su evolución a nuevas teorías de la gravitación. No hay así un conocimiento completamente seguro: los enunciados absolutamente ciertos solo existen en el ámbito de las matemáticas o la lógica. Pero la ciencia usa una correspondencia con estas dos disciplinas. La matemática y la lógica aplicadas a las ciencias facilitan poder establecer hechos, leyes y teorías con coherencia interna y con un alto grado de certeza. Y la Estadística proporciona una herramienta para poder evaluar esta certeza, o proporcionar pautas para realizar inferencias a partir delo que se conoce. Lo que distingue a una teoría científica es que esta, a diferencia de la que no lo es, puede ser refutada: puede existir un conjunto de circunstancias que si son observadas demuestran que la teoría está equivocada. A continuación se ofrece una visión simplificada del método científico. Hacemos observaciones en la naturaleza y a través de un proceso creativo generamos una hipótesis de cómo funciona cierto aspecto de la naturaleza (modelos). Basándonos en esa hipótesis diseñamos un experimento que consiste en que un conjunto de observaciones deben tener lugar, bajo ciertas condiciones, si la hipótesis es cierta. En el caso de que estas observaciones no ocurran nos enfrentamos a varias posibilidades: nuestras hipótesis necesitan ser revisadas, el experimento se llevó a cabo de forma incorrecta, o nos hemos equivocado en el análisis de los resultados del experimento.2

2 Tomado del libro “Estadıstica Basica para Estudiantes de Ciencias”. Febrero 2009 Ingeniera Jessica Liset Martínez

4

Hace algunos cientos de años se estableció un método para encontrar respuestas a los interrogantes que nos planteamos al contemplar la naturaleza. Este método, conocido como método científico, se basa en tres pilares fundamentales: observación, razonamiento y experimentación. El método científico no es una simple receta, sino que es un proceso exigente que requiere, entre otros ingredientes, juicio crıtico. De forma resumida, el método científico incorpora las siguientes facetas: Observación: aplicación atenta de los sentidos a un objeto o a un fenómeno, para estudiarlos tal como se presentan en realidad. Descripción: las mediciones deben ser fiables, es decir, deben poder repetirse. Las observaciones únicas e irrepetibles no permiten predecir futuros resultados. En este sentido la Cosmología se enfrenta, a priori, a un grave problema. El Universo es único y no podemos volver a repetirlo modificándolas condiciones iniciales. Predicción: las predicciones de cualquier fenómeno deben ser válidas tanto para observaciones pasadas, como presentes y futuras. Control: capacidad de modificar las condiciones del experimento para estudiar el impacto de los diferentes parámetros participantes. Esto se opone a la aceptación pasiva de datos, que puede conducir a un importante sesgo (vías) empírico. Falsabilidad o eliminación de alternativas plausibles: Este es un proceso gradual que requiérela repetición de los experimentos (preferiblemente por investigadores independientes, quienes deben ser capaces de replicar los resultados iniciales con la intención de corroborarlos). Todas las hipótesis y teorías deben estar sujetas a la posibilidad de ser refutadas. En este sentido, a medida que un área de conocimiento crece y las hipótesis o teorías sobre la que se sustenta van realizando predicciones comprobables, aumenta la confianza en dichas hipótesis o teorías (uno de los defensores fundamentales del criterio de falsabilidad es Karl Popper (1902–1994); ver, por ejemplo, La lógica de la investigación científica en Popper (1935). Explicación causal: los siguientes requisitos son normalmente exigibles para admitir una explicación como científica:

1.1.4

El proceso experimental

La experimentación está lejos de estar carente de dificultades. Algunas técnicas experimentales exigen un aprendizaje largo y, en muchas ocasiones, el volumen de datos a manejar puede ser tan grande que sea necesario un trabajo de análisis intenso. La paciencia y la perseverancia son grandes aliadas en este sentido. Las razones para realizar un experimento son diversas y de alcance muy variable. Preguntas típicas son, por ejemplo: ¿Como de aplicable es una teoría particular? ¿Es posible mejorar una técnica de medida? ¿A qué temperatura debe fundir una nueva aleación? ¿Qué ocurre con las propiedades magnéticas de un material al someterlo a temperaturas de trabajo muy bajas? ¿Se ven alteradas las propiedades de un semiconductor debido al bombardeo por radiación nuclear? De una forma esquemática, el proceso experimental suele desarrollarse siguiendo el siguiente esquema:

Ingeniera Jessica Liset Martínez

5

1. Definir la pregunta o problema a resolver. Cuanto más claro y definido sea el objetivo del experimento, mucho más fácil será realizar su planificación y ejecución. 2. Obtener información y recursos. Una vez definido el objetivo del experimento, es necesario elaborar un plan de trabajo para poder alcanzarlo. Hay que identificar que equipos son necesarios, que cantidades hay que medir, y de qué manera se va a realizar el experimento. 3. Formular hipótesis, acerca de los resultados de nuestro experimento. Hacerlo antes de su ejecución evita el sesgo personal de identificar los resultados que ya se conocen como objetivos iniciales (no debemos engañarnos a nosotros mismos). 4. Realizar el experimento y obtener las medidas. Esta tarea se subdivide en varios pasos: ▪ Preparación: el equipo debe ser puesto a punto para su utilización. Si el experimento requiere la utilización de aparatos con los que no estamos familiarizados, es necesario leer atentamente los manuales de utilización, e incluso consultar a experimentadores con experiencia previa en su manejo. Todo ello evita perder tiempo y cometer errores de bulto, a la vez que preserva la integridad del equipo (¡y la nuestra!). ▪ Experimentación preliminar: suele ser muy aconsejable realizar una pequeña experimentación de prueba antes de iniciar la toma definitiva de medidas. Esto facilita el uso correcto del equipo instrumental, permitiendo identificar los aspectos más difíciles o en los que resulta más fácil cometer errores. ▪ Toma de datos: el trabajo cuidadoso y detallado son fundamentales en todo proceso experimental. Ejecutar dicha labor siguiendo un plan de trabajo bien definido resulta básico. No hay nada más frustrante que descubrir, tras largas horas de medidas, que hemos olvidado anotar algún parámetro esencial o sus unidades. En este sentido resulta imprescindible tener presentes varias cuestiones: • ¿Cuáles son las unidades asociadas a cada medida? • ¿Cuál es la incertidumbre asociada? • ¿Que variabilidad presentan las medidas? • ¿Cómo puedo tener una idea del orden de magnitud de una medida antes de realizarla y saber así que los resultados que se van obteniendo son razonables? • ¿Qué información debe ser incluida en la tabla de datos? ▪ Comprobación de la respetabilidad: siempre que sea posible, todo experimento debería repetirse varias veces para comprobar que los resultados obtenidos son repetibles y representativos. Y aunque, obviamente, la repetición de un experimento no proporciona exactamente los mismos números, discrepancias muy grandes deben alertarnos acerca de la existencia de efectos sistemáticos que pueden estar distorsionando el experimento. 5. Analizar los datos: una vez obtenidas las medidas es necesario su tratamiento estadístico para poder obtener magnitudes (e incertidumbres asociadas) representativas del objeto de nuestro estudio. 6. Interpretar los datos y extraer conclusiones que sirvan como punto de partida para nuevas hipótesis. El éxito de esta interpretación dependerá, básicamente, de la calidad de las medidas y de su análisis. Las herramientas estadísticas que se describen en este libro nos permitirán tomar decisiones de manera objetiva.

Ingeniera Jessica Liset Martínez

6

7. Publicar los resultados. Los resultados de cualquier proceso experimental deben ser comunicados de manera clara y concisa. Esto incluye desde un sencillo informe de laboratorio, como el que se exigirá en los diversos laboratorios en los que se trabajara durante la licenciatura de Físicas, hasta la publicación de un artículo científico una revista reconocida.

1.2

CONCEPTOS BÁSICOS

Variables: Una variable es la característica de un objeto, persona o situación que es capaz de modificarse en extensión y naturaleza, es decir, es una característica que varía de un objeto a otro que no permanece constante y como consecuencia sirve para singularizar un objeto o grupo de ellos. Debemos tener claro que a variable no es el objeto de estudio en sí, sino sus características, por ejemplo si estuviéramos analizando un local para alquilar el local no es variable, variables son sus atributos: ubicación, tamaño, iluminación, ventilación, etc. Podemos encontrar dos tipos de datos: Cualitativos y cuantitativos. 



Variables Cualitativas: Llamamos variable cualitativa a aquella no o puede ser expresada de forma numérica, por ejemplo la religión, podemos decir que somos católicos, judíos, protestantes, evangélicos, etc. Observemos que este es un dato que varía de un individuo a otro pero no puede ser expresado de forma numérica. Variables Cuantitativas: Es aquella variable que puede ser expresada de forma numérica, por ejemplo el número de hijos por familia. Estas variables se dividen en dos grupos: variables continuas y discretas.

 Variable Discreta: Es aquella que solo puede asumir ciertos valores, y ente éstos suele haber huecos, generalmente se expresan en números enteros, por ejemplo, cantidad de miembros de una cooperativa, podemos decir que está conformada por doce, trece personas, pero nunca podremos decir que nuestra cooperativa está conformada por 20.5 personas. Apreciemos el siguiente ejemplo: Una variable discreta puede ser la cantidad de lapiceros que tenemos disponibles en nuestro inventario, si contamos podemos decir que tenemos 96 bolígrafos, el dato en este caso se expresa evitando los rangos entre los valores, es decir, no podíamos decir que tenemos 95,2 lapiceros o 96,1. En este tipo de casos se expresa el dato en un número entero.

 Variables Continuas: Es aquella que puede adoptar cualquier valor dentro de un rango específico, por ejemplo, la duración de un viaje en carro de Caracas a Maracay, algunas veces puede durar una hora y cuarenta

Ingeniera Jessica Liset Martínez

7

y cinco minutos o dos horas, etc. Otro ejemplo de variable continua el promedio de las calificaciones de un estudiante en cada lapso. Veamos este otro ejemplo: Una variable continua es nuestra temperatura corporal, cuando tenemos fiebre nos tomamos la temperatura, la medida puede ir desde los 36 grados hasta los 41, pero incluyendo los números decimales, por ejemplo 36; 36,1; 36,2;…37; 37,1…38; 38,1…39,9; 40…; 40,5 etc. El peso de las verduras que compramos periódicamente es una variable continua, pues puede variar de forma ascendente o descendente incluyendo los decimales, no hay vacíos entre los rangos, todos son continuos, de allí el nombre de la variable. 1.3

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

El tema de la estadística moderna abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis de datos como en el proceso de la toma de decisiones. 1.3.1

Tipos de Estadística

Dos corrientes de influencia han conducido al desarrollo de los métodos estadísticos. Una de ellas, tenía por objeto mantener en orden registros del gobierno (de hecho, estado y estadística vienen de la misma raíz latina, status). De ella evolucionaron las actividades de conteo, medición, descripción, tabulación, ordenamiento y levantamiento censal, que conforman lo que hoy conocemos como estadística descriptiva. La segunda corriente de influencia se originó en las matemáticas de los juegos de azar y condujo al desarrollo de la estadística inferencial o inductiva, basada fundamentalmente en el concepto de probabilidad matemática. Estadística Descriptiva: La estadística descriptiva está dedicada a descubrir las regularidades o características existentes en un conjunto de datos mediante la utilización de gráficos y de medidas numéricas de resumen. En otras palabras, resume y transforma datos para poder interpretar la información. A través de la cuantificación y ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). Estadística Descriptiva: Métodos Jessica para organizar, y presentar Ingeniera Lisetresumir Martínez 8 datos de manera informativa

Estadística Inductiva o Inferencial: Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística. En resumen, son procedimientos estadísticos que se utilizan para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. La Estadística inferencial permite, mediante la utilización de métodos estadísticos basados en la teoría de las probabilidades, generalizar las conclusiones obtenidas a partir de una muestra a la población de la que ha sido extraída. Es importante destacar que para que las conclusiones sean válidas, se debe tratar que la muestra sea representativa de la población. Estadística Inferencial: Métodos usados para determinar algo acerca de la población basándose en una muestra. Leamos el siguiente ejemplo Imaginemos que nuestro profesor de estadística I calcula la calificación promedio de nuestro grupo en primera unidad. Como está empleando la estadística para describir el desempeño sin generalizar estos resultados hacia otros grupos de Estadística I el profesor está utilizando estadística descriptiva, con gráficas, tablas y diagramas muestra los datos de manera que sea más fácil su entendimiento. Supongamos ahora que el mismo profesor decide utilizar el promedio de calificaciones obtenidas por nosotros en la primera unidad para estimar la calificación promedio que obtendremos en el resto de las unidades de esta asignatura. El proceso de estimación de tal promedio sería un problema concerniente a la estadística inferencial.

1.3.2

Universo, Población y Variable

La estadística está compuesta por métodos científicos mediante los cuales podemos recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en dichos análisis. En cualquier trabajo en el que se aplique, la estadística debe hacer referencia a un conjunto de sujetos u objetos de análisis, conocido como población.

Ingeniera Jessica Liset Martínez

9

Población o Universo: Es el conjunto de entidades u objetos que satisfacen una definición común y en los que interesa analizar una o varias características. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo. Una población se precisa como un conjunto finito o infinito de personas que presentan características comunes, por lo que debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar cuáles y cuándo, por ejemplo: Escuelas primarias de Caracas, año 1995. El tamaño de una población viene dado por la cantidad de elementos que la componen. Generalmente se simboliza esta información con la letra N, en el caso en que sea una población finita, es decir, que podemos contabilizar y establecer un límite de existencia. Población: Es la recolección completa de todas las observaciones de interés para el investigador.

Muestra: Es un subconjunto de unidades de análisis de una población dada, destinado a suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga tamaño infinito (incontable), y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado, el extenso tiempo de recolección de la información, o más aún, la observación de los elementos puede ser destructiva. En todos estos casos, la única manera de estudiar la población es obteniendo muestras de ella. El tamaño de la muestra queda determinado por el número de elementos que la forman y se simboliza con la letra n. Muestra: Es una parte representativa de la población que se estudia y se toma cuando la población es demasiado grande como para estudiarla completa.

Ejemplo: Si necesitamos conocer la cantidad de personas entre 20 y 30 años que pertenecen a cooperativas en Venezuela, todas las personas que posean estas características (tener entre 20 y 30 años y trabajar en una cooperativa) serán nuestra población, seguramente va a ser difícil buscar todas las cooperativas de todo el país para conocer este dato, una forma de hacer la investigación es seleccionando un Ingeniera Jessica Liset Martínez 10

grupo de estados del país, podría ser uno de cada región y visitando sus cooperativas, para obtener la información, en este caso obtendremos una muestra, en la cual encontraremos personas de todas las edades, pero estos datos nos permitirán predecir de acuerdo a la cantidad de jóvenes en estos estados la proporción de jóvenes que habrán en todas las cooperativas del país. Observemos que este es una cose de estadística inferencial. En conclusión la estadística se divide normalmente en dos:

Teoría de decisión. Algunos de los problemas más importantes de la inferencia estadística se refieren a la evaluación de los riesgos y las consecuencias que pueden ocurrir al hacer generalizaciones a partir de una muestra de datos. Esto incluye una estimación de la probabilidad de tomar decisiones erróneas, las posibilidades de hacer predicciones incorrectas. En los últimos años, se han hecho intentos de abordar todos estos problemas dentro del marco de referencia de una teoría unificada llamada teoría de decisión. Si bien esta teoría tiene muchas ventajas conceptuales y teóricas, plantea algunos problemas de aplicación que son difíciles de resolver. Para entenderlos debe comprenderse que, por muy objetivamente que se planee un experimento o investigación, es imposible eliminar todos los elementos subjetivos. Un elemento de subjetividad interviene aun cuando definimos Ingeniera Jessica Liset Martínez 11

elementos como “bueno” o “mejor” con respecto a la razón de criterios de decisión (por ejemplo buscaremos una línea recta que “mejor se ajuste a un conjunto dado de pares ordenados de datos). La gran mayoría de los métodos que serán usados para plantear y resolver estos problemas pertenecen al enfoque clásico, ya que no toman en cuenta los varios factores subjetivos mencionados antes. Algunas otras aplicaciones pertenecen al enfoque Bayesiano, que consideran, informalmente al menos, algunos de estos factores subjetivos. La subjetividad influye mucho en la elección de los métodos estadísticos o fórmulas empleadas en una situación específica. Un Parámetro: Es una medida de resumen que se calcula para describir una característica de toda una población. Un Estadístico: Es una medida de resumen que se calcula para describir una característica de una sola muestra de la población. Muestra aleatoria: Es una muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad.

UNIDAD 2: “ORGANIZACIÓN DE LOS DATOS”

Ingeniera Jessica Liset Martínez 12

Ingeniera Jessica Liset Martínez 13

2.1

FUENTES Y MÉTODOS DE RECOLECCIÓN DE DATOS



Fuentes de Datos

El lugar del cual obtenemos los datos para realizar nuestros análisis estadísticos se denomina fuente. Los datos que requerimos para realizar una evaluación estadística de los procesos administrativos los podemos encontrar por medio de diversas fuentes las cuales pueden ser; primarias o secundarias, u oficiales o privadas. Llamamos fuentes primarias la persona o institución que ha recolectado los datos, y secundaria si la persona o institución que ha publicado los datos no fue la que efectuó la investigación. Datos Primarios: son aquellos que el investigador obtiene directamente de la realidad, recolectándolos con sus propios instrumentos. Datos Secundarios: son registros escritos que proceden de un contacto con la práctica, pero que ya han sido elegidos y procesados por otros investigadores. Los datos primarios y secundarios no son dos clases esencialmente diferentes de información, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orígenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los demás. Los datos oficiales son todos aquellos que hayamos en dependencias gubernamentales, y por el contrario los datos emitidos por entes no gubernamentales los denominamos privados. Técnicas de Recolección de Datos Existen diversas técnicas de recolección de datos, aquí mencionaremos las más comunes o las más empleadas. La Observación

Consiste en el uso sistemático de nuestros sentidos para captar la realidad que queremos estudiar. Es una técnica antigua, a través de sus sentidos, el hombre capta la realidad que lo rodea, que luego organiza intelectualmente. El uso de nuestros sentidos es una fuente inagotable de datos que, tanto para la actividad científica como para la vida práctica resulta de inestimable valor. Ingeniera Jessica Liset Martínez 14

Observación: Es el registro visual de lo ocurre es una situacional real, clasificando los acontecimientos de acuerdo con algún esquema pre estructurado y cónsono con el problema que se estudia La observación es un proceso cotidiano para nosotros, es parte de nuestra experiencia de vida, pero nuestras observaciones diarias al no estar orientadas a un propósito determinado carecen de controles que nos alejen de los errores. Para realizar un proceso de observación con el propósito de recabar datos debemos seguir algunos principios básicos:  Debe tener un propósito específico.  Debe ser planeada cuidadosa y sistemáticamente.  Debe llevarse, por escrito o de forma audiovisual, un control cuidadoso de la misma.  Debe especificarse su duración y frecuencia.  Debe seguir los principios básicos de validez y confiabilidad. La principal ventaja de esta técnica es que los hechos son percibidos directamente, sin ninguna clase de intermediación, colocándonos ante una situación tal como ésta se da naturalmente. De este modo, nunca obtendremos distorsiones de la realidad, las cuales solemos tener al emplear una entrevista, ya que en ellas los entrevistados colocan su toque personal al brindar la información. Otra ventaja es que la conducta se describe en el momento exacto en que está ocurriendo. Además, las observaciones se pueden realizar independientemente de que las personas estén dispuestas a cooperar o no, a diferencia de otros métodos en los que sí necesitamos de la cooperación de las personas para obtener la información deseada. Su principal desventaja reside en que la presencia del observador puede generar una alteración o modificación en la conducta de los objetos observados, destruyendo la espontaneidad y por tanto alterando la confiabilidad de los datos. La Entrevista. La entrevista es una técnica en la cual es investigador, de acuerdo a la información que necesita recolectar elabora una serie de preguntas que más tarde realiza a la persona que se convertirá en su fuente. Las entrevistas la mayoría de las veces se realizan en persona, es decir, visitando al entrevistado y registrando la información ofrecida, ya sea con un grabador o por escrito. Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda persona, siendo muy útil con los analfabetos, los niños o con aquellos que tienen limitación física u orgánica que les dificulte proporcionar una respuesta escrita. Se le puede explicar al entrevistado con qué propósito estamos recogiendo los datos y esta ayuda a que éste dirija mejor sus respuestas. Ingeniera Jessica Liset Martínez 15

A pesar de todas sus bondades la entrevista también posee algunas desventajas o limitaciones: Requiere una mayor inversión de tiempo para recoger la información, como las respuestas pueden ser totalmente abiertas se puede dificultar el análisis de los datos y requiere de mucha astucia para obtener los datos que se desean canalizando las respuestas del entrevistado aun cuando éste se desoriente. El Cuestionario Es el método que utiliza un instrumento impreso. Como en el caso de la entrevista, hay preguntas pero todas están formuladas en un papel, ellas están destinadas a obtener repuestas sobre el problema en estudio y son dadas por consultado a través de un proceso de escritura, sin embargo, el cuestionario puede ser llenado por el encuestado o con ayuda de un empadronador. El cuestionario puede aplicarse a grupos o individuos estando presente el responsable de recoger la información o no; puede enviarse por diversos medios a los seleccionados en la muestra. También puede contratarse a una persona que cumpla que aplique el cuestionario, en estos casos se suele llamar cédula de entrevista. Un ejemplo de esta aplicación son los empadronadores de los censos de población, recordemos que ellos traen el cuestionario con sus preguntas y sus respuestas, la función que cumplen es leer cada pregunta y marcar la respuesta dada por el encuestado. Las ventajas de esta administración es que no quedarán preguntas en blanco y también que puede ser aplicada a analfabetos, niños o personas con alguna discapacidad. Cuando la aplicación cuestionario queda en manos de los encuestados se pueden presentar problemas relacionados con la cantidad y calidad de datos que pretende obtener para el estudio. Estos problemas que a su vez se convierten en desventaja son: que el cuestionario no fuese devuelto; que los consultados evadan la respuesta a alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Debido a esa posible pérdida de información se recomienda cuando se use está técnica se escoja una muestra más grande de sujetos de estudio. Existen tres tipos de cuestionarios: Cuestionarios Abiertos. Son en los que se pregunta al sujeto algo y se le deja en libertad de responder como quiera. Este tipo de cuestionario es muy útil y proporciona mucha información, pero requiere más tiempo por parte del informante y es más difícil de analizar por parte responsable de recoger los datos. Cuestionarios Cerrados. Están estructurados de tal manera que al informante se le ofrecen sólo determinadas opciones de respuesta, y debe seleccionar una de ellas. Este cuestionario es más fácil de codificar y contestar. Como desventaja, es que al ofrecerle categorías al informante se le están "sugiriendo" las respuestas.

Ingeniera Jessica Liset Martínez 16

Cuestionarios Mixtos: poseen ambos tipos de preguntas abiertas y cerradas, por ello el nombre de “mixtos”. La mayoría de los cuestionarios poseen la siguiente estructura:  Titulo  Instrucciones  Identificación del encuestado (la identificación no hace referencia al nombre, en muchos estudios las respuestas anónimas suelen ser más objetivas, pero si vamos a aplicar el cuestionario a una población diversa podemos identificarlos por edad, profesión, etc.)  Preguntas  Observaciones En general, en el proceso de recolección de datos los métodos e instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus características propias y la información que se requiera, sin embargo dan flexibilidad para que el investigador determine su uso apropiado según el estudio a realizar. Preparación de los Datos Estadísticos. Una vez recogidos los datos pasamos a su preparación para iniciar el estudio, para poder lograr el análisis estadístico es necesario ordenar los datos y clasificarlos, lo primero que hacemos es revisar los instrumentos de recolección de información aplicados, sobre todos si son cuestionarios llenados por el informante ya que en una entrevista el entrevistador es el que registra las respuestas. Algunos autores proponen que cuando quedan cuestionarios con preguntas sin contestar las llenemos con la respuesta que la mayoría colocó, sin embargo esto se podría considerar poco ético, pues no es la respuesta del encuestado, en ese caso la sugerencia es eliminar ese cuestionario de la muestra. Terminado este proceso pasamos al agrupamiento. En el caso de las entrevistas y cuestionarios con preguntas abiertas debemos crear categorías de acuerdo con los puntos expresados por los entrevistados de tal forma que ninguna opinión o planteamiento se queden sin categoría, pero también de forma que ninguna opinión pueda incluirse en dos categorías, es decir, deben ser mutuamente excluyentes. Una vez bien estructuradas las categorías contamos la frecuencia de aparición de cada categoría en las respuestas dadas. En el caso de ser un cuestionario de preguntas cerradas se contabiliza la frecuencia de aparición de cada respuesta para luego elaborar una tabla con la distribución de frecuencias, tema que ampliaremos más adelante. Razones Proporciones y Porcentajes Ingeniera Jessica Liset Martínez 17

Una de las funciones de la estadística es resumir todos los datos de un conjunto para resaltar sus características más importantes. Una de las formas de realizar esta actividad es relacionando los datos, ya sea entre ellos mismos o con datos similares, es decir, convertir los valores absolutos en valores relativos, ya veremos por qué. Razones La razón (R) es el valor que indica la relación cuantitativa existente entre dos cantidades, por ejemplo: En una ciudad existen 54.000 empleados y 36.000 desempleados, la razón de empleado a desempleado se expresa así:

Siendo A= Nro. De individuos con cierta característica a= Nro. De individuos que no poseen cierta característica La interpretación del ejemplo anterior es que por cada 4 empleados hay 1 desempleado. Al ser la razón un valor relativo no depende de los valores absolutos de los individuos que la forman, ya que por ejemplo en una zona donde hay 90.000 empleados y 10.000 desempleados la razón sigue siendo de 9. Proporción La proporción es una razón, pero su diferencia con las razones anteriores, es que el denominador del cociente es el número total de unidades enunciadas. La proporción se representa con la siguiente fórmula: siendo N= (A)+(a) La proporción contraria sería

Ambas p y q son complementarias y si se suman debe dar igual a 1 p+q=1 Remplacemos las formulas con los datos del ejercicio anterior

Ingeniera Jessica Liset Martínez 18

La proporción de empleados sería de 0,85, y la de desempleados de 0.142. Ambas proporciones son complementarias y si las sumamos da igual a 1 Porcentajes Como vimos en el apartado anterior las proporciones vienen expresadas en valores decimales, esto no es ningún inconveniente, pero cuando se quiere presentar al público los datos utilizar decimales es confuso, por ello se acostumbra a multiplicar las proporciones por 100, para convertir los valores decimales en enteros, es decir, para convertirlos en porcentajes.

Convirtamos pues nuestras proporciones en porcentajes:

¿Cómo interpretamos estos porcentajes? De la misma manera que lo hicimos con la proporción, decimos que 85,7% de las personas están empleadas y el 14,2 % están desempleados. Observemos que si tan sólo damos uno de los dos porcentajes con su respectiva interpretación, el segundo porcentaje no es necesario darlo, pues si decimos que en la cuidad “X” el 85,7% de las personas están empleadas, ya podemos inferir la minoría está desempleada, sin necesidad de manejar el porcentaje exacto. Porcentajes de Cambio Son los que muestran la diferencia entre dos porcentajes; estos pueden ser en aumento o en descenso, veamos sus fórmulas:

Siendo Pa= Porcentaje de aumento Pd= Porcentaje de descenso o disminución Ingeniera Jessica Liset Martínez 19

M= Cantidad mayor m= Cantidad menor Ejemplo: Si sabemos que el excedente de nuestra cooperativa en el año 2004 fue de $100,000,000 y para el año 2005, $ 135,000,000, ¿cuál fue el porcentaje de aumento?

El porcentaje de aumento de nuestro excedente fue de un 35% en un año.

2.2

NOCIÓN DE VARIABLE. CLASIFICACIÓN

Ingeniera Jessica Liset Martínez 20

2.3

ESCALAS ESTADÍSTICAS

Medición: Medición es la cuantificación del atributo de una variable, ¿Qué quiere decir esto? Cuando medimos hacemos una estimación numérica de un objeto, pero no del objeto en sí, medimos los indicadores de sus atributos, para ello contamos con cuatro niveles de medición Niveles de Medición o Escalas de Medición: Los datos se pueden clasificar de acuerdo a cuatro niveles de medición. Los niveles de medición indican que tipo de operación se puede hacer con los datos para resumirlos, presentarlos y determinar que pruebas estadísticas pueden llevarse a cabo con ellos. Existen cuatro niveles de medición: Nominal, ordinal, de intervalo y de razón, estos niveles tienen un orden ascendente el más bajo de la escala es el nominal y el más alto el de razón. Escala Nominal En el este tipo de medición los objetos sólo pueden ser nombrados o contados. No hay un orden, consiste simplemente en clasificar observaciones dentro de ciertas categorías, las cuales deben ser mutuamente excluyentes y colectivamente exhaustivas. Mutuamente excluyentes significa que un individuo, objeto o medición pertenece únicamente a una categoría, y exhaustiva significa que ningún individuo, objeto o medición puede quedar sin categorías por ejemplo: En un nivel de medición ordinal, una categoría que podríamos establecer es el sexo, clasificado en hombre y mujer, por lo que los individuos que observamos sólo pueden pertenecen a un grupo. Si estuviéramos realizando una observación de la imagen de la izquierda diríamos: Hay un hombre y una mujer.

En la medición nominal un mismo objeto de análisis no pueden estar en dos categorías, pero todos tienen que estar en una, no puede haber observación fuera de una categoría. Para que no se nos olvide esta propiedad de la medición nominal atendamos el siguiente ejemplo: En un aula de clases vamos a clasificar las personas por lugar de nacimiento, una misma persona no puede haber nacido en dos lugares, pero tampoco se puede decir que no nació en ningún lado, por lo tanto, todos tenemos que estar en una sola categoría.

Ingeniera Jessica Liset Martínez 21

Ingeniera Jessica Liset Martínez 22

Escala Ordinal El siguiente nivel es el ordinal, en este caso las observaciones además de poder ser clasificadas en categorías, también pueden ser ordenadas por rango, de manera creciente o decreciente. Esto significa que una primera observación puede ser mayor que la segunda, y esta a su vez mayor que la tercera, y así sucesivamente. Sin embargo esto no implica una secuencia de intervalos iguales, atendamos al siguiente ejemplo: Vamos a comprar un vehículo para transportar nuestra mercancía, tenemos tres opciones y los agrupamos de acuerdo a su kilometraje, el primero tiene 25.000Km, el segundo 34.000Km y el último 35.500km, observemos que ordenamos las opciones de menor a mayor según la cantidad de kilómetros, por ello lo “ordinal”, pero hay que resaltar que los intervalos que los separa, o sea la cantidad de kilómetros entre cada carro son diferentes, de 25.000 a 34.000 hay 9 kilómetros de diferencia, mientras que de 34.000 a 35.500 tan sólo hay kilómetro y medio. En la escala ordinal esto no importa. Escala de Intervalo La medición de intervalo posee las características de la ordinal con la salvedad que aquí la distancia entre los rangos son equivalentes, esto quiere decir que los intervalos pueden ser sumados y restados. Por ejemplo, supongamos que hemos medido cuatro calificaciones con una escala de intervalo las cuales son 10, 8, 7 y 5. Con estos datos podemos afirmar que la diferencia entre el primero y el tercero es equivalente a la diferencia entre el segundo y el cuarto, observemos: 10-7=3, 8-5=3, sin embargo no podemos decir que el que sacó 8 tuvo el doble del que sacó cinco, a pesar que la diferencia entre los que sacaron 10 y 7, es igual a la diferencia de los que sacaron 8 y 5 Otra característica resaltante de la medición por intervalos es que este tipo de variables no tiene cero absoluto, esto significa que el atributo que medimos no tiene ausencia. Retomemos el ejemplo de la medición de la temperatura corporal, si empleamos un termómetro y nos tomamos la temperatura podemos decir que tenemos fiebre o no pero, pero el hecho de no tener fiebre no significa que tengamos cero temperatura, por lo tanto aquí el cero (0) es relativo. Otro caso en el que el cero es relativo es el número de calzado, no hay calzado número 0. Si medimos el calzado en medición de intervalo diríamos, en una casa hay cinco miembros familiares que calzan 15, 24, 25, 36 y 48. 25

28

31

37

43

a

b

c

d

e

La diferencia entre a y c= 6, entre b y d= 3 entre c y d=6 entre d y e=6, observemos que la distancia entre a y c, c y d son es equivalente a la de d y e, pero no por ello podemos decir que la persona e tiene el pie tres veces más grande que la persona b.

Ingeniera Jessica Liset Martínez 23

Ingeniera Jessica Liset Martínez 24

Escala de Razón Es el nivel más alto de medición, ella posee todas las características de las escalas anteriores, con la diferencia de que aquí el cero si es absoluto, es decir, la presencia del cero indica la ausencia del atributo observado. Un buen ejemplo de un cero absoluto es la velocidad, si detenemos un vehículo la velocidad es cero, porque hay ausencia de velocidad. Pero a medida que comenzamos a acelerar el vehículo podemos decir que si vamos a 30 kilómetros recorreremos la mitad del camino que un carro que va a 60. En la medición de razón la distancia entre los rangos son exactamente iguales. Veamos otro ejemplo: Las medidas de la regla, el cero indica la ausencia de medida, pero la distancia del 0 al 1, ó del 1 al 2 es la misma que la del 2 al 3 ó la del 3 al 4, y así sucesivamente, entre cada rango hay la misma diferencia.

2.4

DISTRIBUCIÓN DE FRECUENCIAS En muchas ocasiones habrás observados tablas como esta: Edades (en años) 1a5 6-10 11-15

Frecuencia 26 44 32

Esta tabla se denomina Distribución de Frecuencias. La estadística descriptiva utiliza la distribución de frecuencias para organizar y presentar los datos. Lo deseable es que logremos determinar de forma correcta las distancias de los intervalos que usaremos para agrupar nuestros datos. Distribución de Frecuencias: Es un agrupamiento de datos en categorías mutuamente excluyentes en el cual se registran la cantidad de veces que se ha observado cada categoría. Ahora te preguntarás ¿Cómo elaboro una distribución de frecuencias?, la forma más fácil de aprenderlo es a través de un ejemplo: Observemos el siguiente grupo de números y supongamos que son la cantidad de viajes que realiza cada día durante un mes la aerolínea Conviasa 15 12 10 8 20 Ingeniera Jessica Liset Martínez 25

14 10 12

13 20 15

12 17 8

9 18 9

13 19 10

En esa tabla de datos buscamos el valor mayor y el menor, para determinar la cantidad de clases, para ello utilizamos la fórmula 2k, empleándola de la siguiente manera, en los vuelos de Conviasa n = 20, asignemos a k un valor arbitrario, por ejemplo 4, 24=16 si n = 20, 4 clases no cubrirían todos los datos, probemos con k=5, 25=32, es mayor que 20, cubriríamos completamente a n, por lo que deberíamos conformar 5 clases. Ahora vamos a calcular la amplitud del intervalo, recordando que debe ser el mismo para todas las clases, y que deben abarcar desde el dato menor hasta el mayor, lo calculamos a través de la siguiente fórmula:

En la que i es el intervalo de la clase, H el mayor número observado, L el menor valor observado y k el número de clases:

Redondeamos a 2 que será el tamaño de nuestros intervalos, recordemos que debemos tener 5 clases. Ahora organicemos nuestros datos: Cantidad de Vuelos 8 a 11 11 a 13 14 a 16 17 a 19 20 a 22

Frecuencia (f) 7 5 3 3 2

Ya construimos nuestra distribución de frecuencias, es bueno acotar que el punto medio de la clase se haya en el punto medio entre el límite superior y el límite inferior, en el primer intervalo el punto medio entre 8 y 10 es 9. 9 es el punto medio de la primera clase. También podemos tener distribuciones de frecuencia relativa, que es la frecuencia absoluta entre la cantidad total de observaciones (n): Días al Mes Cantidad de Vuelos Frecuencia relativa Frecuencia (f) 8 a 10 7 7/20 0,35 11 a 13 5 5/20 0,25 14 a 16 3 3/20 0,15 17 a 19 3 3/20 0,15 20 a 22 2 2/20 0,10 Total 20 20/20 1 Ingeniera Jessica Liset Martínez 26

Con la frecuencia relativa obtenemos la fracción del número total de observaciones, y si lo multiplicamos por 100 los porcentajes. Si interpretamos el cuadro anterior según su frecuencia relativa podíamos decir que el 35 % de los días del mes Conviasa realiza entre 8 y 10 vuelos. ¿Que son las distribuciones de frecuencias? y ¿cómo hacerlas? Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de ciertas características de algunas situaciones. Por lo demás, el conocimiento de las tendencias adquirido con la experiencia permite conocer los posibles resultados y planear con anticipación. Los datos estadísticos se obtienen mediante un proceso que comprende la observación o medición de conceptos, como ingresos anuales de una comunidad, calificaciones de exámenes, resistencia a la rotura de las fibras de plástico, etc., a menudo son tan numerosos que carecen de utilidad a menos que sean condensados o reducidos a una forma más adecuada. Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y obtener información directamente de ellos; otras veces solo habrá que agruparlos y presentarlos en forma gráfica o tabulada, aquí el uso de las tecnologías computacionales es mucha utilidad y rapidez. DATOS AGRUPADOS Cuando la muestra consta de más de 30 datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada. Los datos agrupados se pueden resumir gráficamente, o en tablas, y mediante el uso de medidas numéricas, como la media, la amplitud, la desviación estándar, y otras más. El nombre que reciben los datos ordenados en grupos o categorías es el de distribución de frecuencia. Distribución de frecuencia Una forma de sintetizar los datos consiste en valerse de una tabla o distribución de frecuencia. Tomemos como ejemplo el inventario promedio en días de 20 tiendas de conveniencia. En las siguientes tablas se han incluido datos idénticos referentes al inventario promedio y se han dispuesto primero como un arreglo en orden ascendente y luego como una distribución de frecuencia. Para obtener la tabla 2 se tuvo que dividir los datos en grupos de valores semejantes. Después se registraron el número de puntos graficados (observaciones) de datos que caían dentro de cada grupo. Ingeniera Jessica Liset Martínez 27

TABLA 1: Arreglo de datos del inventario promedio (en días) de 20 tiendas de artículos de conveniencia 2.0 3.4

3.4 3.8

3.8 4.0

4.1 4.1

4.1 4.2

4.3 4.7

4.7 4.8

4.9 4.9

5.5 5.5

5.5 5.5

TABLA 2: Distribución de frecuencia del inventario promedio (en días) de 20 tiendas de artículos de conveniencia (6 clases) Clase (grupo de observaciones de Frecuencia (número de datos con valores semejantes) observaciones en cada clase) 2.0 a 2.5 1 2.6 a 3.1 0 3.2 a 3.7 2 3.8 a 4.3 8 4.4 a 4.9 5 5.0 a 5.5 4 Nótese que perdimos un poco de información al construir la distribución de frecuencia, por ejemplo ya no sabemos que el valor 5.5 aparece cuatro veces o que el valor 5.1 no parece en absoluto. Pero por otra parte, adquirimos información concerniente al patrón de los inventarios promedio. La distribución de frecuencia es una tabla que organiza los datos en clases; es decir, en grupos de valores que describen una característica de los datos. El inventario promedio es una característica de las 20 tiendas de conveniencia. Una distribución de frecuencia muestra el número de observaciones provenientes del conjunto de datos que caen dentro de cada una de las clases. Si podemos determinar la frecuencia con que ocurren los valores en cada clase de un conjunto de datos, estaremos en condiciones de construir una distribución de frecuencia. Características de las distribuciones de Frecuencia relativa Hasta ahora se ha expresado la frecuencia con que ocurren los valores en cada clase como el número total de observaciones que caen en dicha clase. También se puede expresar la frecuencia de cada valor como una fracción o porcentaje del número total de observaciones. La frecuencia de un inventario promedio, digamos de 4.4 a 4.9, es 5 en la tabla 2 y de 0.25 en la tabla 3. Para obtener este último valor, dividimos la frecuencia de esta clase (5) entre el número total de observaciones en el conjunto de datos (20). La respuesta puede expresarse como una fracción ( Ingeniera Jessica Liset Martínez 28

), un decimal

(0.25) o un porcentaje (25%). Una distribución de frecuencia relativa presenta las frecuencias en fracciones o porcentajes. TABLA 3: Distribución de frecuencia relativa del inventario promedio (en días) de 20 tiendas de artículos de conveniencia. CLASE 2.0 a 2.5 2.6 a 3.1 3.2 a 3.7 3.8 a 4.3 4.4 a 4.9 5.0 a 5.5 Total

FRECUENCIA 1 0 2 8 5 4 20

Frecuencia relativa: 0.05 0.00 0.10 0.40 0.25 0.20 1.00

La suma de todas las frecuencias relativas es de 1.00 o 100 %. Esto sucede porque una distribución de frecuencia relativa parea cada clase con su fracción o porcentaje correspondiente de los datos totales. Por lo anterior, las clases en cualquier distribución de frecuencia simple o relativa son exhaustivas. Todos los datos encajan en una u otra categoría. Observe también que las clases son mutuamente excluyentes; es decir, ninguna observación cae dentro de más de una categoría. Clases discretas. Los esquemas de clasificación pueden ser cualitativos o cuantitativos y discretos o continuos. Las clases discretas son entidades individuales que no pasan de una clase a la siguiente sin una ruptura. Son discretas las siguientes clases: el número de hijos de las familias, el número de camiones que poseen las compañías transportistas, las ocupaciones de los graduados universitarios. Los datos continuos pueden pasar de una clase a la siguiente sin ruptura alguna. Contienen una medida numérica como el peso de unas latas de tomates, los kilogramos de presión sobre el concreto, o el promedio de calificaciones de los universitarios el último semestre. Construcción de una distribución de Frecuencia Ahora que hemos aprendido a dividir una muestra en clases, ya se está en condiciones de tomar datos brutos y construir una distribución de frecuencia. A continuación tomaremos el siguiente ejemplo para el desarrollo de la distribución de frecuencia: EJEMPLO 1: Un ingeniero de control de calidad del agua en Charlotte (North Carolina) es responsable del nivel de cloración del agua. Dicho nivel ha de acercarse bastante al que exige el departamento de salubridad. Para vigilar el cloro sin necesidad de verificar cada galón de agua que sale de la planta, el ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y Ingeniera Jessica Liset Martínez 29

extrae una conclusión sobre el nivel promedio de cloración que tiene el agua tratada de ese día. La tabla anexa muestra las concentraciones de cloro de 30 galones seleccionados como muestra de un día. Estos niveles son los datos brutos de donde el ingeniero saca sus conclusiones respecto a la población total a la que se aplicó la cloración ese día. TABLA 4: Concentraciones de cloro en partes por millón (ppm) en 30 galones de agua tratada. 16.2 15.7 16.4

15.4 16.4 15.8

16.0 15.2 15.7

16.6 15.8 16.2

15.9 15.9 15.6

15.8 16.1 15.9

16.0 15.6 16.3

16.8 15.9 16.3

16.9 15.6 16.0

16.8 16.0 16.3

Para analizar los datos de esta tabla seguiremos los siguientes pasos: 

Escoger el tipo y número de clases para dividir los datos. En este caso, ya se ha optado por clasificar los datos según la medida cuantitativa del número de ppm del cloro en el agua tratada, en vez de hacerlo a partir de un atributo cualitativo como color o el olor del agua. Después necesitamos decidir cuántas clases utilizar y el intervalo (la distancia que debe comprender cada clase).

El número de clases por utilizar depende principalmente del número de observaciones en los datos. Esto es, un número mayor de observaciones requiere un mayor número de grupos de clase. En general la distribución de frecuencia debe tener al menos cinco clases pero no más de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendrá poca información. A continuación se muestra una tabla que nos puede ser útil para seleccionar el número de clases, aclarando que esta designación no es obligatoria y puede ser a decisión del analista... TAMAÑO DE MUESTRA O N° DE DATOS

NUMERO DE CLASES (K)

Menos de 50 50 a 99 100 a 250 250 en adelante

5a7 6 a 10 7 a 12 12 a 15

Para designar el número de clases usaremos la letra K, para este ejemplo se usará K= 6 clases. Es deseable que el ancho da cada agrupamiento de clase (intervalo del inicio de una clase al inicio de la siguiente) sea igual. Para determinar el ancho de cada clase, el alcance de los datos de divide entre el número de agrupamientos de clase deseado:

Ingeniera Jessica Liset Martínez 30

=

La amplitud o ancho del intervalo se calcula: Ya se ha terminado el paso 1. Se han clasificado los datos según la media cuantitativa de cuantas ppm se encuentran en el agua tratada. Se escogieron seis clases para cubrir el intervalo de 15.2 a 16.9 y en consecuencia se utilizará 0.3 ppm como el ancho de los intervalos de clase. 

Clasificar los puntos de datos en clases y contar el número de puntos en cada clase: Esta información aparece en la tabla 5. Toda observación de datos encaja por lo menos en una clase y ninguna observación lo hace en más de una clase. Por lo que nuestras clases son exhaustivas y mutuamente excluyentes. Observe que el límite inferior de la primera clase corresponde a la menor observación de datos de la muestra, y que el límite superior de la última clase corresponde a la observación mayor de los datos.

TABLA 5: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3 ppm FRECUENCI CLASE A 15.2 - 15.4 2 15.5 - 15.7 5 15.8 - 16.0 11 16.1 - 16.3 6 16.4 - 16.6 3 16.7 - 16.9 3 30 

Mostrar las observaciones en una gráfica. Véase la figura siguiente.

Ingeniera Jessica Liset Martínez 31

12

11

10 8 Frecuencia

6

6

5

4

3

3

2

2 0

15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9

Fig. 1 Histograma de Frec. Absoluta EJEMPLO 2: Construir un histograma con la siguiente serie de datos: 2.41 3.34 4.04 4.46 8.46 9.15 11.59 12.73 13.18 15.47 16.20 16.49 17.11

17.87 18.03 18.69 19.94 20.20 20.31 24.19 28.75 30.36 30.63 31.21 32.44 32.89

33.51 33.76 34.58 35.58 35.93 36.08 36.14 36.80 36.92 37.23 37.31 37.64 38.29

38.65 39.02 39.64 40.41 40.58 40.64 43.61 44.06 44.52 45.01 45.08 45.10 45.37

45.70 45.91 46.50 47.09 47.21 47.56 47.93 48.02 48.31 48.55 48.62 48.98 49.33

49.36 49.95 50.02 50.10 50.10 50.72 51.40 51.41 51.77 52.43 53.22 54.28 54.71

55.08 55.23 55.56 55.87 56.04 56.29 58.18 59.03 59.37 59.61 59.81 60.27 61.30

62.53 62.78 62.98 63.03 64.12 64.29 65.44 66.18 66.56 67.45 67.87 69.09 69.86

70.37 71.05 71.14 72.46 72.77 74.03 74.10 76.26 76.69 77.91 78.24 79.35 80.32

81.21 82.37 82.79 83.31 85.83 88.67 89.28 89.58 94.07 94.47 94.60 94.74 96.78

Paso 1: Contar el número de datos n = 130 Paso 2: Calcular el rango R = Valor mayor – Valor menor, R = 96.78-2.41 = 94.37. Generalmente los datos no están ordenados por lo cual resulta conveniente ordenarlos de menor a mayor para tener una mejor visualización. En el ejemplo los datos ya han sido previamente ordenados. Paso 3: Seleccionar el número de columnas, mediante histograma se compone de 11 columnas

Ingeniera Jessica Liset Martínez 32

=

. Por lo cual el

Paso 4: Calcular el tamaño del intervalo de clase (C), dividiendo el rango entre el número de columnas: C =

, resultando el tamaño del intervalo 9.

Paso 5: Calcular los límites de clase de cada intervalo: [0-8], [9-17], etc., considerando que el tamaño del intervalo representa la diferencia entre dos límites de clase adyacentes ya sean inferiores o superiores. Paso 6: Contar el número de valores que caen en cada intervalo utilizando una hoja de registro, de esta manera se obtiene la frecuencia para cada intervalo. Columna 1 2 3 4 5 6 7 8 9 10 11

Intervalo 0 -8 9-17 18-26 27-35 36-44 45-53 54-62 63-71 72-80 81-89 90-98

Registro de frecuencias IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII

IIII I IIIII IIIII IIIII IIIII IIIII IIIII III

I II IIIII IIIII III

IIIII III

Paso 7: Basándose en los datos anteriores construya el histograma.

Ingeniera Jessica Liset Martínez 33

IIIII

III

5 9 6 11 17 28 18 13 10 8 5

2.5

PRESENTACIÓN, TABULAR Y GRAFICAR

A parte de la distribución de frecuencias los datos pueden también pueden ser presentados en gráficos contentivos de los mismos datos que expresamos en la distribución de frecuencias. Seguro te preguntarás ¿Y si tienen los mismos datos para que hacerlos? La respuesta es que el gráfico permite apreciar de forma más rápida los datos obtenidos, ya lo comprobaremos más adelante. Existen una gran variedad de gráficos, primero conoceremos los dos más empleados en administración, también mencionaremos otros tipos de gráficos de mucha utilidad, sin embargo te invito a ampliar sobre este tema a través de un arqueo bibliográfico.

Histograma: Es uno de los gráficos utilizados mayormente empleado para representar una distribución de frecuencias Histograma: Gráfica en la que las clases se indican en el eje y (horizontal) y las frecuencias de la clase por eje x (vertical). Las frecuencias quedan representadas en el gráfico por la altura de las barras, la que se trazan una al lado de la otra.

Ingeniera Jessica Liset Martínez 34

Ingeniera Jessica Liset Martínez 35

Polígono de frecuencia Un polígono de frecuencia es perecido al histograma. Consiste en segmentos de línea que se conectan por los puntos formados por la intersección del punto medio de la clase y de la frecuencia de clase. La elaboración de un polígono de frecuencias se hace colocando los puntos medios de cada clase en el eje x y la escala en el eje y, es decir, las frecuentas de clase. Recordemos que el punto medio representa los valores de cada clase. El histograma y el polígono de frecuencia nos permiten tener una visión de las principales características de un conjunto de datos, a pesar de tener ambos el mismo propósito, el histograma tiene la ventaja de representar cada frecuencia como un rectángulo que además incluye ambos valores del intervalo. Por su parte el polígono de frecuencia tiene una ventaja sobre el histograma, permite comparar dos distribuciones de frecuencia a la vez, y si por ejemplo queremos hacer un gráfico con los gastos de tres años con una misma distribución de frecuencias, fácilmente lo podemos hacer. 100 90 80 70 60 50 Este Oeste 40 30 20 10 0 1er trim . 2do trim . 3e r trim .

Norte

4to trim .

Otras presentaciones gráficas de datos Gráfica por medio de línea. Las gráficas por medio de línea son muy útiles en la administración porque podemos mostrar el cambio de una variable en el tiempo, es decir, si queremos ver la cantidad de unidades vendidas de un producto que fabricamos en nuestra organización, este gráfico es la mejor opción. Para su elaboración colocamos la variable, que continuando con nuestro ejemplo de Conviasa, sería cantidad de vuelos diarios sobre el eje y y el tiempo sobre el eje x.

Ingeniera Jessica Liset Martínez 36

Gráfico de Barras. Es un gráfico muy versátil, en él se puede graficar cualquier tipo de variable y en cualquier nivel de medición. Las barras pueden ser verticales u horizontales, y tampoco hay mayor inconveniente en la distribución de los datos a través de los ejes del plano cartesiano. 100 90 80 70 60 50 40 30 20 10 0

Este

1e r trim . 2do trim . 3er trim . 4to trim .

Seguramente te preguntarás ¿En qué se diferencian los histogramas del gráfico de barras? Se diferencian en algo que podría parecer tonto, pero no, y es en la separación que existe entre las barras. Los histogramas poseen sus barras continuas porque sus datos son de intervalo o de razón, mientras que en los gráficos de barra al poder admitir cualquier nivel de medición cada barra representa una variable que puede ser cualitativa o cuantitativa. Diagrama Circular: El diagrama circular, muy reconocido por gráfico de torta es especial para representar porcentajes. El diagrama circular convierte los 360 grados del círculo en el 100% de la variable que estamos representando. Este es un gráfico muy de muy fácil lectura, pues las líneas que cortan la circunferencia permiten, rápidamente, ver qué clase de la variable tiene el mayor porcentaje.

1

15% 15%2

10%

35% 3 25%

4

5

Graficación de las distribuciones de Frecuencia. Las gráficas de distribución de frecuencia y de distribución de frecuencia relativa son útiles porque ponen de manifiesto y aclaran las tendencias que no se captan fácilmente en las tablas. Atraen la atención del lector sobre las tendencias de los datos. Ingeniera Jessica Liset Martínez 37

Histogramas La figura 1 es otro ejemplo de un histograma. El histograma es una serie de rectángulos, todos ellos de anchura proporcional a la gama de valores dentro de una clase y también de altura proporcional a los elementos que caen dentro de la clase. Si las clases que empleamos en la distribución de frecuencia tienen el mismo ancho, las barras verticales del histograma lo tendrán también. La altura de la barra de cada clase corresponde al número de elementos de esta última. Un histograma que se sirve de la frecuencia relativa (tabla 6) de las observaciones de datos en cada una de las clases y no del número real de observaciones recibe el nombre de Histograma de frecuencia relativa (fig. 2). Este tiene la misma forma que un histograma de frecuencia absoluta hecho con el mismo conjunto de datos. La única diferencia entre el histograma de frecuencia absoluta y el de frecuencia relativa, es la escala vertical de la izquierda, en el primero es el número absoluto de observaciones en cada clase y en el segundo es el número de observaciones en cada clase como una fracción del número total de ellas. TABLA 6: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3 ppm usando la frecuencia relativa. CLASE FRECUENCIA FREC. REL. 15.2 - 15.4 2 0.067 15.5 - 15.7 5 0.167 15.8 - 16.0 11 0.367 16.1 - 16.3 6 0.200 16.4 - 16.6 3 0.100 16.7 - 16.9 3 0.100 Total 30 1.000 Fig. 2 Histograma de Frec. Relativa HISTOGRAMA DE FRECUENCIA RELATIVA

0.400

0.367

0.350 0.300 0.250

0.200

PORCENTAJE 0.200

0.167

0.150 0.100

0.100

0.100

0.067

0.050 0.000 15.2 - 15.415.5 - 15.715.8 - 16.016.1 - 16.316.4 - 16.616.7 - 16.9

Ingeniera Jessica Liset Martínez 38

Polígono de frecuencias Aunque de menor uso, los polígonos de frecuencias son otro medio de representar gráficamente tanto las distribuciones de frecuencia simples como las de frecuencia relativa. Para construir un polígono de frecuencias, marcamos las frecuencias sobre el eje vertical y los valores de la variable que vamos a medir las marcamos sobre el eje horizontal, tal como lo hicimos con los histogramas. El siguiente paso consiste en graficar cada frecuencia de clase dibujando un punto sobre su marca de clase, o punto medio, y conectar los puntos consecutivos con una recta para formar un polígono (figura de muchos lados). A continuación en la tabla 7 se muestran los datos de una distribución de frecuencias para elaborar un polígono. TABLA 7: Datos de la concentración de cloro en ppm (distribución de frecuencia) para graficar polígono de frecuencias.

CLASE

FRECUENCIA CENTRO CLASE

0 15.0 15.2 - 15.4 2 15.3 15.5 - 15.7 5 15.6 15.8 - 16.0 11 15.9 16.1 - 16.3 6 16.2 16.4 - 16.6 3 16.5 16.7 - 16.9 3 16.8 0 17.1 30 En la figura 3 se muestra un polígono de frecuencias construido con los datos de la tabla 7. Si comparamos esta figura con las figuras anteriores vemos que se han agregado clases en cada extremo de la escala de valores observados. Estas dos nuevas clases contienen cero observaciones, pero permiten al polígono alcanzar el eje horizontal en ambos extremos de la distribución.

Ingeniera Jessica Liset Martínez 39

POLIGONO DE FRECUENCIAS

12 10 8 FRECUENCIA

6 4 2 0 15

15.3 15.6 16.200000000000003 15.9 16.799999999999986 16.5 17.100000000000001

Concentración de cloro en ppm FIG. 3 Polígono de frecuencias

El polígono es simplemente una gráfica lineal que une los puntos medios de todas barras en un histograma. Se llama polígono de frecuencias relativas a aquel que usa la frecuencia relativa de los puntos de datos en cada clase y no el número real de puntos. Ojivas Una distribución de frecuencia acumulativa nos permite ver cuántas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los números de elementos dentro de los intervalos. Por ejemplo, si queremos saber cuántos galones contienen menos de 17.0 ppm, podemos servirnos de una tabla que incluya frecuencias acumulativas “menores que” en nuestra muestra como se observa en la tabla 8. Se llama ojiva a la gráfica de una distribución de frecuencia acumulativa. La ojiva de una distribución de este tipo se muestra en la figura 4. Los puntos graficados representan la cantidad de galones que tienen menos cloro que las partes por millón indicadas sobre el eje horizontal. TABLA 8: Distribución de frecuencia acumulativa “menor que” de las concentraciones de cloro en ppm

CLASE

FRECUENCIA ACUMULATIVA

Menor que 15.2 Menor que 15.5 Menor que 15.8 Menor que 16.1 Menor que 16.4 Menor que 16.7 Menor que 17.0

0 2 7 18 24 27 30

FIG. 4 Ojiva “menor que” de la distribución de las concentraciones de cloro en ppm para 30 galones de agua tratada.

Ingeniera Jessica Liset Martínez 40

No . Ac um ulati vo d e ga l. mu est read os Con cent ració n d e clo ro e n pp m

En ocasiones la información que se utiliza se presenta a partir de frecuencias “mayores que”. La ojiva apropiada para tal información tendrá una pendiente hacia abajo y hacia la derecha. También es posible construir una ojiva de una distribución de frecuencia relativa, de la misma manera que una absoluta. El alumnado deberá practicar tanto en forma manual como con el uso de la tecnología la elaboración de gráficos estadísticos.

UNIDAD 3: “ANÁLISIS ESTADÍSTICO”

Ingeniera Jessica Liset Martínez 41

3.1

MEDIDAS DE TENDENCIA CENTRAL.

Las medidas de tendencia central tienen como propósito hallar con toda precisión el centro de un conjunto de observaciones Mediana: Observación de la mitad de los datos después de que se han colocado de forma ordenada

Media Geométrica: Es una medida que calcula los promedios de los porcentajes

Media Aritmética: Es una medida de tendencia central que se obtiene dividiendo la suma de los valores del conjunto de datos entre el número total de éstos. Media Ponderada: Es un caso especial de media aritmética pero cuando todos los datos tienen diferentes valores o ponderaciones que los discrimina según su importancia

Moda: Es el valor que más se repite dentro de su conjunto, es decir, posee mayor frecuencia

Medidas de Tendencia Central para datos Simples Mediana y Moda 

Mediana: La mediana o media posicional queda en la mitad un grupo de elementos ordenados de forma ascendente o descendente. En este caso la mitad de los números estará por debajo de la mediana y la otra mitad por encima de ella. La mediana se obtiene con la siguiente ecuación:

Ingeniera Jessica Liset Martínez 42

Si el grupo de datos es impar la mediana se calcula así de la siguiente forma. Ejemplo: Calculemos la mediana de los kilos (ordenados de forma ascendente) de materia prima utilizadas durante esta semana: 33, 36, 40, 45, 57,60 y 68.

La mediana es el valor que está en la posición 4: 33, 36, 40, 45, 57,60 y 68. Si el grupo de datos es par, aplicamos la misma ecuación promediando los dos valores centrales, observemos el ejemplo: Datos: 10, 15, 18, 25, 31, 36, 45, 60, 77, 80

El punto 5.5 estaría entre los valores de las posiciones 5 y 6, por lo buscamos ambos valores y los promediamos 10, 15, 18, 25, 32, 36, 45, 60, 77, 80

La mediana es 43. 

Moda: Es la medida de tendencia central más fácil de recordar ya verás por qué: ¿Por qué sabemos que algún producto está de moda?

Ingeniera Jessica Liset Martínez 43

Seguramente responderás… Por qué lo usan muchas personas, o porque lo vemos frecuentemente en la calle, y efectivamente eso es la moda, el dato que más se repite dentro de nuestro conjunto de elementos. Veamos este ejemplo: Edades de los niños de nuestra familia: 12, 1, 10, 1, 10, 2, 5, 7, 8, 9, 10, 11. El número que más se repite es el 10, a pesar del que el 1 también se repite, el 10 se repite mayor número de veces.

Medidas de Tendencia Central para Datos Agrupados Antes de avanzar, es correcto aclarar que las definiciones de nuestras medidas de tendencia central se mantienen, a continuación se te presentan una comparación de estas medidas. Relación entre Media, Mediana y Moda

En las distribuciones simétricas la media, la mediana y la moda coinciden en el valor, mientras que en un

Ingeniera Jessica Liset Martínez 44

Se puede decir entonces que la media o promedio, la mediana y la moda, brindan información, aunque limitada del comportamiento de los datos; de estas medidas la más usada es la media, luego la mediana y por último la moda, por su misma naturaleza esto se explica. 3.1.1

La Media Aritmética.

Para aproximar la media aritmética de datos organizados en una distribución de frecuencias, comenzamos por asumir que las observaciones de cada clase están representadas por el punto medio de la clase. La media de una distribución de frecuencias se calcula así:

En donde: = media aritmética X= valor o punto medio de cada clase f= frecuencia de cada clase fX= frecuencia en cada clase por el punto medio de la clase = suma de estos productos n= número total de frecuencias Ejemplo: Calculemos la media del precio de venta de los vehículos del plan de una empresa X. Precio de Venta de vehículos (millones de bolívares)

Frecuencia

18 a 23 23 a 28 28 a 33 33 a 38 38 a 42 Total

25 28 26 17 13 109

Al precio de venta medio de los vehículos puede estimarse a partir de datos agrupados en una distribución de frecuencias, lo primero que debemos calcular es el punto medio de cada clase, para eso le calculamos el promedio: (18+23)/2=20.5 luego ese valor medio se multiplica por la frecuencia, como se muestra en la siguiente tabla: Precios de venta 18 a 23 23 a 28 28 a 33 33 a 38 38 a 43 Total

Frecuencia (f) 25 28 26 17 13 109

Ingeniera Jessica Liset Martínez 45

Punto Medio (PM) 20.5 25.5 30.5 35.5 40.5

f*PM 512.5 714 793 603.5 526.5 3,149.5

En este caso X = PM

Decimos entonces que la media del precio de venta del plan de la empresa X es de 28,800,000. Definición: La media aritmética o media es la medida de tendencia central que frecuentemente llamamos promedio, consiste en la suma de los valores del grupo de datos dividida entre la cantidad de valores. La media aritmética de una población se representa con el símbolo aritmética de una muestra se representa con el símbolo siguientes:

(mu), y la media

(equis barra) y sus fórmulas son las

Siendo: La sumatoria d todos los datos N Población n Muestra Ambas fórmulas son idénticas, con la única diferencia que en el primer caso trabajamos con la población entera y en el segundo con una muestra. Ejemplo: Durante cada hora de trabajo de un día una cooperativa produce las siguientes cantidades de artículos de limpieza: 14, 19, 20, 15, 12, 18, 16, 10. ¿Cuál es el número medio de unidades producidas?

El número medio de producción es de 15.5 artículos de limpieza, pero si retomamos los contenidos estudiados en la primera unidad, la cantidad de artículos producidos en un variable discreta, ya que si estuviésemos hablando de jabones de baño no podemos decir que fabricamos 15 jabones y dejamos hecho la mitad del siguiente, por lo tanto aquí aplicamos una regla que se denomina redondeo.

El redondeo de un número consiste en que una o varias de sus cifras finales (de izquierda a derecha) se substituyen por ceros o se ascienden o descienden si ese último número es mayor o menor que 5 Ingeniera Jessica Liset Martínez 46

De tal forma que de 15.5 redondeamos el número decimal, como 5 es por exceso convertimos el 15.5 en 16.

a 5 redondeamos

Propiedades de la Media Aritmética:  Para calcular la media se toman todas los valores  Un conjunto de datos sólo tiene una media. La media es única  La media es una medida útil para comparar dos o más poblaciones  La media aritmética es la única medida de posición en la que las suma de las desviaciones de los valores de la media es siempre cero: Ejemplo: La media de 3, 8 y 4 es 5

Media Ponderada La media ponderada o promedio ponderado es una media aritmética en al que cada uno de los valores se le pondera de acuerdo a su importancia con el grupo general. Las fórmulas de media ponderada poblacional y muestral son idénticas: ó Dónde: Media Ponderada X Observación individual W Peso o ponderación asignada a cada observación Cuando calculamos la media aritmética no sale a discusión si cada uno de los datos tiene igual importancia, sin embargo en ciertos casos puede ocurrir que determinados datos tengan más valor que otro de su mismo conjunto, observemos el siguiente ejemplo: Un estudiante obtuvo las siguientes calificaciones en su curso de estadística I: 19, 20, 18 y 16. Sin embargo dentro de los porcentajes la tercera calificación es la que tiene mayor ponderación o mayor valor, debido a que representaba el 30 % de la calificación final, a continuación se reflejan los datos en la siguiente tabla: Calificaciones Ponderación XW 19 1 19 20 1 20 18 3 54 16 1 16 6 109 Ingeniera Jessica Liset Martínez 47

El promedio ponderado de calificaciones de este estudiante es de 18.16 puntos. 3.1.2

La Mediana

La mediana es el valor por debajo del cual se encuentran una mitad de los valores y por encima del cual se encuentra la otra mitad. Como los datos están organizados en una distribución de frecuencias, se ha perdido algo de información. Así no podemos calcular la mediana exacta, sin embargo, se puede estimar de la siguiente manera:

Dónde: L= Límite inferior de la clase que contiene la mediana. n= Número de frecuencias. f= frecuencia en la clase mediana. CF= número de las frecuencias acumuladas en las clases que preceden a la clase que contiene la mediana. i= amplitud de la clase en la que se encuentra la mediana. Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos calcular la frecuencia acumulada, que no es más que la suma acumulada de las frecuencias de cada clase o categoría, veámoslo en la siguiente tabla:

Precios de Venta 18 a 23 23 a 28 28 a 33 33 a 38 38 a 43 Total

Frecuencia (f) 25 28 26 17 13 109

Frecuencia Acumulada 25 53 79 96 109

Debemos localizar en cual clase se encuentra la mediana, para eso dividimos el total de la frecuencia entre 2, =190/2=54,5. Ahora buscamos en la frecuencia acumulada el grupo de intervalos que tenga a este número: Precios de Venta 18 a 23

Frecuencia (f) 25

Ingeniera Jessica Liset Martínez 48

Frecuencia Acumulada 25

23 a 28 28 a 33 33 a 38 38 a 43 Total

28 26 17 13 109

53 79 96 109

Podemos apreciar fácilmente que el tercer grupo de intervalos es el que posee al número en la posición 54,5 debido a que el anterior sólo llega hasta el número 53, observemos este diagrama. 53

79

28.000.000 Sustituyamos ahora los valores:

33.000.000

Mediana

La mediana del precio de venta es 28,288,000. Si comparamos la mediana con la media aritmética se nos presenta una diferencia, pero recordemos que… No podremos determinar una mediana exacta porque hemos perdidos datos en el proceso de agrupación 3.1.3

La Moda

Siendo la moda el valor con más frecuencia, sólo debemos buscar dentro de nuestra distribución de frecuencias los intervalos con mayor cantidad de frecuencia, revisemos la tabla de precios de venta del Plan Empresa X. Precios de Venta 18 a 23 23 a 28 28 a 33 33 a 38 38 a 43 Total

Frecuencia (f) 25 28 26 17 13 109

El intervalo de 23 a 28 millones es que tiene mayor cantidad de observaciones, por lo tanto para determinar la moda calculamos el punto medio de la clase: 23+28/2=25,5; por lo tanto la moda del precio de venta es 25,500,000. Ingeniera Jessica Liset Martínez 49

3.1.4

La Media Armónica

Media Armónica (H): Cuando los datos a promediarse están medidos en unidades expresadas en forma de cocientes (km./hr., $/lt, etc.), lo más adecuado es utilizar la media armónica, ya que la media aritmética nos llevará a un promedio equivocado. Datos No Agrupados:

Ejemplo: Si un vehículo se mueve de la ciudad A, a la B a 65 Km./hr y regresa de B a A, a 98 Km./Hr a qué promedio se desplazó.

Datos Agrupados:

Dónde: k = última clase Nota: Se puede demostrar que . También puede calcularse la media armónica ponderada. Ejemplo: Supóngase que una flotilla de vehículos muestra la siguiente información: Velocidad promedio en km/hr 50 60 75 La respuesta es:

Ingeniera Jessica Liset Martínez 50

Número de vehículos 15 28 31

3.1.5

La Media Geométrica

La media geométrica es útil para encontrar el promedio de porcentajes, proporciones, índices o tasas de crecimiento. Tiene mucha aplicación en el comercio y en la economía debido a que nos interesa encontrar el porcentaje de cambio en ventas, salarios o cualquier otro dato económico. La media de un conjunto n de números positivos se define como la n-ésima raíz del producto de los n valores. La fórmula de la media geométrica se escribe así:

La mayoría de las calculadoras pueden calcular la raíz enésima de cualquier número La media geométrica será siempre menor o igual a la media aritmética, pero nunca mayor. Ejemplo: Un empleado gana 700.000 bolívares al mes, este año va a recibir un 5% de aumento y el próximo año un 15%, si sacamos la media aritmética de estos de ambos porcentajes nos daría un promedio de 10%, pero el verdadero promedio es 9, 886. Empleemos la fórmula de media geométrica:

Verifiquemos: si el trabajador del que hablábamos gana Bs. 650,000 con los dos aumentos su sueldo quedará: 650.000 * 0,05= 32.500 682.000 * 0,15= 102.370 Total con el aumento 784.870 bolívares Ahora realicemos el cálculo con nuestra media geométrica 700.000*0,09886=64.259 714.259*0,09886=70.611,6 Total = Bs.784.870 Media Geométrica para Datos Agrupados La media geométrica para datos agrupados se determina con la siguiente ecuación: Donde X= punto medio de los intervalos f = frecuencia Recuerda La media geométrica se calcula para promedios de porcentajes

Ingeniera Jessica Liset Martínez 51

Datos No Agrupados:

Ejemplo: Si los precios de la acción “Anáhuac” en los últimos cuatro días fueron; 4.75, 5.23, 4.78 y 6.32 calculan el factor de crecimiento promedio y el crecimiento porcentual promedio. Existen dos formas de resolverlo: a) De la forma más ortodoxa, es decir:

Lo que acabamos de obtener es factor de crecimiento promedio y para obtener el crecimiento se aplica la siguiente formula:

b) Otra forma es

Datos Agrupados:

Dónde: k = última clase Nota: Se puede demostrar que . También puede calcularse la media geométrica ponderada. Ejemplo: Supóngase que se cuenta con la información diaria de los incrementos porcentuales de una acción y que se representan en la siguiente tabla: Crecimiento porcentual (%) Frecuencias en días 10 14 20 15 30 48 Ingeniera Jessica Liset Martínez 52

a) Calcular los factores de crecimiento.

b) Calcular el factor de crecimiento promedio

Ejemplo: A continuación se muestra una distribución de frecuencias, calcula toda las medidas de tendencia central sobre la tabla. Clase (Presión)

Frecuencia de clase (días) M

50-59 60-69 70-79 80-89 90-99 100-109

3 7 18 12 8 2 50

Ingeniera Jessica Liset Martínez 53

f*M

Frecuencia acumulada F

3.2

MEDIDAS DE VARIABILIDA O DISPERSION.

Las medidas de tendencia central por sí solas carecen de significado, pues de nada sirve saber el promedio sin conocer la dispersión, qué significa esto, saber cuánto se alejan las observaciones de su propio promedio, observemos el siguiente ejemplo: A continuación se te presenta el monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ” Meses Empresa “XXX” Empresa “ZZZ” Julio 1.500.000 4.800.000 Agosto 1.800.000 3.900.000 Septiembre 2.000.000 2.000.000 Octubre 2.300.000 1.400.000 Noviembre 2.500.000 700.000 Diciembre 2.800.000 100.000 Total 12.900.000 12.900.000 Empresa “XXX”

Empresa “ZZZ”

Ambas tienen la misma media en ventas, pero si realizamos el análisis considerando cada una de las ventas del mes podemos apreciar que la situación de la empresa “ZZZ” es muy delicada, debido a que el último mes de facturación se aleja mucho de la media. Por esto la importancia de las medidas de dispersión.

Medidas de Dispersión: Miden que tanto se dispersan los datos recabados de su media Existen dos grupos de medidas de dispersión. El primer grupo es el de las medidas de dispersión absolutas que vienen expresado por las mismas medidas que identifican a la serie de datos; el segundo grupo es el de las medias de dispersión relativas que son relaciones entre las medidas de dispersión y las medidas de tendencia central, expresado en valores abstractos (porcentajes). Medidas de Dispersión Absolutas: el rango o recorrido, varianza, desviación media y desviación estándar. Medidas Relativas de Dispersión: coeficiente de variabilidad o variación

Ingeniera Jessica Liset Martínez 54

Varianza: La media aritmética de las desviaciones de la media elevadas al cuadrado. Desviación Estándar: La raíz cuadrada positiva de la varianza

3.2.1 

El Recorrido

El Rango o Recorrido: El rango o recorrido es la medida de dispersión más sencilla, consiste en calcular la diferencia entre el valor mayor o el valor menor de la observación:

Ejemplo: Horas diarias dedicadas al estudio por un grupo de estudiantes del plan de formación Administración y Gestión: 1,5 2 3 2,5 2 3 3,5 4 2 2,5 1 1 Calculemos la media aritmética . Podemos decir que todos los alumnos dedican aproximadamente dos horas diarias al estudio. Calculemos el Rango, R=Vm-Vm=4-1=3. El rango de 3 es la distancia entre los límites. El rango es una medida de dispersión débil pues sólo incluye dos valores del conjunto. El rango es una buena opción cuando comparamos dos situaciones similares, retomemos el ejemplo al principio de la unidad Monto en bolívares de ventas mensuales de las empresas “XXX” y “ZZZ” Meses Julio Agosto Septiembre Octubre Noviembre Diciembre Total

Empresa “XXX” 1.500.000 1.800.000 2.000.000 2.300.000 2.500.000 2.800.000 12.900.000

Empresa “XXX” Calculemos el rango de cada una XXX= 2.800.000 - 1.500.000=1.300.000 ZZZ= 4.800.000 – 100.000= 4.700.000 Ingeniera Jessica Liset Martínez 55

Empresa “ZZZ” 4.800.000 3.900.000 2.000.000 1.400.000 700.000 100.000 12.900.000

Empresa “ZZZ”

Podemos concluir que la media de la empresa XXX es más representativa que la de la empresa ZZZ. Para calcular el rango de datos agrupados tomamos el límite inferior de la primera clase y el límite superior de la última clase. Ejemplo. Utilicemos la distribución e frecuencias del Plan Empresa X trabajado en la unidad anterior Precios de Venta del Vehículo 18 a 23 23 a 28 28 a 33 33 a 38 38 a 43 Total

Frecuencia (f) 25 28 26 17 13 109

El rango es 25 millones. 3.2.2 

La Desviación Típica o Estándar

Desviación Media: La desviación media mide la cantidad media en que los valores de la población, o de la muestra, varían de la media. Se define así:

Donde Xes el valor de cada observación = es la media aritmética de los valores n= es el número de observaciones en la muestra = indica el valor absoluto. En otras palabras se hace caso omiso de los signos de las desviaciones medias, ¿Por qué? Porque si no lo hiciéramos así las desviaciones positivas y negativas se anularían, y al desviación siempre sería cero, y una medida de dispersión cero sería completamente inútil. Ejemplo: 1,5 2 2

2 3 2,5

Número de horas

3 3,5 1

(X-X)

Ingeniera Jessica Liset Martínez 56

2,5 4 1

Desviación Absoluta

1,5 2 3 3,5 4

1,5-2,3=-0,8 2-2,3=-0,3 3-2,3=0,7 3,5-2,3=1,2 4-2,3

0,8 0,3 0,7 1,2 1,7 4,7

El número de horas estudiada se desvía de la media en una hora Varianza y Desviación Estándar La varianza y la desviación estándar son medidas de dispersión basadas en la desviación media, pero en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones. Elevar al cuadrado significa eliminar los números negativos. La variancia y la desviación son las medidas de dispersión más útiles, pues proporcionan una medida más significativa sobre el punto de dispersión Varianza poblacional y Desviación Estándar para datos simples Recordemos que la población son todas las observaciones que hemos recabado, es decir, los datos. Su fórmula es:

Donde =varianza poblacional X= valor de una observación de la población = media aritmética de la población n= Número de observaciones de la población Ejemplo: Un corredor de seguros vende tres pólizas por los siguientes precios en millones: 32, 23 y 26

Ingeniera Jessica Liset Martínez 57

El precio de las pólizas de seguro está estrechamente agrupado alrededor de los 27 millones de bolívares y pueden fluctuar entre los 3.740.000 bolívares. Varianza Poblacional y Desviación Estándar para Datos Agrupados

Ejemplo: El director de Conviasa requiere conocer el número de pasajeros atendidos por día para determinar si la variación de pasajeros es grande, ya que de ello depende la ampliación en la flota de aviones, la distribución de frecuencias es la siguiente: Pasajeros (Clases) 50-59 60-69 70-79 80-89 90-99 100-09 TOTAL

Días (Frecuencia) 3 7 18 12 8 2 50

Punto Medio (M) 54,5 64,5 74,5 84,5 94,5 104,5

fM

M2

fM2

163,5 451,5 1341 1014 756 209 3.935

2.970,25 4.160,25 5.550,25 7.140,25 8.930,25 10.920,25

8.910,75 29.121,75 99.904,50 85.683 71.442 21.840,5 316.902,50

Por lo tanto

El director de Conviasa ya puede decidir si los aviones que utilizan actualmente pueden acomodar fluctuaciones hasta de 12 pasajeros en los días de tránsito pesado. 3.2.3

El Coeficiente De Variación

Las medidas de dispersión estudiadas hasta ahora no nos permiten hacer comparaciones entre la dispersión de los valores de varias distribuciones, ya que todas ellas están afectadas por la unidad de medida en que se expresan los datos; de allí que la comparación sería imposible porque cada medida vendría expresada en unidades diferentes. Además varias distribuciones pueden tener un mismo tener un mismo valor para determinada medida de dispersión y ser la variabilidad de sus datos en relación con la media, diferente. Por ello la existencia de medidas de dispersión relativa que se expresan en porcentaje (valores abstractos) y se determinan por la relación existente entre una medida de dispersión absoluta y una medida de la tendencia central, relación que nos permite compara la variabilidad de los datos entre varias series. Ingeniera Jessica Liset Martínez 58

La medida de dispersión relativa de mayor importancia es el coeficiente de variación, que se expresa en porcentajes y se calcula por la relación que existe entre la desviación estándar y la media aritmética. COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética

Al hacer el cociente eliminamos las unidades. CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media. En porcentaje su fórmula para la población es la siguiente:

3.2.4

APLICACIONES

VARIANZA:

PROPIEDADES: 1. La varianza nunca puede ser negativa, s2 >0. 2. Otra forma más sencilla de calcular la varianza es:

Demostración:

Ejemplo 1: Usando las siguiente tabla que muestra la cantidad de niños atendidos en una clínica del país en una semana por edades en años Ingeniera Jessica Liset Martínez 59

Edad 0 1 2 3 4 5 6

fi 2 4 21 15 6 1 1

Calcular la varianza y comprobar que s2 = 1.25 DESVIACIÓN TÍPICA (S). La desviación típica que se define como la raíz cuadrada positiva de la varianza PROPIEDAD: Se observa a partir de la definición que s  0 Realizar el cálculo y comprobar que: s = 1.12 CUASI-VARIANZA ( s*2 ) Se define de forma muy parecida a la varianza pero dividiendo por n-1.

Realizar el cálculo de la cuasivarianza: DESVIACIÓN MEDIA RESPECTO A LA MEDIA (D x):

Realizar el cálculo de la desviación media. Edad

fi

0 1 2 3 4 5 6

2 4 21 15 6 1 1

xi -  x

fi xi- x

D x = Calcular e interpretar el coeficiente de variación: CV=

UNIDAD 4: Ingeniera Jessica Liset Martínez 60

“ELEMENTOS DEL CÁLCULO DE PROBABILIDADES”

Ingeniera Jessica Liset Martínez 61

4.1

TECNICAS DE CONTEO

Análisis Combinatorio: Es la rama de la matemática que estudia los diversos arreglos o selecciones que podemos formar con los elementos de un conjunto dado, los cuales nos permite resolver muchos problemas prácticos. Por ejemplo podemos averiguar cuántos números diferentes de teléfonos, placas o loterías se pueden formar utilizando un conjunto dado de letras y dígitos. Además el estudio y comprensión del análisis combinatorio no va a servir de andamiaje para poder resolver y comprender problemas sobre probabilidades Principios fundamentales del Análisis Combinatorio: En la mayoría de los problemas de análisis combinatorio se observa que una operación o actividad aparece en forma repetitiva y es necesario conocer las formas o maneras que se puede realizar dicha operación. Para dichos casos es útil conocer determinadas técnicas o estrategias de conteo que facilitarán el cálculo señalado. El análisis combinatorio también se define como una manera práctica y abreviada de contar; las operaciones o actividades que se presentan son designadas como eventos o sucesos. Ejemplo: 1. Señalar las maneras diferentes de vestir de una persona, utilizando un número determinado de prendas de vestir 2. Ordenar 5 artículos en 7 casilleros 3. Contestar 7 preguntas de un examen de 10 4. Designar 5 personas de un total 50 para integrar una comisión 5. Sentarse en una fila de 5 asientos 4 personas 6. Escribir una palabra de 7 letras utilizando 4 consonantes y 3 vocales I) Principio de multiplicación: Si un evento o suceso “A” puede ocurrir, en forma independiente, de “m” maneras diferentes y otro suceso de “n” maneras diferentes, entonces el número de maneras distintas en que pueden suceder ambos sucesos es “m. n” Ejemplo 1: En la etapa final de fútbol profesional de primera, cuatro equipos: CRISTAL (C), BOYS (B), ESTUDIANTES (E), UNIVERSITARIO (U), disputan el primer y segundo lugar (campeón y subcampeón). ¿De cuántas maneras diferentes estos equipos pueden ubicarse en dichos lugares? Solución:

Ingeniera Jessica Liset Martínez 62



METODO 1: utilizando el diagrama del árbol 1o C C C

2o B E U

B

C E U

B B B

C E U

E

C B U

E E E

C B U

1er lugar

2do lugar B E U

C

C B

U

U U E

C B U

E Existen 12 maneras diferentes en que estos equipos se pueden ubicarse en el primer y segundo lugar 

METODO 2: Utilizando el principio de multiplicación 1o 2o EXPLICACIÓN:

4

x

3

1o El primer lugar puede ser ocupado por cualquiera de los cuatro equipos. 2o El segundo lugar puede ser ocupado por cualquiera de los otros tres equipos que restan 3o Por el principio de multiplicación, se observa que el evento del primer lugar se presenta de 4 maneras y el del segundo lugar de 3 maneras distintas, entonces el número de maneras totales será : 4x3 = 12

# maneras = 12 Ejemplo 2: ¿Cuántas placas para automóviles pueden hacerse si cada placa consta de dos letras diferentes seguidas de tres dígitos diferentes? (considerar 26 letras del alfabeto)

Ingeniera Jessica Liset Martínez 63

Solución:

Letras

26

x

Dígitos

25

x 10

x 9

EXPLICACIÓN: 1oEl primer casillero puede ser ocupado por cualquiera de las 26 letras o 2 El segundo casillero puede ser ocupado por cualquiera de las 25 letras que restan 3oEl tercer casillero puede ser ocupado por cualquiera de los 10 dígitos ( del 0 al 9) 4oEl cuarto casillero lo pueden ocupar los 9 dígitos restantes o 5 El quinto casiller puede ser ocupado por cualquiera de los 8 dígitos restantes 6oPor el principio de multiplicación, el número de placas será = 26x25x10x9x8 = 468 000

x 8

# Placas = 468 000

II) Principio de adición: Supongamos que un evento A se puede realizar de “m” maneras y otro evento B se puede realizar de “n” maneras diferentes, además, no es posible que ambos eventos se realicen juntos (AB = ), entonces el evento A o el evento B se realizarán de ( m + n) maneras. Ejemplo 1: Un repuesto de automóvil se venden en 6 tiendas en la Victoria o en 8 tiendas de Breña. ¿De cuántas formas se puede adquirir el repuesto? Solución:  Por el principio de adición: Victoria o Breña 6 formas + 8 formas = 14 formas Ejemplo 2: Se desea cruzar un río, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. ¿De cuantas formas se puede cruzar el río utilizando los medios de transporte señalados? Solución:  Aplicando el principio de adición se tiene: Bote ,

3

lancha

ó

2

, deslizador

ó

1

RECUERDA 1) Si se desea que se realicen los eventos A y B, entonces se utiliza el principio de multiplicación (x) 2) Si se desea que se realicen los eventos A ó B, entonces se utiliza el principio de adición (+)

Ingeniera Jessica Liset Martínez 64

# Maneras = 3 + 2 + 1 = 6 4.1.1

Métodos de Conteo

En diferentes casos se tomará de algún conjunto parte de sus elementos o todos ellos, para formar diferentes agrupaciones, que se van a distinguir por el orden de sus elementos o por la naturaleza de algunos de ellos. Si los elementos que forman una agrupación son diferentes entre sí, serán llamados agrupaciones sin repetición y si alguno de ellos es igual se dirá que son agrupaciones con repetición. Entre los métodos de conteo más conocidos tenemos: Permutación, Variación y Combinación PERMUTACIÓN Es un arreglo de todos o parte de un conjunto de objetos considerando el orden en su ubicación; cuando en el arreglo solo entran parte de los elementos del conjunto se llama variación. Es importante resaltar que el orden es una característica importante en la permutación, cuando variamos el orden de los elementos se dice que permutamos dichos elementos. 

Ejemplo: Determinar los diferentes arreglos o permutaciones que se pueden hacer con las letras a, b y c tomadas de dos en dos Solución: Método 1:  Sea el conjunto: {a,

b,

c} ,

entonces los arreglos pueden ser: ab, va. ac, ca, bc, cb

 Número de arreglos = 6 Método 2: (principio de multiplicación)

EXPLICACIÓN 1) El primer casillero puede ser ocupado por cualquiera de las tres letras, existiendo 3 posibilidades 2) El segundo casillero puede ser ocupado por cualquiera de las otras dos letras restantes, existiendo 2 posibilidades

# arreglos = 3

x

2=6

Teorema 1: (Permutación lineal con elementos diferentes) “El número de permutaciones de “n” objetos diferentes, tomados en grupos de k elementos (siendo k n) y denotado por

, estará dado por:

Ingeniera Jessica Liset Martínez 65

; donde: n, k  N y 0  k  n Estas permutaciones son llamados lineales, porque los objetos son ordenados en una línea recta de referencia Ejemplo: En una carrera de 400metros participan 12 atletas. ¿De cuantas formas premiados los tres primeros lugares con medalla de oro, plata y bronce?

distintas podrán ser

Solución: Método 1: Empleando el principio de multiplicación Oro

10

Plata

x

# maneras = 720

9

Bronce

x 8

EXPLICACIÓN 1) El primer casillero(MEDALLA DE ORO) puede ser ocupado por cualquiera de los diez atletas, existiendo 10 posibilidades 2) El segundo casillero(MEDALLA DE PLATA) puede ser ocupado por cualquiera de los nueve atletas restantes, existiendo 9 posibilidades 3) El tercer casillero (MEDALLA DE BRONCE) puede ser ocupado por cualquiera de los ocho atletas restantes, existiendo 8 posibilidades

Método 2: (usando la fórmula de permutación lineal)  Se busca las diferentes ternas (k = 3) que se pueden formar con los 10 atletas (n = 10) RECORDAR 1)n! = 1 x 2 x 3 x ................ x n 2)0! = 1 3)1! = 1 4) n! = (n – 1)! x n Teorema 2: (Permutación lineal con elementos repetidos) El número de permutaciones (P) distintas de “n” elementos tomados de “n” en “n” en donde hay un primer grupo de n1 objetos iguales entre sí; n2 objetos iguales entre si de un segundo tipo y así sucesivamente hasta nk objetos iguales entre si de un último tipo, entonces: Ejemplo: ¿De cuántas maneras distintas se podrán ordenar las siguientes figuras? Ingeniera Jessica Liset Martínez 66

Solución:  Como entran todos los elementos del conjunto y estos se repiten, se trata de una permutación con repetición, donde n1 = 3 (tres círculos), n2 = 2 (dos cuadrados) , n3 = 1 (un triángulo), n4 = 1( un rombo), luego:

=  COMBINACIÓN Es cada uno de los diferentes arreglos que se pueden hacer de un conjunto dado sin considerar el orden en su ubicación

con parte o todos los elementos

El número de combinaciones de “n” elementos diferentes tomados de “k” en “k”, con k n, está dada por:

Ejemplo 1: Si disponemos de 5 puntos no colineales, ¿cuál es el máximo número de triángulos que se podrán formar? Solución:  Para dibujar un triángulo solo es necesario 3 puntos en el plano, luego se escogerán 3 puntos (k = 3) de un total de 8 puntos (n = 5). Además no importa el orden, ya que el triángulo ABC es igual al CBA; por lo tanto se trata de una combinación. OBSERVACIÓN 1) En las permutaciones interesa el orden, se buscan ordenaciones 2) En las combinaciones no interesa el orden, se busca agrupaciones

Ejemplo 2: Una señora tiene 3 frutas: manzana, fresa y piña. ¿Cuántos sabores diferentes de jugo podrá preparar con estas frutas?

Ingeniera Jessica Liset Martínez 67

Fresa (F)

,

Piña (P)

,

Manzana (M)

Solución: Método 1: (en forma gráfica)  Cuando se escoge una fruta de las tres, los sabores son 3: F, P ,M  Cuando se escoge 2 de las tres frutas, los sabores son 3: FP, FM, PM  Cuando se escoge las 3 frutas los sabores son 1: FPM Total de sabores diferentes: 3 + 3 + 1 = 7 Método 2: (Empleando combinaciones)  Se puede escoger una fruta de las tres ó 2 frutas de las tres o las tres frutas de las tres, además en este caso no importa el orden; por lo tanto usamos el principio de adición aplicado a la combinación: # maneras diferentes = # maneras diferentes = Total de sabores diferentes: 3 + 3 + 1 = 7 Ejemplo 3: Se desea formar un comité de 7 seleccionando 4 físicos y 3 matemáticos de un grupo de 8 físicos y 6 matemáticos. ¿De cuantas maneras podrá seleccionarse? Solución: 

PROPIEDADES DE

1 Seleccionamos 4 físicos entre 8 en

formas

1)

,

,

2) 

2o Seleccionamos 3 matemáticos entre 6 en

3) 4)



Aplico el principio de multiplicación

x

= 70 x 20 = 1400

5) 6)

OBSERVACIÓN: En la práctica se presentan diferentes combinaciones que no resultan sencillas, estas son las combinaciones con repetición. Para obtener las diferentes combinaciones con repetición de “n” elementos en el cual hay repetición de los elementos (CR) agrupados de k en k, se utiliza Ingeniera Jessica Liset Martínez 68 la siguiente fórmula:

PROBLEMAS RESUELTOS 1. ¿Cuántos numerales de 2 cifras se pueden formar con los dígitos 1, 3, 5 y 7? A) 16

B) 12

C) 10

D) 14

e)8

Solución: MÉTODO 1: (mediante arreglo numérico)  Con los dígitos dados, formamos los siguientes números: OBSERVACIÓN En estos casos el orden es importante, además los elementos del conjunto pueden repetirse, como por ejemplo : 11 , 33, 55, 77 Respuesta: se pueden formar 16 numerales MÉTODO 2: (mediante la aplicación de los principios de análisis combinatorio) 

La forma general del numeral pedido es :



Los valores que pueden tomar los dígitos a y b en el numeral

son:

OBSERVACIÓN 1) a toma 4 valores 2) b toma 4 valores

3) Para formar el numeral

primero escribo las cifras de las decenas(4 posibilidades) y luego la cifra de las unidades (4 posibilidades), luego por el principio de multiplicación, la cantidad de numerales será : 4 x 4 = 16

Cantidad de números = 4 x 4 = 16 2. Determinar cuántos numerales de 3 cifras existen en el sistema de base seis.

Ingeniera Jessica Liset Martínez 69

A) 160

B) 12 0

C) 100

D) 140

e) 180

Solución: 

La forma general del numeral es , hallaremos las posibilidades que pueden tomar a, b y c en base seis y luego multiplicamos el número de las posibilidades

A b c

OBSERVACIÓN: 1) En base seis solo se dispone de los dígitos : 0,1,2,3,4 y 5 2) La primera cifra a no puede ser cero, solo puede tomar las cifras : 1,2,3,4 y 5; es decir 5 posibilidades 3) Las cifras b y c, como no dicen que son diferentes, pueden tomar 6 valores o posibilidades

5 x 6 x 6 = 180 numeral Respuesta: se pueden formar 180 numerales 3. ¿Cuántos numerales de la forma: existen? A) 260 B) 2 00 C) 300 D) 240 e) 180 Solución:  En estos tipos de problemas hay que tener en cuenta que cuando una variable representa una cifra, y ésta se repite en el numeral, entonces a dicha variable se le considera una sola vez al calcular la cantidad de numerales.  En nuestro problema, con la indicación anterior, tendremos:

Cantidad de numerales = 5 x 5 x 8 = 200 Respuesta: se pueden formar 200 numerales 4. ¿Cuántos numerales de tres cifras diferentes existen en el sistema de base decimal? A) 900 B) 780 C) 800 D) 648 e) 724 Solución: 

La forma general del numeral es , hallaremos las posibilidades que pueden tomar a, b y c en base diez y luego multiplicamos el número de las posibilidades, teniendo en cuenta que las tres cifras deben ser diferentes.

Ingeniera Jessica Liset Martínez 70

a

b

c

# numerales = 9 x 9 x 8 = 648 Respuesta: se pueden formar 648 numerales 5. ¿Cuántos numerales de la forma: existen? A) 9 B) 18 C) 26 D) 48 e) 24 Solución:  Los valores de “a” deben se factores de 14 y además menores que 9; luego los valores posibles de “a” solo pueden ser: 1,2,7 ; es decir hay 3 posibilidades.  Los valores de “b” son múltiplos de 3, menores que 9; luego los valores de “b” solo pueden ser: 0,3 y 6; es decir hay 3 posibilidades OBSERVACIÓN 1)

por ser primera cifra no puede ser cero

2) A las posibilidades de y el principio de multiplicación

se les aplica

cantidad de # = 3 x 3 = 9 números Respuesta: se pueden formar 9 números 6. ¿Cuántos números de 3 cifras tienen por lo menos un 6 en su escritura? A) 196 B) 188 C) 252 D) 480 e) 248 Solución: a) Podemos representar el procedimiento de solución mediante un diagrama de Venn: Ingeniera Jessica Liset Martínez 71

OBSERVACIÓN: Para hallar los números que tiene por lo menos un 6 en su escritura, se consideran: 1) Los que tienen un solo 6 2) Los que tienen dos 6 3) Los que tienen tres 6

b) Del gráfico anterior , se deduce que: # de cifras con por lo menos un 6 = # de tres cifras - # de tres cifras que no usan el 6 x =

-y

............ (1)

c) Calculamos el número de tres cifras que existen: a

b

c

EXPLICACIÓN: 1) “a” puede tomar los valores del “1” al 9, es decir hay 9 posibilidades para las centenas 2) para “b” y “c” hay 10 posibilidades, ya que b y c pueden tomar los valores del “0” al 9 3) Para hallar la cantidad de números de 3 cifras aplicamos el principio de multiplicación.

cantidad de #s = 9 x 10 x 10 = 900 d) Cálculo del número de 3 cifras que no usan cifra “6” a

b

c

EXPLICACIÓN: 1) “a” puede tomar los valores del “1” al “9”; sin considerar el “7” es decir hay posibilidades para las centenas 2) para “b” y “c” hay 9 posibilidades, ya que b y c pueden tomar los valores del “0” al “9”, exceptuando a “7” 3) Para hallar la cantidad de números de 3 cifras aplicamos el principio de multiplicación

cantidad de #s = 8 x 9 x 9 = 648 e) Remplazando los valores obtenidos en los pasos “c” y “d” en la ecuación (1) de l paso (b), se tiene: X = 900 – 648 = 252 Respuesta: se pueden formar 252 números 7) De un grupo de 5 estudiantes, cuantos grupos diferentes de tres alumnos podrían formarse.

Ingeniera Jessica Liset Martínez 72

A) 16 B) 10 C) 12 D) 15 e) 18 Solución: METODO 1: Por conteo directo  Sean A, B, C, D y E los alumnos, los diferentes grupos de 3 serían : ABC, ABD, ABE, ACD, ACE , ADE, BCD, BCE, BDE, CDE Respuesta: se pueden formar 10 grupos diferentes METODO 2: Por fórmula  Como el grupo de alumnos ABC, CBA y BAC son el mismo grupo de alumnos, entonces no interesa el orden de los elementos y se trata de una combinación:

Respuesta: se pueden formar 10 grupos diferentes 8) Con 7 sumandos diferentes ¿Cuántas sumas distintas de 4 sumandos se podrán efectuar?



A) 56 B) 35 C) 42 D) 64 e) 70 Solución: En la suma no importa el orden que se dispongan los sumandos, por lo tanto se trata de una combinación; además para cada suma se escogen grupos de 4 sumandos de los siete de que se disponen.

Respuesta: se pueden formar 35 sumas diferentes 9) ¿De cuántas formas se pueden ubicar en una fila de 7 asientos 3 hombres y 4 mujeres, si estas deben ocupar los lugares impares?



A) 160 B) 135 C) 144 D) 14 e) 170 Solución: Representemos gráficamente el problema, y luego emplearemos el principio de multiplicación

Posibilidades 4 3 3

2

2

1

1

# de formas = 4 x 3 x 3 x 2 x 2 x 1 x1 =144 Respuesta: se pueden ubicar de144 formar diferentes Ingeniera Jessica Liset Martínez 73

10) ¿Cuántos números de 4 cifras diferentes y mayores que 5 000 , se pueden formar con los siguientes dígitos: 1 , 3, 4 , 6 , 9? A) 52 Solución: 

Sea :

B) 48

C) 27

el número, entonces se tiene: a

b

c d

# de números = 2 x 4 x 3 x 2 = 48

D) 96

e) 49

EXPLICACIÓN: “a” puede ser “6” o “9”, es decir tiene 2 posibilidades ; “b”, tiene (5 - 1) posibilidades; “c” tiene (5 – 2) posibilidades y “d” tiene (5 – 3) posibilidades ya que las cifras deben ser diferentes

Respuesta: se pueden formar 48 números de cuatro cifras diferentes 11) Un grupo de 16 personas desean escoger entre sus miembros un comité de 3 personas que los represente. ¿De cuantas formas distintas se puede seleccionar dicho comité?



A) 1120 B) 48 C) 300 D) 560 e) 440 Solución: Para formar un comité , no interesa el orden en que se dispongan las tres personas por lo que los posibles comités serán combinaciones de 16 personas tomadas en grupos de 3, así

Respuesta: se puede seleccionar el comité de 560 formas diferentes 12) A la final de un torneo de ajedrez se clasifican 10 jugadores, ¿cuántas partidas se jugará si se juega todos contra todos? A) 1120 B) 48 C) 300 D) 560 e) 440 Solución:  Si “A” juega con “B” es lo mismo decir que “B” juega con “A”, la partida es la misma, no interesa el orden de sus elementos, pero es una agrupación de 2 en 2, de un total de 10 elementos. Por lo tanto se trata de una combinación

Respuesta: se jugarán 45 partidas 13) ¿De cuántas maneras diferentes podrá viajar una persona de A a D sin retroceder?

Ingeniera Jessica Liset Martínez 74





A) 24 B) 48 C) 36 Solución: Identificamos con un nombre a cada camino diferente:

D) 18

e) 30

Analizamos por tramos: I) ABD: para llegar a B, se puede utilizar cualquiera de los 3 caminos (1, 2, 3) señalados. De B a D se puede ir por el camino z, luego habría 3 formas diferentes de llegar: 1z,2z,3z; por lo tanto en el tramo ABD hay 3 formas II) ACD: para llegar a C se puede utilizar un camino para llegar a B (1, 2,3) y luego otro camino para llegar a C (4, 5,6). Que aplicando el principio de multiplicación se tendría: A

B

# maneras de llegar de A a C = pasando por B

3

C x

3

=9

Pero también hay dos caminos directos para llegar a C (x, y); por lo tanto el número total de caminos para llegar de A a C es : 9 + 2 = 11 formas; y de C a D hay 3 formas (7,8,9) Finalmente se tiene: De A a C 11formas

y

de

C a D 3formas

Ingeniera Jessica Liset Martínez 75

A aD 11 x 3 formas



# total de formas diferentes = 33 formas En conclusión los caminos de (I) y (II) , pueden ser ABD ó ACD = 3 + 33 = 36 formas Respuesta : 36 maneras diferentes

14) En un examen de matemáticas, un estudiante debe responder siete preguntas de las diez dadas. ¿De cuántas formas diferentes debe seleccionar, si él debe responder por lo menos, tres de las cinco primeras preguntas? A) 64 B) 55 C) 50 D) 110 e) 120 Solución:  El estudiante puede responder tres de las cinco primeras preguntas y 4 de las últimas 5 preguntas; o cuatro de las primeras cinco preguntas y 3 de las últimas; o cinco de las primeras cinco y dos de las últimas. Como no interesa el orden se trata de una combinación, por lo tanto tenemos:

Respuesta: 110 maneras diferentes 15) El servicio de inteligencia de cierto país, desea enviar mensajes a sus agentes secretos. Solo quiere utilizar las siguientes letras: V, A, M, P, I, R, O. ¿Cuántas palabras claves de cinco letras pueden formarse, si ninguna letra puede repetirse? A) 2520 B) 1550 C) 1850 D) 1100 e) 1200 Solución: Método 1:(usando el principio de multiplicación)

#maneras = 7 x 6 x 5x 4 x 3 Método 2:(usando permutación)

= 2 520

16) Un hombre tiene 9 bonos financieros de 9 compañías distintas, y piensa regalarlos a sus 3 hijos de la siguiente manera: a su hijo mayor, 4; a su segundo hijo, 3; y al menor 2. ¿De cuantas formas puede repartir los bonos? A) 1640 B) 1360 C) 680 D) 1100 e) 1120 Solución:

Ingeniera Jessica Liset Martínez 76



Se trata de una permutación con repetición donde intervienen todos los elementos. Hay 4! Maneras de arreglar los bonos para su hijo mayor; 3! Formas para arreglar los bonos para el segundo hijo y 2! Formas para el hijo menor. Luego se tiene:

Respuesta: Los bonos se pueden repartir de 1360 formas 17) La selección peruana de voleibol está conformado por 12 chicas. ¿De cuántas formas se puede conformar un equipo de 6 si se sabe que 2 chicas se niegan a jugar en el mismo equipo?



A) B) C) D) e) Solución: La delegación de 6 chicas se puede presentar en los siguientes casos: 1er caso: Si no figura ninguna de las dos chicas que se niegan a jugar juntas, las seis chicas deben escogerse de entre10 OBSERVACIÓN: Hemos aplicado la propiedad: # de equipos = 2do caso: Si figura una de las dos chicas que se niegan a jugar juntas, las otras cinco chicas deben escogerse de entre las10 restantes # de equipos = # total de equipos =

Respuesta: El número total de equipos que se pueden formar es 18) ¿De cuántas maneras diferentes se pueden sentar 8 personas en una mesa redonda de 5 asientos, si 3 están en espera? A) 1640 B) 1344 C) 680 D) 1124 e) 1120 Solución:  El número de grupos de 5 personas que se ubican en la mesa circular es:

Ingeniera Jessica Liset Martínez 77



El número de formas en que cada grupo de 5 personas se pueden sentar en la mesa es: (5 – 1)! =4! = 24 # total de formas = 56 x 24 = 1344 Respuesta: 1344 maneras diferentes 19) La tripulación de un bote es de 10 hombres, cuatro solamente pueden remar a babor y tres a estribor. ¿De cuántas formas se pueden distribuirse para remar, sabiendo que cinco hombres deben ubicarse a cada lado para mantener el equilibrio del bote? PROA

Babor

Estribor

2





2

POPA C) 3! x (5!)2

A) 3x (5!) B) 6x (4!) D) 12 x (3!)2 e) 6x (5!) x (4!) Solución: Sean {a, b, c, d, e, f, g, h, i, j} los tripulantes del bote de los cuales: a, b, c y d pueden remar sólo a babor y h, i, y j pueden remar sólo a estribor. Además cinco hombres están ubicados a cada lado del bote. a, b, c y d pueden ubicarse a babor de formas distintas ocupando 4 lugares (observar que en este problema el orden es importante). Los lugares que sobran a babor pueden ser ocupados por d, e ó f, es decir 3 formas distintas. Luego los cinco lugares a babor pueden ser ocupados de: . 3 formas o maneras distintas.



A estribor h, i, y j pueden acomodarse de formas diferentes ocupando 3 lugares; y sobrando 2 lugares. Uno de los lugares que sobra puede ser ocupado de 2 formas diferentes, pues uno de los tripulantes e, f o g ya está ubicado a babor, quedando (3 – 1) de ellos para ocupar aquel cuarto lugar. El quinto lugar a estribor puede ser ocupado de (3 – 2) sola forma, por el que queda de los dos anteriores. Por tanto los cinco lugares a estribor pueden ser ocupados de: maneras diferentes.

Ingeniera Jessica Liset Martínez 78



Como se trata de un suceso simultaneo , aplicamos el principio de multiplicación para los dos resultados anteriores: # de formas diferentes = Respuesta:

.3x

=

formas diferentes

20) Señale cuántos productos diferentes, cada uno de tres factores primos, podrá obtenerse con los cinco factores primos : a, b, c, d, e ( a  b  c  de) A) 40 B) 35 C) 30 D) 24 e) 56 Solución: Método 1: (Por conteo directo) Se deben formar números de la forma P = x. y. z; donde x, y, z son números primos CASO 1: Losa tres factores son iguales; es decir: x = y = z, los productos serán: P1 = a a a ; P2 = b b b ; P3 = c c c ; P4 = d d d ; P5 = e e e Son 5 casos posibles CASO 2: Dos factores son iguales y uno es diferente ; es decir : x = y ; con z diferente , los productos serán: P6 = a a b ; P7 = a a c ; P8 = a a d ; P9 = a a e ; P10 = b b a P11 = b b c ; P12 = b b d ; P13 = b b e ; P14 = c c a ; P15 = c c b P16 = c c d ; P17 = c c e ; P18 = d d a ; P19 = d d b ; P20 = d d c P21 = d d e ; P22 = e e a ; P23 = e e b ; P24 = e e c ; P25 = e e d Son 20 casos posibles CASO : Los 3 factores son diferentes ; es decir : x  y  z ;, los P26 = a b c ; P27 = a b d ; P28 = a b e ; P29 = a c d ; P31 = a d e ; P32 = b c d ; P33 = b c e ; P34 = b d e ; Son 10 casos posibles (

productos serán: P30 = a c e P35 = c d e

)

Finalmente se tendrá : 5 + 20 + 10 = 35 formas posibles Método 2 : (Aplicando combinación con repetición) 

En este caso aplicamos la fórmula: Con n = 5 y k = 3 , es decir:

Ingeniera Jessica Liset Martínez 79

4.2

DEFINICION Y MEDICION DE PROBABILIDAD. 4.2.1

Probabilidad

La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre en cualquier situación donde podría ocurrir uno de varios resultados posibles. En algunos casos se utiliza de manera informal como por ejemplo: hay un 50% de probabilidad de que llueva. En ocasiones cuando se habla de probabilidad o posibilidad de que un evento ocurra, se pierde la credibilidad acerca del evento en cuestión, pero ¿es posible tener siempre la certeza total en todo proyecto o actividad que se desea realizar?, es muy difícil tenerla, debido a que el llevar a efecto un proyecto cualquiera por más simple que este sea, está sujeto a una gran diversidad de factores que afectan su ocurrencia, ¿entonces qué es lo más aconsejable para predecir su ocurrencia?, la probabilidad es la que nos ayuda en estos casos, ya que basándose en estadísticas, podemos cuantificar la posibilidad de ocurrencia de los eventos y por consiguiente tomar una buena decisión basados en esta información.  Probabilidad: Es la posibilidad numérica de ocurra un evento. Se mide con valores comprendidos entre 0 y 1, entre mayor sea la probabilidad, más se acercará a uno. La probabilidad se encarga de evaluar todas aquellas actividades en donde se tiene incertidumbre acerca de los resultados que se pueden esperar, esto quiere decir que la probabilidad está presente en casi en todas las actividades que se pretenda realizar, ejemplos: • Cualquier proyecto de Ingeniería o de otras áreas • Competencias deportivas • Juegos de azar, etc., etc.  Definición Clásica de Probabilidad. Modelo de frecuencia relativa La probabilidad de un evento (E), puede ser calculada mediante la relación del número de respuestas en favor de E, y el número total de resultados posibles en un experimento. ¿ de casos Favorablesde E P ( E )= ¿ Total de casos posibles  La probabilidad de un evento está comprendida siempre entre 0 y 1. La suma de las probabilidades de todos los eventos posibles (E) en un espacio muestral S = 1  Un espacio muestral (S): Es el conjunto Universal; conjunto de todos los “n” elementos relacionados = # Total de resultados posibles.  ¿Cómo podemos calcular probabilidades? 1. Haciendo uso de las estadísticas. En este caso, se hace uso de la información que se ha acumulado acerca del evento que nos interesa, y después de esto se procede a calcular las probabilidades requeridas.

Ingeniera Jessica Liset Martínez 80

Ejemplo 1. Determine la probabilidad de que en cierta línea de producción se manufacture un producto defectuoso, si se toma como referencia que la producción de la última semana en esta línea fue de 1,500 productos, entre los que se encontraron 8 productos defectuosos. ¿ de productos defectuosos P ( producto defectuoso )= Total de productos elaborados en lasemana 18 ¿ =0.012 1500 Lo anterior nos indica que es muy probable que 1.2 productos de cada 100 que se manufacturen en esa línea serán defectuosos. ¿Por qué se utilizó para calcular las probabilidades la información de la semana inmediata anterior?. Debido a que esta refleja la situación que guarda actualmente la producción de la línea mencionada. 2. Basándose en la experimentación. Hay casos en los que después de repetir un número muy grande de veces un experimento, es posible determinar las probabilidades de ocurrencia de algunos eventos, tales como: La probabilidad de que aparezca águila al lanzar una moneda equilibrada, la probabilidad de que aparezca el número 3 en un dado, etc., etc.  Probabilidad Compuesta Es la probabilidad compuesta por dos eventos simples relacionados entre sí. En la composición existen dos posibilidades: Unión

y de Intersección

.

Unión de A y B Si A y B son eventos en un espacio muestral S, la unión de A y B los elementos del evento A o B o ambos.

contiene todos

Intersección de A y B Si A y B son eventos en un espacio muestral S, la intersección de A y B compuesta por todos los elementos que se encuentran en A y B.

está

Relaciones entre eventos Existen tres tipos de relaciones para encontrar la probabilidad de un evento: complementarios, condicionales y mutuamente excluyentes. 1. Eventos complementarios: El complemento de un evento A son todos los elementos en un espacio muestral S que no se encuentran en A. El complemento de A es: A C =1−P( A) Ejemplo 2: En el evento A (día nublado), P(A) = 0.3, la probabilidad de tener un día despejado será 1 – P(A) = 0.7 Gráficamente:

Ingeniera Jessica Liset Martínez 81

P(AC)=0.7 P(A)=0.3

2. Probabilidad condicional: Para que se lleve a cabo un evento A se debe haber realizado el evento B. La probabilidad condicional de un evento A dado que ha ocurrido el evento B es: , si

A

B P(B/A)=0.97

P(A)=0.9 8

Ejemplo 3: Si el evento P(A y B) = (llueva y este nublado) = 0.2 y el evento B (nublado) = 0.3, cual es la probabilidad de que llueva en un día nublado? Nota: no puede llover si no hay nubes.

A P(A/B)=0.67

B

= Ejemplo 4: Las razones de queja en productos se muestran a continuación: RAZÓN DE LA QUEJA Ingeniera Jessica Liset Martínez 82

En garantía Fuera de garantía Total

Falla eléctrica 18% 12% 30%

Falla mecánica 13% 22% 35%

Falla apariencia 32% 3% 35%

Total 63% 37% 100%

Si A es el evento de que la queja es por apariencia y que B representa que la queja ocurrió en el periodo de garantía. Se puede calcular P(A/B) = P(A y B)/P(B) P(A/B) = 0.32 / 0.63 = 0.51 Si C es el evento fuera de garantía y D falla mecánica: P(C/D) = P(C y D) / P(D) = 0.22 / 0.35 = 0.628 Se dice que dos eventos A y B son independientes si: P(A/B) = P(A) o P(B/A) = P(B). La probabilidad de la ocurrencia de uno no está afectada por la ocurrencia del otro. De otra manera los eventos son dependientes. Un ejemplo de evento independiente es: ¿Cuál es la probabilidad de que llueva en lunes? El ejemplo de evento dependiente es el ejemplo 2. 3. Eventos mutuamente excluyentes. A

B

Cuando un evento A no contiene elementos en común con un evento B, se dice que estos son mutuamente excluyentes. Ejemplo 5. Al lanzar un dado: a) Cuál es la probabilidad de que salga 2 o 3? b) Calcule a) b)

= 0,

Ya que al ser conjuntos mutuamente excluyentes la intersección no existe, es imposible que salga 2 y 3 al mismo tiempo. Ley aditiva: Ingeniera Jessica Liset Martínez 83

 Cuando dos eventos no son mutuamente excluyentes: P ( A U B ) = P(A) + P(B)− P(A ∩ B)  Cuando los eventos son mutuamente excluyentes: P ( A U B ) = P(A) + P(B) Ley multiplicativa:  Si los eventos A y B son dependientes: P(A ∩ B) = P(A) × P(B/A)  Si los eventos A y B son independientes: P(A ∩ B) = P(A) × P(B) Ejemplo 6: Se selecciona una muestra aleatoria n = 2 de un lote de 100 unidades, se sabe que 98 de los 100 artículos están en buen estado. La muestra se selecciona de manera tal que el primer artículo se observa y se regresa antes de seleccionar el segundo artículo (con reemplazo), a) calcule la probabilidad de que ambos artículos estén en buen estado, b) si la muestra se toma sin reemplazo, calcule la probabilidad de que ambos artículos estén en buen estado. A: El primer artículo está en buen estado. B: El segundo artículo está en buen estado.

A P(A) =.98

B P(B) =.98

a) Al ser eventos independientes el primero del segundo: = b) Si la muestra se toma “sin reemplazo” de modo que el primer artículo no se regresa antes de seleccionar el segundo entonces: = Se observa que los eventos son dependientes ya que para que para obtener el evento B, se tiene que haber cumplido antes el evento A.

Ingeniera Jessica Liset Martínez 84

B

P(B/A)=.97

A

P(A) =.98

4.2.2

Experimento.

Es toda acción bien definida que conlleva a un resultado único bien definido como el lanzamiento de un dado. Es el proceso que produce un evento. Es el proceso a través del cual se obtienen observaciones. Ejemplo 2.1.Considere el experimento siguiente: En una empresa existe una grúa que tiene un sistema de cables, las cuales requieren ser reemplazadas cada cierto tiempo de uso. Para probar si se debe cambiar, se somete el sistema a una tensión exagerada, si se rompen 2 o más hilos, se dice que el cable no sobrevive y por lo tanto debe ser reemplazada. Se sabe por experiencia, que en cada tensión exagerada, se rompe a lo más un hilo y que la probabilidad de que se rompan más de uno es despreciable. 4.2.3

Espacio Muestral.

Es el conjunto de todos los posibles resultados posibles de un experimento estadístico. El espacio muestral suele denotarse por la letra S. Los elementos del espacio muestral, se denominan puntos muéstrales.  Espacio Muestral Discreto. Es un espacio muestral que contiene un número finito o numerablemente infinito de puntos muéstrales. Ejemplo 2.2. En el ejemplo anterior, el espacio muestral es discreto finito. Para definir este espacio muestral elaboraremos un diagrama de árbol. Codifiquemos como cero (0) si no se rompe algún hilo y uno (1) si se rompe un hilo. (Elaborar en clase)  Evento: Es cualquier colección de resultados contenidos en el espacio muestral. Es simple si sólo tiene un resultado y compuesto si tiene varios resultados.

Ingeniera Jessica Liset Martínez 85

4.3

INDEPENDENCIA ESTADÍSTICA. 4.3.1

Tipos de Eventos o Sucesos

SUCESOS O EVENTOS MUTUAMENTE EXCLUYENTES: Dos o más sucesos son mutuamente excluyentes si la ocurrencia de uno cualquiera de ellos, imposibilita la ocurrencia de los otros. De la teoría de conjuntos se sabe que dos o más conjuntos que no tengan puntos muestrales en común su intersección es nula. La probabilidad de ocurrencia de E1 o E2, es la suma de las probabilidades de cada uno. P { E1 ó E2 }=P { E1 ∪ E2 }=P { E 1 }+ P { E 2 } EVENTOS SOLAPADOS: Dos eventos E1 y E2, son solapados si tienen puntos muestrales comunes, los puntos muestrales comunes a E1 y E2, forman un subconjunto llamado intersección de E1 y E2, y se representa por E1 ∩ E2. La fórmula para calcular la probabilidad de dos eventos solapados es: P { E1 ∪ E 2} =P { E1 ó E2 }=P { E 1 }+ { E2 }−P { E1 ∩ E2 } Dónde:

P { E1 ∩ E 2 }=P { E1 } ∙ P [ E2 ]

Fórmula para tres eventos solapados:

P { E1 ∪ E 2 ∪ E3 } =P { E 1 }+ { E2 } + P { E3 } =P { E 1 } + P { E 2 } + P { E3 }−P { E1 ∩ E2 } −{ E1 ∩ E3 }−P { E 2 ∩ E3 } + P { E1 ∩ E2 ∩ E EVENTOS COMPLEMENTARIOS: Dos eventos E1 y E2, son complementarios si el segundo es un subconjunto que contiene todos los puntos muestrales del espacio muestral que no están en el primero. Los eventos complementarios, son a su vez mutuamente excluyentes: E1 ∪ E 2=S y E 1 ∩ E2 =∅ S, representa el espacio muestral ^ E , es el complementario de E, es decir, ^ E es lo que le falta a E, para se igual a S. ^ E , se lee complementario de E ó “No E” La probabilidad del espacio muestral es 1; P { S }=1, por loque se tiene : ^ }=1 P { S }=P { E } + P { E P {^ E }=P { S }−P { E } = 1−P { E } EVENTOS INDEPENDIENTES: Ingeniera Jessica Liset Martínez 86

Dos eventos E1 y E2 son independientes cuando la ocurrencia o no ocurrencia de uno de ellos en una prueba, no afecta la probabilidad del otro en cualquier otra prueba. En el lanzamiento de una moneda la probabilidad de obtener cara es ½ y la probabilidad de obtener otra cara en otra prueba, es también ½. Por lo que los dos eventos E1 y E2. La fórmula para buscar la probabilidad de que E 1 y E2, aparezcan cuando sean independientes es: P { E1 ∩ E2 } = p { E1 y E2 } =P { E 1 . E2 } =P { E 1 } . P { E2 } EJEMPLO: I.

Se lanzan dos dados simultáneamente. Uno verde y uno rojo. ¿Cuál es la probabilidad de que V ≥ 4 y R ≤ 2?

Procedimiento: 1. Se construye el espacio muestral (en un diagrama cartesiano), señalando los puntos muestrales para cada dado. 2. Para el dado rojo existen 12 puntos muestrales, que resultan de la combinación (1 y 2) con los puntos (1, 2, 3, 4, 5,6) del dado verde. 3. Para el dado verde existen 18 puntos muestrales al combinar los puntos (4, 5 y 6), con los (1, 2, 3, 4, 5, 6) del dado rojo. 4. Se calcula la probabilidad para cada evento: 18 1 12 1 P { E1 }=P { V ≥ 4 } = = ; P { E2 } =P { R ≤ 2 }= = 36 2 36 3 5. Se sustituye en la fórmula para eventos independientes: 1 1 1 P { E1 y E2 } =P {V ≥ 4 y R ≤2 }=P { E 1 } . P { E2 }= ∙ = 2 3 6 6. También se obtiene el mismo resultado dividiendo los puntos muestrales de la intersección de los dos eventos, por la cantidad de puntos muestrales del espacio muestral. 7. Interpretación: Si se lanzan dos dados simultáneamente, uno rojo y otro verde, la probabilidad de que el verde muestre una cara con números mayores o iguales a 4 y el rojo, menores o iguales a dos, es de 1/6.

Ingeniera Jessica Liset Martínez 87

4.4

PROBABILIDAD CONDICIONAL 4.4.1

Definición de probabilidad condicionada.

Para introducirnos en este concepto, veamos primero el siguiente ejemplo: Los resultados de una encuesta sobre la actitud política de 334 personas es el siguiente:

DERECHAS IZQUIERDAS TOTAL

HOMBRES 145 51 196

MUJERES 42 96 138

TOTAL 187 147 334

Sea A:’ser hombre’ y B:’ser de derechas’ Se elige una persona al azar, ¿Cuál es la probabilidad de que sea de derechas sabiendo que es hombre?. Evidentemente la probabilidad pedida es: pues hay 196 varones de los cuales 145 son de derechas. Esta probabilidad es la que llamamos Probabilidad condicionada del suceso B respecto al suceso A. Dicho de otro modo, la probabilidad condicionada de un suceso B respecto de otro A es la probabilidad del suceso B sabiendo que previamente ha ocurrido el suceso A. Definición: Se llama probabilidad condicionada del suceso B respecto del suceso A, y lo denotamos por

, al cociente: si

Análogamente se define . De lo anterior se deducen claramente las relaciones siguientes:

Ejemplo: De una urna que contiene 9 bolas rojas y 5 negras, se extraen sucesivamente 2 bolas. Calcular la probabilidad de los siguientes sucesos: a) Que las dos sean negras b) Que las dos sean rojas c) Que la segunda sea roja sabiendo que la primera fue negra. Solución: Ingeniera Jessica Liset Martínez 88

a) Sea

: Sacar la 1ª negra : Sacar la 2ª negra

b) Sea

: Sacar la 1ª roja : Sacar la 2ª roja

c) Sea

: Sacar la 1ª negra : Sacar la 2ª roja

1. Concepto de sucesos independientes. Definición: Dos sucesos A y B se dicen independientes si Ejemplo: Consideremos el experimento de extraer cartas de una baraja. ¿Cuál es la probabilidad de extraer dos reyes? a) sin devolver la 1ª carta. b) Con devolución Sol. a)

:”conseguir rey en la 1ª extracción” :”conseguir rey en la 2ª extracción” =

b) 2. Cálculo de probabilidades condicionadas y de intersección de sucesos. De la combinación de la fórmula de la probabilidad condicionada y de la definición de sucesos independientes se puede deducir que si dos sucesos A y B son independientes entonces:

Ingeniera Jessica Liset Martínez 89

Esta fórmula se puede extender para el caso de n sucesos independientes

,

quedando: = Como hemos visto, en el caso de sucesos dependientes teníamos la expresión:

que en el caso de tres sucesos sería:

pudiendo generalizar también esta fórmula para el caso de n sucesos. Definición: Se dice que un conjunto de sucesos forman un sistema completo de sucesos para un determinado experimento aleatorio si verifican las dos condiciones siguientes: -

son incompatibles dos a dos.

Teorema de la probabilidad total Sea

un sistema completo de sucesos tales que la probabilidad de cada uno de

ellos es distinta de cero, y sea B un suceso para el que se conocen las probabilidades entonces la probabilidad del suceso B viene dada por:

Demostración:

entonces :

Teorema de Bayes

Ingeniera Jessica Liset Martínez 90

,

Sea

un sistema completo de sucesos tales que la probabilidad de cada uno de

ellos es distinta de cero, y sea B un suceso para el que se conocen las probabilidades entonces:

,

Demostración:

despejando

nos queda:

y por el teorema de la probabilidad total :

. Ejemplo: Se tiene dos urnas, la primera tiene 3 bolas blancas y 2 negras, la segunda tiene 2 bolas blancas y 3 negras. Se elige al azar una urna y de ella se extrae una bola. Calcular la probabilidad de que sea blanca. Sea

:”elegir la urna nº1” :”elegir la urna nº2” :”extraer bola blanca”

Supongamos ahora que realizada la extracción, la bola resulta ser blanca y queremos saber qué probabilidad hay de que la bola proceda de la urna nº1.

Ingeniera Jessica Liset Martínez 91

UNIDAD 5: “DISTRIBUCIONES DE PROBABILIDAD”

Ingeniera Jessica Liset Martínez 92

5.1

VARIABLE ALEATORIA

5.2

CONCEPTOS BASICOS



Una variable aleatoria es una variable que toma valores numéricos determinados por el resultado de un experimento aleatorio. No hay que confundir la variable aleatoria con sus posibles valores. Ejemplos: - nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…) - nº de llamadas que recibe un teléfono en una hora - tiempo que esperan los clientes para pagar en un supermercado…



Las variables aleatorias pueden ser discretas o continuas: - Discretas: el conjunto de posibles valores es numerable. Suelen estar asociadas a experimentos en que se mide el número de veces que sucede algo. - Continuas: el conjunto de posibles valores es no numerable. Puede tomar todos los valores de un intervalo. Son el resultado de medir.

Ingeniera Jessica Liset Martínez 93

Ejemplo: Clasificar como discretas o continuas las siguientes variables aleatorias: a) nº de páginas de un libro → discreta b) tiempo que tarda en fundirse una bombilla → continua c) nº de preguntas en una clase de una hora → discreta d) cantidad de agua consumida en un mes → continua En la práctica se consideran discretas aquellas variables para las que merece la pena asignar probabilidades a todos los posibles sucesos elementales. Distribución de una variable aleatoria ●

Sea x una variable aleatoria discreta. Su distribución viene dada por los valores que puede tomar, x1, x2, x3, …, xk, y las probabilidades de que aparezcan p1, p2, p3, …, pk. Estas cantidades reciben el nombre de función de probabilidad o función de masa. Ejemplo: Variable aleatoria x=nº de caras al lanzar tres veces una moneda Posibles valores de x: 0, 1, 2 y 3 Lanzar 3 veces moneda: E={CCC,CCX,CXC,XCC,XXC,XCX,CXX,XXX} La variable aleatoria x: - Toma valor 0 cuando ocurre el suceso {XXX} - Toma valor 1 cuando ocurre el suceso {XXC,XCX,CXX} - Toma valor 2 cuando {CCX,CXC,XCC} - Toma valor 3 cuando {CCC} La función de probabilidad es:

Ingeniera Jessica Liset Martínez 94

Función de probabilidad de x: 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0

1

2

3

¿Cuál será la probabilidad de que salgan al menos dos caras?

¿y probabilidad de que el número de caras esté entre 1 y 2?

● La probabilidad de que una variable aleatoria x tome un valor entre dos cantidades a y b será:

● La función de probabilidad verifica que: -

-

Ingeniera Jessica Liset Martínez 95

la

● La función de distribución o de probabilidad acumulada representa en cada punto x0 la probabilidad de que la variable tome un valor menor o igual que dicho punto, es decir, . Ejemplo: nº caras al lanzar tres veces una moneda

Función de distribución de x 1.0 0.8 0.6 0.4 0.2 0.0 0

1

2

3



Sea x una variable aleatoria continua. Si queremos conocer su distribución de probabilidad no nos vale la función de probabilidad empleada con las discretas (cada valor con su probabilidad asociada) porque toma muchos valores. La probabilidad asociada a cada valor es prácticamente nula (la función de distribución es continua).



Emplearemos la función de densidad. Se interpreta de forma parecida al histograma. Expresa la “densidad” o concentración de probabilidad en cada zona. Expresa las probabilidades por áreas. Sus valores más altos corresponden a zonas en las que es más probable que aparezcan resultados del experimento aleatorio.

Ingeniera Jessica Liset Martínez 96

Media o esperanza de una variable aleatoria ●

La media o esperanza de una variable aleatoria discreta será:

Ejemplo: x=resultado de lanzar un dado La distribución de probabilidad de x será:

……………… El valor esperado de x será:



La idea de media o esperanza de una variable aleatoria continua es equivalente pero su cálculo es algo más complicado porque requiere emplear el concepto de integral.



La media de una variable aleatoria puede interpretarse como el valor esperado o medio que toma dicha variable o como el valor central de dicha distribución.



Propiedades: - si x e y son dos variables aleatorias se cumple que:

-

si a y b son constantes se cumple que:

Ingeniera Jessica Liset Martínez 97

Ejercicio Una compañía ha vendido 205 billetes para un avión de 200 plazas. Sea x la variable aleatoria que expresa el nº de viajeros que va al aeropuerto para viajar en el avión. Su distribución es: xi 198 199 200 201 202 203 204 205 pi 0,05 0,09 0,15 0,20 0,23 0,17 0,09 0,02 a) Hallar la probabilidad de que todos los viajeros que van al aeropuerto tengan plaza.

b) Obtener la probabilidad de que se quede sin plaza alguno de los viajeros que va al aeropuerto.

c) Calcular el nº esperado de viajeros que acude al aeropuerto.

d) ¿Cuál es la probabilidad de que la primera persona de la lista de espera tenga sitio en el vuelo?

Desviación típica de una variable aleatoria ●

La desviación típica de una variable aleatoria es una medida de dispersión de la distribución alrededor de la media. Los valores pequeños indican concentración de la distribución alrededor de la esperanza y los valores grandes corresponden a distribuciones más dispersas.



El concepto de desviación típica es equivalente en variables aleatorias discretas y continuas, aunque en estas últimas su cálculo es más complicado.

Ingeniera Jessica Liset Martínez 98



Si x es una variable aleatoria discreta su desviación típica viene dada por:

y su varianza será:



Propiedades: - si a y b son constantes se cumple que:

-

si x e y son dos variables aleatorias independientes se cumple que: y

Ejercicio: Se lanza tres veces una moneda. Sea x la variable aleatoria que expresa el nº de caras en los tres lanzamientos. a) Hallar y representar la función de probabilidad de x. (ver Ejemplo pag. 3) Se lanza 3 veces una moneda: E={CCC,CCX,CXC,XCC,XXC,XCX,CXX,XXX} x=0 →{XXX} x=1 →{XXC,XCX,CXX} x=2 →{CCX,CXC,XCC} x=3 →{CCC} b) Calcular el nº esperado de caras al lanzar la moneda. ¿Era previsible el resultado?

Sí, ya que en cada lanzamiento P(C)=1/2 y al lanzar tres veces se tiene que c) Hallar la desviación típica de x

Ingeniera Jessica Liset Martínez 99

.

o bien:



La desviación típica es una medida de dispersión que depende de las unidades de medida de la variable. Para evitar este inconveniente podemos emplear el coeficiente de variación. El coeficiente de variación de una variable aleatoria x será:

Ejercicio: Sea x una variable aleatoria que expresa el nº de personas que habitan en una vivienda elegida al azar. La distribución de probabilidad de x es la siguiente: xi 1 2 3 4 5 6 7 8ó+ pi 0,230 0,322 0,177 0,155 0,067 0,024 0,015 0,010 a) Comprobar que es una distribución de probabilidad. Todas las pi son mayores o iguales que cero y además se cumple que:

b) Hallar la probabilidad de que el nº de personas que viven en un hogar sea menor o igual que cuatro.

c) Calcular la probabilidad de que al menos dos personas vivan en una vivienda.

d) Obtener el nº medio de personas que habitan en una vivienda.

Ingeniera Jessica Liset Martínez 100

3

5.3

DISTRIBUCIONES DE PROBABILIDAD 5.3.1

Distribución Binomial

Objetivo: Presentar la distribución Binomial como un caso particular de distribución de probabilidad Discreta y realizar ejercicios relacionados con esto. Supongamos que un experimento aleatorio tiene las siguientes características:  En cada prueba del experimento sólo son posibles dos posibles resultados: el suceso A que llamaremos éxito y su contrario A´ que llamaremos fracaso.  El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente.  La probabilidad del suceso A es constante la representamos por p y no varía de una prueba a otra. La probabilidad de A´ es 1 – p  El experimento consta de un número n de pruebas Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que representa el número de éxitos obtenidos en cada prueba la llamaremos variable de la distribución Binomial. Esta variable es discreta ya que únicamente tomará los valores 0, 1, 2…….n Representaremos por B(n, p) a la distribución Binomial siendo n y p los parámetros de la distribución. Su fórmula es la siguiente:

()

n−m m P(A ocurra m veces) = n [ P( A) ] [ P( A c ) ] m

Donde n es el número de veces que se repite el experimento. m es el número de veces que debe ocurrir A. P(A) es la probabilidad que ocurra A al efectuar el experimento una sola vez. P(Ac) es la probabilidad que no ocurra A al realizar el experimento una sola vez. Ejemplo 1: Una marca de tabacos ha calculado que el número de fumadores en una ciudad es del 35%. Se escoge al azar una muestra formada por 10 personas. Comprueba si la variable que expresa el número de fumadores dentro de la muestra sigue una distribución Binomial. En caso afirmativo señala los parámetros de la distribución Solución: En cada prueba solo son posibles dos resultados: A = individuo fumador Ac = individuo no fumador 3 Todos los ejercicios son tomados del documento de Peña y Romo. Ingeniera Jessica Liset Martínez 101

El resultado obtenido de la pregunta Fuma o no fuma en cada individuo de la muestra es independiente de los otros. La probabilidad del suceso A es P(A) = 0.35 constante. Así pues la variable que representa el número de individuos fumadores en la muestra es una variable aleatoria que sigue una distribución Binomial cuyos parámetros son n = 10 y p = 0.35. A continuación le pasamos a explicar otra forma de la función de probabilidad de la distribución Binomial, la media y varianza y pondremos algunos ejemplos que aclaren todos estos conceptos. La función de probabilidad de la distribución Binomial viene dada por la siguiente expresión en otra forma:

()

P(Obtener x éxitos) = P(X=x)= n p x (1− p)n−x x Cómo el cálculo de estas probabilidades puede resultar algo trabajoso se han construido tablas que nos proporcionan para los distintos valores de n y de x, la probabilidad de que la variable X tome los distintos valores de 0 a n.  Parámetros de la distribución Si tenemos una distribución Binomial de parámetro n y p se verifica que Media o esperanza: μ=np Varianza: σ 2=np(1− p) Desviación típica: σ =√ np(1− p) Se estudiaran algunos ejemplos que aclaren estos conceptos: Ejemplo 2: Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la prueba y decide contestar aleatoriamente. Se pide 1. Probabilidad de acertar exactamente 4 preguntas 2. Probabilidad de no acertar alguna 3. Probabilidad de acertar todas 4. Probabilidad de acertar al menos 8 5. Probabilidad de acertar a los sumo 6 6. Media y varianza Solución: Consideremos los sucesos A = Contestar bien P(A) = 0.25 Ac = No contestar bien P (Ac) = 0.75 Se trata de una distribución Binomial de parámetros B (10,0.25) Sea X la variable aleatoria que representa el número de preguntas contestadas correctamente: 1.

( )

10−4 P ( de acertar 4 )=P ( X=4 ) = 10 (0.25)4 ( 0.75 ) =0.1460 4

Ingeniera Jessica Liset Martínez 102

2. 3. 4.

5.

( ) ( )

10 P ( no acertar alguna )=P ( X =0 ) = 10 (0.25)0 ( 0.75 ) =0.0563 0 0 P ( acertar todas )=P ( X =10 )= 10 (0.25)10 ( 0.75 ) =0 10 P ( acertar al menos 8 )=P ( X ≥ 8 )=P ( X =8 ) + P ( X =9 ) + P ( X=10 ) 2 1 P ( acertar al menos 8 )= 10 (0.25)8 ( 0.75 ) + 10 (0.25)9 ( 0.75 ) + 0=0.005 8 9 P ( acertar a lo sumo 3 )=P ( X ≤ 3 )=P ( X =0 ) + P ( X=1 ) + P ( X =2 )+ P ( X =3 ) 10 9 8 7 ¿ 10 (0.25)0 ( 0.75 ) + 10 (0.25)1 ( 0.75 ) + 10 (0.25)2 ( 0.75 ) + 10 (0.25)3 ( 0.75 ) =0.7759 0 1 2 3 Media y Varianza

( )

6.

( )

( )

( )

( )

( )

A continuación se proponen estos ejercicios para que los realicen los alumnos Ejercicio 1: La probabilidad de que un estudiante obtenga el título de licenciado en Geografía e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer curso 1. Ninguno de los 7 finalice la carrera 2. Finalicen todos la carrera 3. Al menos 2 acaben la carrera 4. Halla la media y la desviación típica Solución: Consideremos los sucesos: A = Finalizar la carrera P(A) = 0.3 = No finalizar la carrera P ( ) = 0.7 Por tanto se trata de una distribución Binomial de parámetros B (7,0.3) Sea X la variable aleatoria que representa el número de estudiantes que obtienen el título de licenciado en Geografía e Historia

Media y desviación típica

Ingeniera Jessica Liset Martínez 103

Ejercicio 2: En geografía Humana se ha determinado que las condiciones socioeconómicas del 35% de la población de una comarca determinada son inaceptables. Elegida una muestra de esa población formada por 9 individuos, calcular: 1. Probabilidad de que solo vivan 3 en condiciones inaceptables 2. Hallar la media y la varianza de la distribución Solución: Consideramos los sucesos A = Las condiciones socioeconómicas son inaceptables P(A)= 0.35 = Las condiciones socioeconómicas son aceptables P ( ) = 0.65 Por tanto se trata de una distribución Binomial de parámetros B (9, 0.35) Sea X la variable que representa el número de individuos que viven en condiciones socioeconómicas inaceptables a) Media y varianza

5.3.2

Distribución Normal

Cuando los datos están distribuidos con frecuencias ascendentes-descendentes aproximadamente simétricas, se le llama distribución normal. Cuando se trata de una variable discreta, o sea que solamente puede tomar valores como 1, 2, 3, 4, etc., pero no 2.04 ó 5.6, el histograma correspondiente está formado por un conjunto de barras como se muestra en la figura 2.5.1a. Si, en cambio, la variable es continua, el histograma es una curva como la mostrada en la figura 2.5.1b, llamada curva normal.

Ingeniera Jessica Liset Martínez 104

Figura 2.5.1 La distribución normal es una de las distribuciones más usadas e importantes. Se ha vuelto una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal. La distribución normal es llamada también campana de Gauss por su forma acampanada. En una curva normal lo que se utiliza es el área bajo la curva entre dos valores x 1 y x2 ver figura 2.5.1b, cuyo valor se emplea para obtener diferentes informaciones de los datos que conforman dicha curva. El procedimiento para obtener esa área es la que se va a estudiar en este apartado. Además, en una curva normal las tres medidas de tendencia central coinciden en el centro: la media, la moda la mediana; si acaso, puede haber una escasa diferencia entre algunas de ellas. También es simétrica respecto de la media, que es el punto más elevado de la curva y, por lo tanto, el área bajo la curva hacia la izquierda de la media es del 50% y el otro 50% se localiza a la derecha.

figura 2.5.2 Una característica muy importante de la curva normal es que a partir de su eje de simetría se puede dividir como lo muestra la figura 2.5.3, de tal manera que el valor igual a cero de la gráfica corresponda siempre a la media aritmética de la distribución normal de datos, y luego los datos nominales se pueden transformar a uno equivalente de la escala de – 3 a +3 de la figura 2.5.3. Por eso, a los datos comprendidos en la escala de - 3 a + 3 se les llama dato estándar.

figura 2.5.3 En esa escala estandarizada, el 1 representa una desviación estándar, el 2 representa dos desviaciones estándares, y así sucesivamente. El signo positivo solamente indica que está a la Ingeniera Jessica Liset Martínez 105

derecha del cero y el signo negativo significa que está a la izquierda. Con los ejemplos venideros se aclararán esos significados. ESTANDARIZACIÓN DE DATOS Por lo dicho en el párrafo anterior, los datos pertenecientes a una distribución normal se pueden estandarizar o normalizar, lo cual se consigue utilizando la fórmula: x−´x z= s En donde: z = dato estandarizado o normalizado z x = valor nominal del dato a estandarizar x ´x = media aritmética del conjunto de datos x s = desviación estándar. s Ejemplo 1: Convertir cada uno de los datos nominales de la siguiente tabla a datos estandarizados. Solución: Para transformar un dato nominal en dato estándar, también llamado dato z, se requiere calcular la media de todo el conjunto. Para este caso ya se da por hecho que se sabe calcular la media y la desviación estándar, por lo que se omiten sus cálculos. La media es y la desviación ´x = 12 estándar es s = 0.2994 Se tienen ya todos los datos para utilizar la fórmula del dato: x−´x z= x f xf Dato z s 6 1 6 7 2 14 8 3 24 9 5 45 10 9 90 11 15 165 12 18 216 13 15 195 14 9 126 15 5 75 16 3 48 17 2 34 18 1 18 88 El significado, a partir de que la media aritmética del conjunto es ´x = 12 y la desviación estándar es s = 2.2994, es el siguiente: Un valor estandarizado z = 1 significa una distancia a partir de la media aritmética igual a una desviación estándar a la derecha, es decir una distancia de 2.2994. Un valor estandarizado z = - 2 significa una distancia a partir de la media aritmética igual a dos desviaciones estándar a la izquierda, es decir, una distancia de 4.5988. Ingeniera Jessica Liset Martínez 106

Ahora bien, si al dato nominal x= 6 le corresponde un dato estándar z = - 2.609, significa que ese 6 se alejó de la media 2.609 desviaciones estándares a la izquierda. Y así con cada uno de los datos nominales. Gráficamente:

5.3.2.1

Áreas Bajo la Curva Normal

En una curva normal, el área bajo la curva desde el extremo izquierdo hasta la media, es decir, hasta el eje de simetría, es del 50% y, obviamente, el otro 50% está en la parte derecha. Una característica importante de la curva normal y de los datos normalizados es que el área bajo la curva desde la media hasta una desviación estándar, es decir desde z = 0 hasta z = 1, ya sea a la izquierda o a la derecha, siempre es del 34.13% respecto del área total que puede haber bajo la curva. De la misma forma, el área bajo la curva desde la media hasta dos desviaciones estándar, es decir desde z = 0 hasta z = 2, ya sea a la izquierda o a la derecha, es del 47.72%. Como la curva normal sale de graficar los datos recolectados, es obvio que esos porcentajes de áreas bajo la curva también lo son para dichos datos, es decir, para una desviación estándar, el porcentaje de datos entre la media y z = 1 es de 34.13% aproximadamente; para dos desviaciones estándar el porcentaje de datos entre la media y z = 2 es también aproximadamente de 47.72%. Por lo tanto, es posible obtener el porcentaje de área bajo la curva entre la media y cualquier valor estandarizado z, lo cual se ha concentrado en una tabla. La tabla de áreas bajo la curva, de los valores de z normalizados, en anexo 1. Esto último es muy importante: Debe tomarse en cuenta que los valores mostrados en la tabla son siempre desde la media hasta el valor estandarizado z. Ejemplo 2: Al recolectar 250 datos, se obtuvo que la media es ´x = 7.65 y la desviación estándar s = 2.24. Calcular el número de datos aproximados que hay entre la media y el dato nominal x = 8.1 Solución: Ingeniera Jessica Liset Martínez 107

En este caso el enunciado proporciona los valores de la media y de la desviación están-dar. Entonces, hay que estandarizar el valor nominal x = 8.1 con la fórmula de z. x−´x 8.1−7.65 z= = =0.20 s 2.24 Se toman solamente dos decimales porque así vienen en las tablas. A continuación, se busca en la tabla el valor de z = 0.20, para lo cual se localiza en la columna de la izquierda el valor z = 0.2 y en la primera fila de la tabla el 0. La celda intersección de la columna con la fila es el valor del área bajo la curva que se busca. El valor que le corresponde de 7.93% es el porcentaje de área bajo la curva entre la media y el dato z = 0.20, pero como ese porcentaje también corresponde a los datos recolectados, entonces puede obtenerse por una simple regla de tres el número de datos nominales comprendidos en esa región:

250 nd = 100 7.93 de donde el número de datos es nd. 250 ×7.93 nd= =19.82 100 El número datos en forma calculada es nd = = 19.82, pero ese valor carece de sentido ya que los datos recolectados siempre son números enteros, porque se recolectan 200 datos, o 220 datos, o 300 datos, pero jamás 291.8. Entonces entre la media aritmética y el dato z = 0.20 no pueden haber 19.82 datos nominales, o hay 19 o hay 20, pero no una fracción de ellos. De manera que lo correcto es redondear y expresarlo no como que “es igual”, sino como “aproximadamente”. La solución entonces se expresa así: Hay aproximadamente 20 datos entre la media de 7.65 y el dato nominal de 8.1. ´x = Ejemplo 3: Al recolectar 850 datos con una distribución normal, se obtuvo una media de 27 y una desviación estándar s=5.34. Calcular el número de datos aproximados que hay entre la media y el dato nominal x= 20. Solución: En este caso el enunciado proporciona los valores de la media y de la desviación están-dar. Hay que convertir el valor nominal x= 20, con la fórmula: x−´x 20−27 z= = =−1.31 s 5.34

Ingeniera Jessica Liset Martínez 108

En este caso el valor de z es negativo, lo que significa que el dato nominal x= 20 está a la izquierda de la media aritmética, pero en las tablas se busca simplemente como z=1.3; le corresponde un porcentaje de área de 40.49%.

850 nd = 100 40.49 de donde el número de datos es nd. 850 × 40.49 nd= =344.16 100 Hay aproximadamente 344 datos entre la media y el dato nominal. 5.3.2.2

Porcentaje Entre dos Datos Nominales

Otro problema que puede presentarse es cómo obtener el porcentaje de área bajo la curva ya no a partir de la media, sino entre dos datos nominales. Hay dos opciones: La primera es que los datos estandarizados z 1 y z2 se localicen uno a la izquierda y el otro a la derecha de la media. La solución a éste nuevo problema es muy simple, pues por una lógica muy elemental se puede deducir que el área total es igual a la suma del área 1 más el área 2, como se ve en la figura, en donde A 1 es el área desde la media hasta el dato estandarizado z 1, la cual se obtiene de la tabla. Mientras que A2 es el área desde la media hasta el dato estandarizado z2.

Otra opción que puede presentarse es la que se muestra a continuación, consistente en que ambos valores estandarizados, se encuentren del mismo lado respecto de la media, en la que también por una lógica muy elemental puede deducirse que el área total es simplemente la resta del área 1 menos el área 2. De tal manera que el porcentaje de datos entre z1 y z2 es la resta de porcentajes bajo la curva de cada uno. Como se muestra en la figura.

Ingeniera Jessica Liset Martínez 109

Ejemplo 4: De un conjunto de datos con una distribución normal, se obtuvo una media de ´x = 33.2, y una desviación estándar s = 9.4. Calcular el porcentaje de área bajo la curva que hay entre el dato nominal x1 = 14 y el dato nominal x2 = 45. Solución: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de área bajo la curva que a cada uno le corresponde se obtiene que: x− x´ x− ´x z 1= z 2= s s 14−33.2 45−33.2 z 1= =−2.04 z 2= =1.25 9.4 9.4 A1 = 47.93% A2 = 39.44% Como z1 es negativo significa que su región o porcentaje de área está a la izquierda de la media y como z2 es positivo, su porcentaje de área está a la derecha de la media. Por lo tanto, el porcentaje total de área bajo la curva es la suma de ambas, como se mostró anteriormente.

La suma de los porcentajes de áreas es el porcentaje total de área buscado: AT = 47.93% + 39.44% AT = 87.37% Ejemplo 5: De un conjunto de datos con una distribución normal, se obtuvo una media de ´x = 43.2 y una desviación estándar s = 8.9. Calcular el porcentaje de área bajo la curva que hay entre el dato nominal x1 = 53 y el dato nominal x2 = 68. Solución: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de área bajo la curva que a cada uno le corresponde se obtiene que: x− x´ x− ´x z 1= z 2= s s 53−43.2 68−43.2 z 1= =1.10 z 2= =2.78 8.9 8.9 A1 = 36.43% A2 = 49.73% El porcentaje total de área bajo la curva es la resta de ambas: Ingeniera Jessica Liset Martínez 110

A = 49.73% – 36.43% A = 13.3%

Ingeniera Jessica Liset Martínez 111

Tablas

Estadística Aplicada a la Educación

Uso de la tabla de la distribución normal típica Sea Z una variable aleatoria con distribución normal típica 1) Busca de la función de distribución de un número positivo. Supongamos que queremos calcular P{ Z ≤ 0,92}. Dicha probabilidad está representada por el área sombreada en la figura 1.

figura 1 Obtendremos la respuesta buscando en la tabla normal (para ello buscamos la fila correspondiente al número truncado en su primera cifra decimal (es decir 0,9) y la columna correspondiente a la segunda cifra decimal (es decir 0,02). La intersección de esa fila y esa columna nos indicará el número buscado.

Por lo tanto P{ Z ≤ 0,92}= 0,8212. 2) Cálculo de la función de distribución de un número negativo.

Ingeniera Jessica Liset Martínez 112

Tablas

Estadística Aplicada a la Educación

Supongamos que queremos calcular P{ Z ≤-1.53}. Dicha probabilidad está representada por el área sombreada en la figura 3.

figura 3 El número – 1.53 no figura en la tabla, pero eso no nos impide calcular la probabilidad en cuestión. Simplemente hay que tener en cuenta que, por la simetría de la campana de Gauss se tiene: P{Z  -1,53}= P{Z >1,53} La probabilidad que figura en el segundo miembro de la ecuación está representada en el área sombreada en la figura 4:

figura 4 Dicha probabilidad es la complementaria de la probabilidad P{Z ≤ 1.53}, representada en la figura 5

Ingeniera Jessica Liset Martínez 113

Tablas

Estadística Aplicada a la Educación

figura 5 Es decir: P{Z ≤1,53}+ P{Z >1,53}=1. Para hallar P{Z≤1,53} simplemente vamos a la tabla y procedemos como en el caso 1:

De aquí obtenemos P{Z ≤ 1,53} = 0,9370 y, por lo tanto: P{ Z ≤ -1,53}= P{ Z > 1,53} = 1 - P{ Z ≤ 1,53}= 1- 0,9370 = 0,0630 3) Cálculo de la probabilidad de que la normal típica caiga entre dos valores dados. Supongamos que queremos calcular P{0,41 < Z ≤ 1,62}. Esta probabilidad está representada por el área sombreada en la figura 7.

Ingeniera Jessica Liset Martínez 114

Tablas

Estadística Aplicada a la Educación

figura 7 Dicha probabilidad se puede calcular como P{ 0,41 < Z ≤ 1,62}.= P{ Z ≤ 1,62}- P{Z ≤ 0,41}. El minuendo y el sustraendo están representados por las áreas sombreadas en las figuras 8 y 9, respectivamente.

figura 8

figura 9

Ingeniera Jessica Liset Martínez 115

Estadística Aplicada a la Educación

Tablas

La busca en la tabla nos da los valores: P{ Z ≤1,62} = 0,9474, y P{Z ≤ 0,41} = 0,6591 . Por lo tanto: P{ 0,41 < Z ≤ 1,62}.= 0,9474 - 0,6591= 0,2883. 4) Cálculo de la probabilidad de que un normal con parámetros cualesquiera caiga entre dos valores dados. Supongamos que queremos calcular P{2,3 < X ≤ 3,7}. Donde X es una variable aleatoria normal con parámetros µ=1,5 y =2 Esta probabilidad está representada por el área sombreada en la figura 10.

. figura 10 Para calcular esta probabilidad, llevamos la variable X a una normal típica, restando µ y dividiendo entre σ : P{2,3 < X ≤ 3,7} = P{(2,3 - µ) / σ < (X-µ) / σ ≤ (3,7-µ) / σ } = P{(2,3-1,5) /2 < (X-1,5) /2 ≤ (3,7-1,5) /2 }= P{0,4< (X-µ) / σ

≤ 1,1 }

la variable Z= (X-µ) σ tiene distribución normal típica. La probabilidad que se quiere calcular es igual al área sombreada en la figura 11: La resolución del problema se reduce entonces a lo explicado en la parte 3. P{2,3 < X ≤ 3,7} = P{0,4< Z ≤ 1,1 } = P{ Z ≤ 1,1 } – P{ Z ≤ 0,4 } = 0,8643 - 0,6554 = 0,2089

figura 11

Ingeniera Jessica Liset Martínez 116

Estadística Aplicada a la Educación

Tablas

TABLA I (A) DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1) La tabla proporciona, para cada valor de z, el área que queda a su izquierda.

Ingeniera Jessica Liset Martínez 117

Estadística Aplicada a la Educación

Tablas

TABLA I (B) DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1) La tabla proporciona, para cada valor de z, el área que queda a su izquierda.

Ingeniera Jessica Liset Martínez 118

Estadística Aplicada a la Educación

Tablas

TABLA II DISTRIBUCIÓN NORMAL TIPIFICADA N(0 , 1) La tabla proporciona el área que queda comprendida entre 0y z.

Ingeniera Jessica Liset Martínez 119

Estadística Aplicada a la Educación

Ingeniera Jessica Liset Martínez 120

Tablas

Estadística Aplicada a la Educación

Ingeniera Jessica Liset Martínez 121

Tablas

Estadística Aplicada a la Educación

Tablas

BIBLIOGRAFÍA Sitios Web:    

http://www.itch.edu.mx/academic/industrial/estadistica1/toc.html http://es.scribd.com/doc/37268578/Distribucion-muestral-3#download http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un3/cont_305_83.html http://matematica1.com/category/distribucion-normal/

Documentos: Probabilidad y Distribuciones de Probabilidad. Héctor Hernández Primitivo Reyes Aguilar. Enero 2009. http://cms.dm.uba.ar/academico/materias/verano2014/probabilidades_y_estadistica_C/tabla_ tstudent.pdf http://juancarlosvergara.50webs.org/Apuntes/Ejercicios%20Parte%20II.pdf Libros:            

ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA. ANDERSON -SWEENEYWILLIAMS. 10ª EDICION INTRODUCCION A LA ESTADÍSTICA. LINCOLN L. CHAO. Estadística para Ciencias del Comportamiento. Elorza, Haroldo. Estadística Psicoeducativa Trillas. Escotet, Miguel. Estadística en Psicología y Educación. Garret, Henry H. Estadística General. Haber y Rynion. Métodos Estadísticos aplicados a las Ciencias Sociales. Stanley/Glass. Estadística. Teoría y Problemas. Spiegel, Murria Otros materiales entregados por la maestra. Estadística. Serie Schaum Spiegel M. R. Carrasco Arroyo, S (2005): Aproximación a la Estadística desde las Ciencias Sociales. Valencia, España.http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf Zavrostsky, A: Varias definiciones de la Estadística. Revista de Economía. Facultad de Ingeniería. Universidad de Los Andes, Venezuela. http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf

Ingeniera Jessica Liset Martínez 122

UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMATICA ESTADÍSTICA APLICADA A LA EDUCACION GUÍA DE PRÁCTICA Nº 1 TEMA: ESTADÍSTICA DESCRIPTIVA 1. OBJETIVOS 

Reforzar los conceptos básicos de estadística descriptiva.



Elaborar distribuciones de frecuencias según los pasos discutidos en clases.



Utilizar los distintos tipos de gráficos para presentar la información en estudio.

2. METODOLOGÍA Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva, con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas dentro y fuera del aula, asistidos por la docente responsable de dicha práctica. 3. EJERCICIOS I PARTE: A. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante. Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del módulo. 1. ¿Cuál es la diferencia entre Estadística y Estadísticos? 2. Piensa ejemplos de Estadísticos que puedan resultar útiles para aplicar en el campo de las relaciones laborales. 3. Explica la diferencia entre Estadística Descriptiva y Estadística Inferencial. 4. Distingue entre población y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar con toda la población (censo) o con muestras. Fundamenta. 5. ¿Qué relación hay entre las unidades de análisis y la población? 6. Piensa ejemplos de variables con sus sistemas de categorías. Identifica el nivel de medición. B. Se quiere realizar un estudio para conocer el perfil que los docentes, deben cumplir para ser elegidos en el sistema público, y su tipo de contratación. Imagina qué características podrían ser de interés estudiar. Identifica las variables que se corresponden con esas características y el sistema de categorías que les asignarías. Menciona el nivel de medición de cada variable. Construye la estructura de la matriz de datos en la cual se volcaría la información recogida.

C. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que se les ha asignado. Variable

Categorías

Escala de medición

Nivel educativo

Ninguno Primaria Secundaria Terciaria Nivel 0 año aprobado educativo 1 año aprobado 2 años aprobados Categoría de Patrón ocupación Empleado público Empleado privado Cooperativista Trabajador por cuenta propia Trabajador familiar no remunerado I PARTE: 1. Identifique el Tipo de Variables en Cualitativas ( nominal – ordinal ) – Cuantitativas. (discretas y continuas ) a) Genero ( sexo ) de la persona . b) Color de ojos de la persona. c) Tiempo transcurrido desde el nacimiento hasta el momento de la toma del dato. d) Número de hijos en la familia. e) Percepción que tiene el médico del mejoramiento de un paciente. f) Longitud del cuerpo humano, sin usar zapato. g) Tipo de cáncer que se diagnostica.. h) Nombre del periódico matutino que se lee. i) Temperatura medida a las 6.00 a.m. j) Volumen de llenado de la botella de leche. k) Número de piezas defectuosas por hora. l) Grado de interés del entrevistado en asuntos políticos. m) Longitud recorrida desde la casa. 2. Para cada una de las siguientes variables determine los valores, si la variable es Cualitativa o si es Cuantitativa en ( discreta – continua) a.- Estado de salud de una persona. b.- Precio de una calculadora científica. c.- Número de llamadas que recibe un conmutador. d.- Monto de una compra al contado que se hace en una tienda. e.- Temperatura corporal de una persona con gripe. f.- Analgésico que toma una persona para aliviar un dolor de cabeza. g.-Número de transacciones realizadas al día en cierto cajero automático

h.- Tipo de cirugía a la que es sometido un paciente en cierto hospital. i.- Tiempo de préstamo de cierto libro otorgado a un estudiante. j.- Nivel de ansiedad de una persona medido por una prueba estandarizada. k.- Severidad de las quemaduras en una persona rescatada de un incendio. l.- Consumo diario de agua que hace una persona. ll.- Posible presencia de parásitos en un paciente que presenta problemas digestivos. m.- Tipo de complicación que padeció un bebé al momento de nacer. n.- Posible causa de alta temperatura en una persona. ñ.- grado de toxicidad del veneno de una araña. o.-Fecha de nacimiento de una persona. p- Intensidad con que siente una persona un dolor de cabeza. 3. Se realizó un estudio en 20 perros. La siguiente tabla muestra su distribución según tamaño. Tamaño Pequeño Mediano Grande

Nº de animales 4 6 10

a) Clasifique la variable Tamaño. b) ¿Qué porcentaje de los animales es de tamaño pequeño? c) Grafique la información en un gráfico de barras 4. En una empresa ganadera se han pesado los animales y se han obtenido los siguientes datos. Peso (Kgs ) Nº de animales 300 - 400 1 2 a) ¿Qué porcentaje de 400 - 500 los animales pesa entre 500 500 600 10 y 600? 2 b) ¿Qué porcentaje de 600 - 700 los animales pesa más de 400? c) ¿Qué porcentaje de los animales pesa como mínimo 600 kilos? d) Construya un histograma con la información de la tabla. 5. Los siguientes datos corresponden a los lugares favoritos de vacaciones de los empleados de un empresa. Mar Campo Montañ a

Montañ a Montañ a Campo

Camp o Mar Mar

Mar Camp o Mar

Ma r Ma r Ma r

Montañ a Mar

Camp o Mar

Montañ a Campo

Campo

Camp o

Montañ a

Ma r Ma r Ma r

Camp o Camp o Mar

Campo

Montañ a

Camp o

Mar

Ma r

Montañ a

Mar

Montañ a

Ma r

Camp o

a.- Construya una tabla de distribución de frecuencias para este tipo de datos. b.- ¿Qué porcentaje de los trabajadores prefiere la montaña? c.- ¿Qué porcentaje de los trabajadores prefieren el mar? d.- Construya un gráfico para este tipo de tabla 6. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa para ofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costo moderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de arrendamiento implica decidir qué tipo de automóvil prefieren los trabajadores, pues en función de esto se podrá seleccionar la mejor empresa arrendadora. El gerente de recursos humanos realiza un muestreo aleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin importar los niveles, y les aplica una encuesta en la cual les pregunta cuál sería la marca de su preferencia. A continuación se presentan los resultados. FORD = F CHEVROLET = CH MAZDA = M VOLKSWAGEN = V NISSAN = N OTROS = O. F CH CH F M CH F CH CH O V F N CH CH CH F CH V V N CH CH N M M O V F F CH CH N F CH V V V CH V M V CH CH V N O V F M CH V V M CH CH CH O V M a.- Construya una tabla de Distribución de Frecuencia para dichos datos. b.- Construya un gráfico para este tipo de tabla. c.- De la tabla saque tres conclusiones. 7. Se pidió a 40 colaboradoras casadas de una empresa textil, seleccionadas aleatoriamente, que dijeran el número de horas que habían dormido la noche anterior. Los resultados fueron: 5 6 7 5

6 6 4 7

6 6 4 6

6 4 5 5

3 5 3 7

4 5 4 7

7 5 6 4

5 5 4 5

5 5 7 8

9 4 5 6

a) Construya una tabla de distribución de frecuencia para dichos datos. b) Con los datos de la tabla conteste las siguientes preguntas. 1.- ¿Cuántas colaboradoras durmieron 8 horas noche anterior? 2.- ¿Qué porcentaje de las colaboradoras durmieron 6 horas noche anterior? 3.- ¿Cuántas colaboradoras durmieron entre 3 y 6 horas la noche anterior? 4.- ¿Qué porcentaje de las colaboradoras durmieron entre 3 y 7 horas la noche anterior? 5.- ¿Cuántas colaboradoras durmieron 7 y más horas la noche anterior?

c) Construya un gráfico para este tipo de tabla. 8. Construya una tabla de distribución de frecuencias , con los puntajes obtenidos en la Prueba de ingreso Universitario, en una muestra de 50 estudiantes. 331 535 526 462 675

625 573 715 539 489

450 370 430 581 460

519 760 372 468 613

730 328 333 755 789

427 612 405 440 390

640 569 710 629 544

619 592 777 810 632

690 674 381 670 487

409 438 461 570 465

a.- ¿Cuántos estudiantes obtuvieron entre 504 y menos de 548 puntos? b.- ¿Qué porcentaje de los estudiantes obtuvo entre 680 y menos 724 puntos? c.- ¿Cuántos estudiantes obtuvieron menos de 680 puntos? d.- ¿Qué porcentaje de los estudiantes obtuvo menos de 504 puntos? e.- ¿Cuántos estudiantes obtuvieron 636 puntos y más? f.- Construya un gráfico para este tipo de tabla. 9. En un estudio se le preguntó a 381estudiantes de tiempo completo de cierta Universidad y que trabajan, cuántas horas a la semana dedican a un trabajo asalariado. Y se obtuvo la siguiente información. Intervalos Marca Clase Frec. Absoluta Frec. Abs. Acu Frec. Relativa Frec. Rel. Acu 0 - 3 5 3 - 6 77 6 - 9 83 9 - 12 74 12 - 15 55 15 - 18 36 18 - 21 26 21 - 24 16 24 - 27 8 27 - 30 1 a.- Complete la tabla de distribución de frecuencia. b:- ¿Cuántos estudiantes dedican menos de 18 horas semanales al trabajo? c.- ¿Qué porcentaje de los estudiantes dedican entre 15 y menos de 18horas semanales al trabajo? d.- ¿Qué porcentaje de los estudiantes dedican menos de 21 horas semanales al trabajo? e.- ¿Cuántos estudiantes dedican 18 horas y más al trabajo? f.- Construya un gráfico para este tipo de tabla. 10. Las notas del examen parcial de matemática dieron la siguiente distribución de frecuencias. a) Completar la distribución de frecuencias. b) Graficar el histograma de porcentajes. Intervalos 3 -

Marca Clase

Frecuencia Relativa 0.15

Frec. Relat. Acumulada

6

-

0.45 0.70 13.5 0.10

11. Señala 4 áreas distintas en las cuales se utilice la estadística como herramienta de investigación. 12. Se desea saber si los dueños de automóviles catalíticos están dispuestos a pagar la conversión de sus motores a gas natural. Para ello se decide realizar una encuesta. a) Determina cuál de las siguientes es la mejor muestra:  Escoger al azar a adultos que caminan por el centro de las principales ciudades del país.  Escoger al azar a conductores de automóviles en las intersecciones más concurridas.  Escoger al azar del registro de vehículos motorizados a dueños de automóviles catalíticos y enviarles un encuestador. b) Explica la razón de tu elección, señala las ventajas y desventajas de cada alternativa. c) ¿cuáles son las variables en la encuesta? ¿A qué tipo de variables corresponden? 13. A continuación aparece una distribución de frecuencias de los niveles de zinc en la sangre en hombres entre las edades de 15 y 17 años de edad. VARONES ESTADOUNIDENSES, DE 15 A 17 AÑOS DE EDAD. Nivel de zinc en la sangre (Ug/dl) Cantidad de Varones 50 19 6 60 69 35 70 79 110 80 89 116 90 99 91 100 109 63 110 119 30 120 . 129 5 130 139 2 140 149 2 150 159 2 a) Calcule la frecuencia relativa asociado a cada intervalo de la tabla. ¿Qué concluye usted acerca de la distribución de niveles de zinc en la sangre? b) Diseñe un histograma de los datos. 4

4 Diseñada por profesor Carlos Flores Carvajal

UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMATICA ESTADÍSTICA APLICADA A LA EDUCACION GUÍA DE PRÁCTICA Nº 2 TEMA: ANALISIS ESTADISTICO 1. OBJETIVOS 

Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.



Realizar el análisis y comparación de los distintos cálculos de medidas.



Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.

2. METODOLOGÍA Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva, con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas dentro y fuera del aula, asistidos por la docente responsable de dicha práctica. 3. EJERCICIOS I PARTE: Tendencia Central 1. En una calle de la ciudad se midieron con radar las velocidades de 55 automóviles: 27 23 22 38 43 24 35 26 28 18 20 25 23 22 52 31 30 41 45 29 27 29 28 27 25 29 28 24 37 28 29 26 33 25 27 25 34 32 36 22 32 21 23 24 18 48 23 16 38 26 21

43 18 33 23

a. Clasifique estos datos en una distribución de frecuencias agrupada utilizando las clases 15-20, 20-25 ..., 50-55. b. Encuentre el ancho de clase. c. Obtenga las distintas medidas de tendencia centra: Media mediana moda d. Obtenga el primer y tercer cuartil e. Obtenga las distintas medidas de variabilidad: La varianza el desvío estándar de la muestra f. Elabore un pequeño informe con los resultados obtenidos. 2.En mayo pasado se aplicó una encuesta a 32 estudiantes de UTN. A cada estudiante se le preguntó :"¿cuántas horas de televisión vio ayer?". Los resultados son los siguientes: 0

0

1/2

1

2

0

3

2 .5

0 2.5 6

0 1 2.5

1 0 0

1.5 2 0.5

5 0 1

2.5 2.5 1.5

0 4 0

2 0 2

a. Clasifique estos valores en una distribución de frecuencias agrupadas b. ¿Cuáles son las fronteras de estas clases? c. ¿Cuáles son las marcas correspondientes? d. ¿Cuál es la forma del histograma producido por estos datos? e. Encuentre la media. f. Encuentre la mediana. g. Encuentre la moda. h. Encuentre la variancia y el desvío. i. Elabore un pequeño informe con los resultados obtenidos. 3. Se pidió a 15 estudiantes de universidad seleccionados aleatoriamente, que dijeran el número de horas que habían dormido la noche anterior. Los datos resultantes fueron 5, 6, 6, 8, 7, 7, 9, 5, 4, 8, 11, 6, 7, 8, 7. Obtenga lo siguiente: a. La media . b. La mediana . c. La moda. d. La variancia. e. El desvío. f. Interprete los resultados obtenidos elaborando un pequeño informe. Ejercicios Tema: medidas de dispersión 1) Calcular todas las medidas de dispersión para la siguiente distribución X 5 10 15 20 25 i

ni

3

7

5

3

2

2) Calcular todas las medidas de dispersión para los datos de la siguiente distribución x 0– 100– 200– 300100 200 300 800 n 90 140 150 120 3) Una empresa de fabricación de productos cerámicos dispone de tres centros de producción. En el centro A, el más grande y moderno, se hace un estudio de los m² de azulejo producidos al mes durante el año pasado, obteniéndose una media de producción mensual m² , con una desviación típica SA = 15.000 m² . Se sabe que el centro B, por tener maquinaria más anticuada que A, produce cada mes un tercio de la producción de A, y que el centro C, por tener un horno menos que B, produce cada mes 25.000 m² menos que B ¿Cuál es la media y la varianza de la producción mensual de C?

4) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿cómo están relacionadas las medias?. 5) Multiplicando cada número 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos el conjunto 11, 17, 9 7, 19 15. ¿Cuál es la relación entre la desviación típica de ambos conjuntos? ¿Y entre las medias? 6) Tenemos una variable X de la que sabemos que: CV = 0,5 y que Sx = 3. ¿Cuál es el valor de la media de X?. 7) El coeficiente de variación de la variable X sabemos que es 1 ¿Qué podemos decir sobre su media y su varianza? 8) Tenemos dos variables X e Y con el mismo recorrido y media, siendo sus varianzas 4 y 9 respectivamente. ¿Para cuál de las dos variables el valor de la media es más representativo? 9) Sea una variable con media 8 y desviación típica 0. ¿Qué se puede afirmar sobre el comportamiento de esta variable?. 10) La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1.999 para las comunidades autónomas de Aragón y Canarias, en tantos por cien es la siguiente: Edades 16–18 18–30 30–50 50–70 70–90

Aragón 3.54 21.56 31.63 28.14 15.12

Canarias 4.35 29.99 35.21 21.97 8.48

a) Representa sobre los mismos ejes de coordenadas los histogramas de la distribución de la edad para las dos CC.AA. (emplea distinto trazo o distintos colores). ¿Qué conclusiones obtienes a la vista de los histogramas? b) Calcula la edad mediana para las dos comunidades. Compáralas. ¿Qué indican estos resultados? c) Qué comunidad tiene mayor variabilidad en la distribución de su edad? 11).En el siguiente histograma se representa la distribución de los salarios (variable X), en miles de pesetas de una industria del sector cerámico:

Fre cuen cias r elativas

Variable X (m ar cas de clase)

Conforme a esta información determinar a) Tabla estadística de frecuencias b) Salario mediano, moda y coeficiente de variación c) Sueldo mínimo del 20% de los empleados con mayor sueldo. ¿Qué porcentaje de la nómina corresponde a este grupo. d) De los sueldos de otra empresa también perteneciente al sector cerámico se sabe que el sueldo medio de sus trabajadores es de 120.000 ptas., con una varianza de 0,5 y que la mediana de los sueldos es de 125.000 ptas. ¿Qué empresa tiene un sueldo medio más representativo? Razona la respuesta. 12) Al lanzar 200 veces un dado se obtuvo la siguiente distribución de frecuencias x 1 2 3 4 5 6 n a 32 35 33 b 35 Hallar la mediana, la moda y la varianza de la distribución, sabiendo que la media aritmética es 3,6. 13) En un taller de reparación de automóviles recojo datos sobre los días de permanencia de los vehículos a reparar en él, y obtengo: Días de estancia 1 2 3 4 5 8 15 Nº de coches 23 12 7 10 3 2 1 a) Calcula el número medio de días de permanencia y una medida de su representatividad b) ¿Cuantos días como máximo permanecen en el taller el 75% de los automóviles, que menos permanecen en el taller? c) Calcula la mediana y la moda 14) Sea una distribución de frecuencias con las siguientes características 30. Determinar estas medidas para la distribución yi = xi + 10

; Mo = 5;

; n=

15) Sean X e Y tales que ; ; ; . Sabiendo que yi = axi + b determinar los valores de estas dos constantes a y b

y que a>0,

16) Sea una distribución con las siguientes características

; Me= 6.

Determinar estas medidas para la distribución:

; Mo = 5 ;

17) La siguiente tabla muestra los coeficientes de inteligencia de 480 niños de una escuela elemental. C.I.

70

74

78

82

86

90

94

98

ni

4

9

16

28

45

66

85

72

10 2 54

10 6 38

110 114 118 12 2 27 18 11 5

126 2

Calcula: a) El C.I. medio de los niños estudiados b) Su desviación típica. c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un C.I. superior al de su hijo, ¿qué C.I. tiene el niño? d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los niños con mayor C.I., pero que el psicólogo solo puede atender al 15% de los niños del centro. ¿Qué C.I. deberá tener un niño como mínimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro, precisamente para aquellos que tengan menor C.I. ¿Hasta qué niños de qué C.I. deberemos considerar en estas clases? 18) La tabla siguiente recoge la distribución (en porcentajes) de volúmenes de ventas anuales en las empresas cerámicas de la provincia durante el año pasado: Ventas (dólares) menos de 2.500 2.500–5.000 5.0000–10.000 10.000–20.000 20.000–40.000 40.000–100.000 100.000–250.000 250.000–500.000 500.000 o más

Empresas (%) 25,9 13,2 13,0 17,7 11,0 14,4 8,5 1,8 0,6

a) ¿Por qué ni la media ni la desviación típica son medidas apropiadas de centralización y de dispersión, respectivamente, para esta distribución?. b) ¿Qué medidas de centralización y de dispersión deben utilizarse en su lugar?

III PARTE: REFORZAR 1) El siguiente cuadro muestra la distribución de la renta anual (en miles de soles) en que incurren 50 viviendas: Marca de Clase

18.85

21.55

24.25

26.95

29.65

32.35

35.05

N° de Viviendas

3

2

7

7

11

11

9

a) Halle e interprete según el enunciado i) Media, mediana y moda. ii) Desviación estándar y coeficiente de variabilidad. b) Estime el porcentaje de viviendas con rentas superiores o iguales a 26 000 soles pero menores que 32 000 soles. c) Si las rentas menores que 28 300 soles se incrementaron en 2 500 soles y las rentas mayores o iguales que 28 300 soles se redujeron en un 30%. Calcule la nueva renta promedio. 2) Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos mínimos requeridos. Para decidir cuál de los 2 se va a contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos. Los resultados se dan a continuación:

1 57 80

Puntaje obtenido por A Puntaje obtenido por B

2 55 40

3 54 62

Prueba 4 52 72

5 62 46

6 55 80

7 59 40

a) Halle e interprete la media, mediana y moda de los dos candidatos. b) Estadísticamente ¿Cuál de los candidatos debe ser contratado? Fundamente su respuesta. 3) Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviación estándar de 3.4 cm. Posteriormente se verificó que la media usada tenía 4 cm de menos. Rectifique los estadígrafos mencionados. 4) Una asistencia social desea saber cuál es el índice de natalidad en 2 distritos de Lima para lo que encuestó a 10 familias de cada distrito con los siguientes resultados A B

0 3

6 4

1 1

2 4

3 2

1 3

4 1

3 5

6 4

4 3

a) Calcule la media, mediana y moda para cada distrito e interprételos. b) Considera Ud. que en el distrito B, el número de hijos por familia es más homogéneo que en el distrito A. 5) La producción de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el departamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn. con 1440000 de variancia, en qué departamento se puede decir que la producción de papa es más homogénea

6) El salario promedio en una ciudad es de 11 000 u.m. con una variancia de 2 000 u.m. ¿Cuáles serán la nueva media y la nueva variancia si se efectúan los siguientes cambios: a) Se aumenta 810 u.m a todos b) Se aumenta el 15 % de su salario a cada trabajador c) Si se duplican los sueldos 7) En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desviación estándar de 20 puntos En el curso B los alumnos obtienen una media de 80 y desviación estándar de 16. Ante un reclamo se decide subir en 5% más 5 puntos adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidió disminuir la quinta parte de la calificación. Después de los mencionados ajustes ¿Cuál es el puntaje medio de los 50 alumnos? 8) Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40 zonas del país Y1´=20 f2-f5=2 Y5´= 100 f1=4 f3=20 Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase. a) Reconstruya los intervalos de clase y obtenga las frecuencias absolutas b) Calcule la media, la mediana y moda e interprételos c) Calcule la variancia, desviación estándar y coeficiente de variabilidad

UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMATICA ESTADÍSTICA APLICADA A LA EDUCACION GUÍA DE PRÁCTICA Nº 3 TEMA: TECNICAS DE CONTEO 1. OBJETIVOS 

Utilizar las distintas técnicas de conteo vistas en clase.



Determinar los distintos ejemplos de combinación y permutación.



Fomentar el uso de técnicas de conteo y su aplicación en el medio.

2. METODOLOGÍA Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva, con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas dentro y fuera del aula, asistidos por la docente responsable de dicha práctica. 3. EJERCICIOS Técnicas de Conteo 1. En un sistema de comunicación digital, cada mensaje se clasifica según llega o no dentro del tiempo establecido por el diseño del sistema. Si se clasifican tres mensajes, utilice un diagrama de árbol para representar el espacio muestral de los posibles resultados. 2. La orden de pedido de un automóvil puede especificar transmisión automática o estándar, con o sin aire acondicionado, y uno de cuatro colores: rojo, azul, negro o blanco. Utilizando la regla de la multiplicación y el diagrama de árbol, describa el conjunto de todos los pedidos posibles para este experimento. 3. En el diseño de la cubierta de un tren de engranes pueden emplearse cuatro tipos diferentes de sujetadores, tres longitudes distintas de tornillo y tres posiciones diferentes de éstos. Utilice la regla de la multiplicación para conocer el espacio muestral formado por el experimento. 4. Una persona acomoda en un estante de una librería seis libros de filosofía, cuatro de química y ocho de historia. De cuántas formas se pueden acomodar los libros si: a) los de historia siempre deben de ir juntos b) los libros deben de ir separados por materias 5. Un examen de métodos numéricos está formado por tres temas. EL tema A contiene seis preguntas, el tema B cuatro y el tema C ocho preguntas y se tienen que contestar mínimo tres

preguntas de cada tema, calcula de cuántas maneras diferentes un estudiante puede elegir sus preguntas. 6. Se quieren formar arreglos de cuatro cifras con los números 0 a 9. a) ¿cuántos números diferentes de cuatro cifras se pueden formar con los números 0 a 9 si no se permite la repetición y el cero no puede ir al principio y los números formas pueden ser cualesquiera? b) Los números formados del inciso a) deben ser pares. Regla del Producto y Permutaciones 1. Un sábado, cuando iban de compras, Luisa y María vieron a dos hombres alejarse en automóvil de la fachada de una joyería, justo antes de que sonara una alarma contra robos. Aunque todo ocurrió muy rápido, cuando fueron interrogadas las dos jóvenes, pudieron dar a la policía la siguiente información acerca de la placa (dos letras seguidas de cuatro dígitos) del automóvil que huyó. María estaba segura de que la segunda letra de la placa era O o una Q, y que el último dígito era un 3 o un 8. Luisa dijo que la primera letra de la placa era una C o una G y que el primer dígito era un 7. ¿Cuántas placas diferentes tendrá que verificar la policía? (800) 2. Tres pueblos, designados como A, B y C, están intercomunicados por un sistema de carreteras de doble sentido, como se muestra en la figura 1.1. a. ¿De cuántas formas puede una persona ir del pueblo A al pueblo C? (14) b. ¿Cuántos trayectos puede hacer una persona del pueblo A al pueblo C y de regreso al pueblo A? (196) c. ¿Cuántos de los trayectos completos de la parte (b) son tales que el viaje de regreso (del pueblo C al pueblo A) es diferente, al menos parcialmente, de la ruta que toma una persona del pueblo A al pueblo C? (182) 1

5

2

6

3 A

B 4

7

C

8 9 Figura 1.1

3. Un profesor de computación tiene 7 libros de programación diferentes, de los cuáles 3 son de JAVA y 4 de C++. De cuántas formas puede ordenar el profesor estos libros: a. No hay restricciones. (7!) b. Los lenguajes se deben alternar. (3!4!) c. Todos los libros de JAVA deben estar juntos. (3!5!)

4. 5.

6.

7.

d. Todos los libros de JAVA deben estar juntos y todos los libros de C++ también. (3!4! 2) Enumere todas las permutaciones de las a, c, t y u. De cuántas formas es posible distribuir 12 libros diferentes entre cuatro niños de modo que: a. Cada niño reciba tres libros. (12!/(3!3!3!3!)) b. Los dos niños mayores reciban cuatro libros cada uno y los dos menores reciban dos libros cada uno. (12!/(4!4!2!2!)) Con la palabra SOCIOLOGICAL: a. ¿Cuántas disposiciones hay de todas las letras de la palabra? (12!/(3!2!2!2!1!1!1!)) b. ¿En cuántas de las disposiciones de la parte (a) están juntas la A y la G? (11!/(3!2!2! 2!)*2!/(1!1!)) c. ¿En cuántas de las disposiciones de la parte (a) están juntas todas las vocales? (7!/(2! 2!)*6!/(3!2!)) Doce platillos (con forma idéntica) se ordenan en cuatro columnas verticales, como se muestra en la figura 1.2. Hay 4 de color rojo en la primera columna, 3 azules en la segunda columna, 2 grises en la tercera columna y 3 blancos en la cuarta columna. Para entrar al equipo de tiro de su universidad, Carlos debe romper 12 platillos (con su pistola y sólo 12 balas) y, para esto, siempre debe romper el platillo que queda en la parte inferior de la columna. En estas condiciones, ¿de cuántas formas puede disparar (y romper) y romper los 12 platillos? (12!/(4!3!2!3!)).

R

A

G

B

R

A

G

B

R

A

B

R

Figura 1.2

8. Se tienen 7 personas para sentar en una mesa circular. De cuántas formas puedo sentarlas: a. Sin restricciones. (6!) b. Si dos de las personas insisten en sentarse juntas. (5!*2) 9. En un computador los nombres de los archivos son palabras que tienen de uno a cinco caracteres, cada carácter puede ser alguno de los 36 alfanuméricos (26 letras y 10 dígitos) o cualquiera de otros 15 símbolos determinados. El computador no distingue mayúsculas de minúsculas. También es posible añadir al nombre del archivo una extensión de archivo opcional, la cual es de tres caracteres alfanuméricos, esta extensión se obtiene al escribir un punto y tres caracteres alfanuméricos.

a. Sin restricciones. b. ¿Cuántos nombres de archivo utilizan solamente los 36 caracteres alfanuméricos, sin extensión? c. ¿Cuántos de los nombres de archivo de la parte (b) comienzan con una A? d. ¿Cuántos nombres de archivo utilizan extensiones? Combinaciones 1. Responda: a. ¿Cuántas permutaciones de tamaño dos pueden producirse con las letras m, p, i y a? Enumérelas. (12) b. Enumere todas las combinaciones de tamaño dos pueden producirse con las letras m, p, i y a. (6) 2. Calcule C(6,2) y verifique su respuesta enumerando todas las selecciones de tamaño dos que se pueden hacer con las letras a, b, c, d, e y f. (15) 3. Diana debe hacer un viaje de cuatro horas en autobús de regreso a su escuela, decide llevar consigo 5 revistas de las 12 de su hermana. ¿De cuántas formas puede Diana hacer su selección? (C(12,5)) 4. La directora de un coro debe elegir 6 himnos para el acto cívico de su escuela. Ella tiene tres libros de himnos, cada uno de los cuales contiene 10 himnos (en total hay 30 himnos distintos). De cuántas formas puede elegir los himnos si desea elegir: a. Sin restricciones. (C(30,6)) b. Dos himnos de cada libro. (C(10,2) * C(10,2) * C(10,2)) c. Al menos un himno de cada libro. (C(10,1) * C(10,1) * C(10,1) * C(27,3)) 5. De la siguiente lista se eligen 4 números: -5, -4, -3, -2, -1, 1, 2, 3, 4. a. ¿De cuántas formas se puede hacer la selección de modo que el producto de los cuatro números sea positivo y los números sean distintos? (C(5,4) + C(5,2) * C(4,2) + C(4,4)) b. ¿De cuántas formas se puede hacer la selección de modo que el producto de los cuatro números sea negativo y los números sean distintos? (C(5,1) * C(4,3) + C(5,3) * C(4,1)) 6. Se tiene un plano de 15 puntos, de los cuales no hay tres alineados, o sea, no hay tres en la misma recta. a. ¿Cuántas rectas determinan? (C(15,2)) b. ¿Cuántos triángulos determinan estos puntos? (C(15,3)) 7. Se tiene un alfabeto con los símbolos 0, 1 y 2. Se quieren obtener cadenas de longitud 10. Cuántas de estas tienen: a. Cuatro 0, tres 1 y tres 2. (C(10,4) * C(6,3) * C(3,3)) b. Al menos ocho 1. (C(10,8) * 22 + C(10,9) * 21 + C(10,10) * 20) c. Peso 4, sumando sus dígitos de 4. (C(10,4) * 16 + C(10,2) * 18 + C(10,1) * C(9,2) * 17)

8. En el sistema Braille, un símbolo, como una letra minúscula, un signo de puntuación, un sufijo, etc., se escribe resaltando al menos uno de los puntos de los 6 puntos que aparecen en la parte (a) de la figura 1.3. a. ¿Cuántos símbolos diferentes podemos representar en el sistema Braille? (C(6,1) + C(6,2) + C(6,3) + C(6,4) + C(6,5) + C(6,6)) b. ¿Cuántos símbolos tienen exactamente tres puntos en relieve? (C(6,3)) c. ¿Cuántos símbolos tienen un número par de puntos relieve? (C(6,2) + C(6,4) + C(6,6)) d. ¿Cuántos símbolos tienen al menos cuatro puntos relieve? (C(6,4) + C(6,5) + C(6,6))     1 4     2

5







3

6







(a)

(b) “c”

 

(b) “m”

















(b) “t”

(b) “;”

Figura 1.3

Espacios Muestrales 1. Supongamos que lanzamos una moneda de un centavo, una de diez centavos y un dado. a. Describa el espacio muestral S adecuado. b. Exprese explícitamente los siguientes eventos: A = {salen dos escudos y un número par}, B = {salen un dos}, C = {salen exactamente una cara y un impar}. c. Exprese explícitamente los siguientes eventos: ocurran A y B, solamente ocurre B, ocurren B y C. d. ¿Cuáles parejas de eventos A, B y C son mutuamente exclusivas? 2. Supongamos que lanzamos una moneda y un dado. a. Describa el espacio muestral S adecuado. b. Exprese explícitamente los siguientes eventos: A = {salen cara y un número par}, B = {salen un número primo}, C = {salen un escudo y un impar}. c. Exprese explícitamente los siguientes eventos: ocurran A o B, solamente ocurre B, ocurren B y C. d. ¿Cuáles parejas de eventos A, B y C son mutuamente exclusivas? 3. Una clase tiene 3 niñas y 2 niños. Se quiere seleccionar tres alumnos. a. Describa el espacio muestral S adecuado para escoger tres alumnos de los 5 en total que hay. b. Exprese explícitamente los siguientes eventos: A = {todos sean niñas}, B = {al menos haya un niño}, C = {haya exactamente dos niñas}. c. ¿Cuáles parejas de eventos A, B y C son mutuamente exclusivas? 4. Sean A y B eventos. Encuentre una expresión y dibuje el diagrama de Venn para el evento de que: a. A ocurra o B no ocurra.

b. c. d. e.

Ni A ni B ocurran. B ocurra pero no ocurra A. Ocurra A o B, pero no ambos. Donde ocurran A y B.

Problemas de Técnicas de Conteo 1.-¿Cuantos números diferentes de seis dígitos se pueden formar usando todos los dígitos siguientes: 4,4,5,5,5,7? 2.- ¿Cuantos comités diferentes de 3 Hombres y 4 Mujeres pueden formarse a partir de un grupo formado por 8 Hombres y 6 Mujeres? 3.- En una fábrica los productos se codifican con 4 letras distintas y con 3 dígitos Distintos, primero las letras y después los números. Las letras utilizadas son A, B, C y D. a) ¿Cuantos tipos de productos distintos pueden codificarse? b) ¿Cuantos códigos empiezan con A y terminan con 9? c) ¿Cuantos códigos tienen al menos una A 4.- El precio de un recorrido turístico por Europa incluye 4 sitios que visitar que deben seleccionarse a partir de 10 ciudades. De Cuantas maneras diferentes se puede planear el viaje si: a) El orden de las paradas es importante b) El orden de las paradas no es importante 5.- ¿De cuantas maneras se pueden formar en línea 5 personas para subir a un autobús?. ¿De cuantas maneras se pueden formar en línea si 2 de las personas se rehúsan a hacerlo una detrás de la otra? 6.- Un equipo colegial juega 10 partidos de futbol durante una temporada. ¿De cuantas maneras puede terminar la temporada con 5 juegos ganados, 4 perdidos y un empate? 7.- Entre 10 aparatos de televisión de un embarque, hay 3 que están defectuosos. ¿De cuantas maneras puede un Hotel comprar 4 de estos aparatos y recibir al menos 2 defectuosos? 8.- Una coleccionista de arte, dueña de 10 pinturas de artistas famosos está preparando su testamento. ¿De cuantas maneras diferentes puede dejar estas 10 pinturas a sus 3 herederos? 9.- Al final del día, una pastelería dona todo lo que no pudo vender a centros de ayuda para los necesitados. Si al final de un día dado, le quedan 12 pasteles de manzana, ¿de Cuantas maneras diferentes puede repartir estos pasteles entre 6 centros de acopio? 10.- Seis personas van a jugar un juego de tablero en una mesa circular, en este juego es importante donde se sienta cada jugador en relación con el resto (quien queda a la izquierda de quien) y no en relación con la habitación (quien se sienta más al Norte) .¿De Cuantas maneras se pueden sentar a jugar 6 personas?

UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMATICA ESTADÍSTICA APLICADA A LA EDUCACION GUÍA DE PRÁCTICA Nº 4 TEMA: CALCULO DE PROBABILIDAD 1. OBJETIVOS 

Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.



Realizar el análisis y comparación de los distintos cálculos de medidas.



Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.

2. METODOLOGÍA Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva, con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas dentro y fuera del aula, asistidos por la docente responsable de dicha práctica. 3. EJERCICIOS EJERCICIOS DE PROBABILIDAD 1.- Lanzamos una moneda 5 veces. ¿Cuántos resultados distintos se pueden dar?. ¿Cuál es la probabilidad de no obtener 5 caras?. 2.- Tenemos que guardar 5 folios en 7 sobres. ¿De cuántas formas distintas lo podemos hacer? a Si en cada sobre no puede ir más de un folio. b Si en cada sobre pueden ir hasta cinco folios. 3.- En una urna opaca tenemos 12 bolas del mismo peso y forma. Cinco de ellas son Blancas, tres son Negras y cuatro son Rojas. Extraemos dos bolas al azar, una detrás de otra y sin devolverlas a la urna. Hallar la probabilidad de que las dos sean Negras. Hallar la probabilidad de que la primera sea Negra y la segunda Roja. 4.- En una urna opaca tenemos 12 bolas del mismo peso y forma. Cinco de ellas son Blancas, tres son Negras y cuatro son Rojas. Extraemos una bola, anotamos su color, la devolvemos a la urna y extraemos otra bola. Hallar la probabilidad de que las dos sean Negras. Hallar la probabilidad de que la primera sea Negra y la segunda Roja. 5.- Dos futbolistas se juegan el campeonato en un penalti. La probabilidad de que lo meta el primero es ½, y de que lo meta el segundo, si el primero lo hace antes, es ¼. ¿Cuál es la probabilidad de que los dos metan el penalti?.

6.- La probabilidad de que un alumno apruebe Matemáticas es de 0,6 y la de aprobar Física es de 0,7.¿Cuál es la probabilidad de aprobar ambas asignaturas? ¿Y de no aprobar ninguna?.¿Y de aprobar una de ellas?. 7.- La probabilidad de que Andrés haga la comida es de 2 / 9. La probabilidad de que la haga su mujer es de 3 / 5. ¿Cuál es la probabilidad de que la comida esté hecha?. 8.- En un cruce nos encontramos dos semáforos. La probabilidad de que el primero esté en rojo es 1 / 3 y la probabilidad de que, si el primero está en rojo, el segundo esté en ámbar, es de 1 / 5. ¿Cuál es la probabilidad de que el primero esté en rojo y el segundo en ámbar?. 9.- Miriam espera la llamada de Carlos y de Guillermo. La probabilidad de que la llame Carlos es de 0,7 y de que la llame Guillermo es de 0,5. Calcula: a) La probabilidad de que llamen los dos. b) La probabilidad de que llame alguno de ellos. c) La probabilidad de que no llame ninguno. 10.- En un dado se pintan cuatro caras de Rojo y las otras dos de Azul. Se lanza el dado dos veces. Calcula: a) La probabilidad de que las dos veces salga azul. b) La probabilidad de que la primera sea azul y la segunda rojo. c) La probabilidad de que las dos veces sea rojo. EJERCICIOS: PROBABILIDAD CONDICIONADA 1. Una urna contiene 3 bolas blancas y 2 negras. Obtén los posibles resultados y sus probabilidades al extraer dos bolas. a) Sin reemplazamiento. b) Con reemplazamiento. 2. Sean A y B dos sucesos de un espacio de probabilidad de manera que : P(A)=0,4 ; P(B)=0,3 y P(A∩B)=0,1 Calcular razonadamente: a) P(A B) b) P( ) c) P(A/B) d) P( ∩B) 3. ¿Son independientes los sucesos: sacar una figura (sota, caballo y rey) y sacar un oro al tomar una carta de una baraja española de 40 cartas? 4. Sean A y B dos sucesos de una espacio de probabilidad tal que P(A B)=0,7 y P(A)=0,3. Hallar P(B) si: a) A y B son incompatibles b) A y B son independientes c) P(A/B)=0,35 5. En un colegio hay 60 alumnos de Bachillerato. De ellos 40 estudian inglés, 24 estudian francés y 12 los dos idiomas. Se elige al azar un alumno. Determinar las probabilidades de los siguientes sucesos: a) Estudia al menos un idioma. b) No estudia inglés o estudia francés. c) Estudia francés sabiendo que también estudia inglés. d) Estudia francés sabiendo que estudia algún idioma.

e) Estudia inglés sabiendo que no estudia francés. 6. Una caja contiene cuatro bolas blancas y dos negras. Se saca una bola y a continuación (sin devolver la primera a la caja) se extrae otra. Considerados los sucesos A:” la primera bola extraída es blanca” y B:”la segunda bola extraída es blanca”: a) Hallar P(A) y P(B/A) b) ¿Son A y B independientes? c) ¿Cuál es la probabilidad de que las dos bolas extraídas sean blancas? d) ¿Cuál es la probabilidad de que las dos bolas extraídas sean negras? 7. Sean A y B dos sucesos aleatorios independientes. Se sabe que P(A)=0,3 y P(B)=0,4. Calcular: a) P(A B) b) P(A/B) 8. Juan y Pedro juegan a obtener la puntuación más alta lanzando sus dados. El dado de Juan tiene cuatro caras con la puntuación 5 y las otras dos caras con el 1. El dado de Pedro tiene dos caras con el 6, otras dos con el 4 y las otras dos con el 1. Hallar: a) La probabilidad de que gane Pedro. b) La probabilidad de empatar. 9. En una ciudad, el 40% de sus habitantes lee el diario A, el 25% lee el diario B y el 50% lee al menos uno de los dos diarios. a) Los sucesos “leer A” y “leer B”, ¿son independientes? b) Entre los que leen A ¿qué porcentaje lee también B? c) Entre los que leen al menos un diario ¿qué porcentaje lee los dos? d) Entre los que no leen el diario A ¿Qué porcentaje lee el diario B? 10. Dados dos sucesos A y B, se sabe que P(B)=(3/4) y P(A)=P(A/B)=(1/3). a) Razonar si A y B son independientes. b) Calcular P(A B). 11. Se dispone de una baraja de 40 cartas. Se saca una carta al azar y, sin devolverla, se saca otra. a) Calcular la probabilidad de que ninguna de las dos cartas sea de oros. b) Sabiendo que la segunda carta extraída ha sido de copas, calcula la probabilidad de que también lo sea la primera. 12. En una caja tenemos dos bolas blancas, una negra y siete rojas. Extrayendo dos bolas sucesivamente, ¿cuál es la probabilidad de obtener una bola negra seguida de una bola blanca? a) Reponiendo la bola en la caja. b) Sin reponerla. 13. La probabilidad de que una bomba lanzada por un avión haga blanco en el objetivo es 1/3. Hallar la probabilidad de alcanzar el objetivo si se tiran tres bombas seguidas. 14. Un dado numerado del 1 al 6 está lastrado de modo que la probabilidad de obtener un número es proporcional a dicho número. a) Hallar la probabilidad de que salga 3 si se sabe que salió impar. b) Calcular la probabilidad de que salga par si se sabe que salió mayor que 3. 15. Se tira una moneda repetidamente hasta que salga cara. Calcular la probabilidad de que haya que tirar la moneda menos de cinco veces. 16. Se lanza un dado. Si aparece un número menor que 3, nos vamos a la urna I, que contiene

6 bolas rojas y 4 bolas blancas, y si el resultado es mayor o igual que 3 nos vamos a la urna II que contiene 4 bolas rojas y 8 blancas. A continuación extraemos una bola. Se pide: a) Probabilidad de que la bola sea roja y de la urna II. b) Probabilidad de que la bola sea blanca. 17. Un estudiante cuenta, para un examen, con la ayuda de un despertador, el cual consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabilidad de que realice el examen es 0,9 y, en caso contrario, de 0,5. a) Si va a realizar el examen ¿cuál es la probabilidad de que haya oído el despertador? b) Si no realiza el examen, ¿cuál es la probabilidad de que no haya oído el despertador? 18. En una universidad, en la que sólo hay estudiantes de Empresariales, G.A.P. y R.R.L.L., acaban la carrera el 10% de Empresariales, el 55% de G.A.P. y el 45% de R.R.L.L. Se sabe que el 70% estudian Empresariales, el 20% G.A.P. y el 10% R.R.L.L. Tomando a un estudiante cualquiera al azar, se pide: a) Probabilidad de que haya acabado la carrera y sea de Empresariales. b) Nos dice que ha acabado la carrera. Probabilidad de que sea de Empresariales. 19. En una casa hay tres llaveros A, B y C, el primero con 5 llaves, el segundo con 7 y el tercero con 8, de las que sólo una de cada llavero abre la puerta del trastero. Se escoge al azar un llavero y, de él, una llave para intentar abrir el trastero. Se pide: a) ¿Cuál será la probabilidad de que se acierte con la llave? b) ¿Cuál será la probabilidad de que el llavero escogido sea el tercero y la llave no abra? c) Y si la llave escogida es la correcta, ¿cuál es la probabilidad de que pertenezca al primer llavero A? CUESTIONES PARA RAZONAR 1. Decir si son ciertas o falsas las siguientes afirmaciones: a) Si dos sucesos son incompatibles, son contrarios. b) Si dos sucesos son contrarios, son incompatibles. 2. Si dos sucesos son incompatibles, ¿los sucesos contrarios de aquéllos son también incompatibles? 3. ¿Qué es más probable , obtener cara al lanzar una moneda u obtener tres caras al lanzar cuatro monedas? Razonar la contestación 4. Sean A y B dos sucesos de un espacio de probabilidad con probabilidad no nula. Razonar la verdad o falsedad de las siguientes afirmaciones. a) Si A y B son incompatibles , entonces son independientes. b) Si A y B son independientes , entonces son incompatibles. c) Si A y B son independientes P(A ∩ B) = P(A/B) P(B/A) 5. Decir si es cierta la siguiente afirmación: "Si dos sucesos pertenecen al mismo espacio muestral ambos son necesariamente incompatibles" 6. Si dos sucesos pertenecen al mismo espacio de sucesos entonces: a) Ambos son necesariamente independientes b) Ambos son necesariamente incompatibles

c) Ninguno pertenece al espacio muestral d) El suceso contrario a la unión de sucesos equivale a la intersección de sus contrarios. 7. Sabemos que: a) El espacio de sucesos contiene a E como elemento. b) Los elementos de S son todos incompatibles c) Algunos de los elementos de S son todos independientes y otros no d) S es el conjunto de todos los subconjuntos de E 8. Razonar si son ciertas las siguientes afirmaciones para dos sucesos A y B: a) Si A es incompatible con B entonces P(A)+P(B)=1 b) P(A/A)=1

UNIVERSIDAD DE EL SALVADOR FACULTAD MULTIDISCIPLINARIA DE OCCIDENTE DEPARTAMENTO DE MATEMATICA ESTADÍSTICA APLICADA A LA EDUCACION GUÍA DE PRÁCTICA Nº 5 TEMA: DISTRIBUCIONES DE PROBABILIDAD 1. OBJETIVOS 

Practicar el uso de las distintas fórmulas de las medidas de tendencia central y dispersión.



Realizar el análisis y comparación de los distintos cálculos de medidas.



Fomentar el uso de medidas de tendencia central y dispersión en el análisis de información.

2. METODOLOGÍA Los estudiantes, después de haber discutido y estudiado los temas de estadística descriptiva, con ayuda de la docente; procederán a la lectura de la guía propuesta, desarrollándola de forma grupal e individual, durante el tiempo determinado y asignado al desarrollo de las horas prácticas dentro y fuera del aula, asistidos por la docente responsable de dicha práctica. 3. EJERCICIOS 1. Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa. 2. La probabilidad de éxito de una determinada vacuna es 0,72. Calcula la probabilidad de que una vez administrada a 15 pacientes: a) Ninguno sufra la enfermedad b) Todos sufran la enfermedad c) Dos de ellos contraigan la enfermedad 3. La probabilidad de que el carburador de un coche salga de fábrica defectuoso es del 4 por 100. Hallar: a) El número de carburadores defectuosos esperados en un lote de 1000 b) La varianza y la desviación típica. 4. La probabilidad de que un paciente se recupere de una extraña enfermedad es 0.4 . Si se sabe que 15 personas contraen esa enfermedad,

a) ¿Cuál es la probabilidad de que sobrevivan al menos 10? b) ¿Cuál es la probabilidad de que sobrevivan de 3 a 8? c) Calcule la media y la varianza de esta distribución binomial. 5. En ciudad la necesidad de dinero para comprar drogas se establece como la razón del 75% de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de robo:

a) dos resulten de la necesidad de dinero para comprar drogas. b) al menos tres resulten de la necesidad de dinero para comprar drogas. c) Represente esta distribución binomial en un histograma

k

n

0,75

5 -k

0,25 0,0009765 6 0,0039062 5 0,015625 0,0625

0

1

1

1 2 3

5 10 10

4

5

5

1

0,75 0,5625 0,421875 0,3164062 5 0,25 0,2373046 9 1

probabilida d 0,00097656 0,01464844 0,08789063 0,26367188 0,39550781 0,23730469

d) Calcule la media y la varianza de esta distribución binomial.

6. Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores empedernidos. Si su aseveración es correcta: a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad sean fumadores empedernidos. Todos Tienen cáncer  n=10 70% por fumar 30% por otras causas b) encuentre la probabilidad de que de 10 de los pacientes con cáncer de pulmón ninguno sea fumador empedernido. c) Represente esta distribución binomial en un histograma d) Calcule la media y la varianza de esta distribución binomial.

7. De acuerdo con un estudio publicado por un grupo de sociólogos de la Universidad de Massachussets aproximadamente el 60% de los consumidores de Valium en el estado de

Massachussets tomaron Valium por primera vez debido a problemas psicológicos. Encuentre la probabilidad de que entre los siguientes ocho consumidores entrevistados en este estado: a) tres comenzaron a tomar Valium por problemas psicológicos. b) al menos cinco comenzaron a consumir Valium por problemas que no fueron psicológicos. c) Represente esta distribución binomial en un histograma. d) Calcule la media y la varianza de esta distribución binomial.

8. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad de Michigan a estudiantes universitarios de último año revela que el 70% de los estudiantes desaprueba el consumo diario de la mariguana. Si se seleccionan doce estudiantes al azar y se les pide su opinión, encuentre la probabilidad de que el número de los que desaprueban fumar mariguana todos los días sea: a) entre siete y nueve. b) a lo más cinco. c) no memos de ocho. d) Represente esta distribución binomial en un histograma. e) Calcule la media y la varianza de esta distribución binomial.

9. Un estudio examinó las actitudes hacia los antidepresivos. El estudio reveló que aproximadamente el 70% cree que “los antidepresivos en realidad no curan nada, sólo encubren el problema real”. De acuerdo con este estudio a) ¿cuál es la probabilidad de que al menos tres de las siguientes cinco personas seleccionadas al azar sean de esta opinión? b) Represente esta distribución binomial en un histograma c) Calcule la media y la varianza de esta distribución binomial.

10. El departamento de mercadotecnia de Kellogg Company planea realizar una investigación para determinar si los consumidores de cereal en hojuelas pueden distinguir su cereal favorito de otros. Para probar el cuestionario y el procedimiento a ser usado se invitó a ocho personas a participar en un experimento. Se les colocó frente a cinco pequeños tazones de cereal en hojuelas marcados con las letras A, B, C, D, Y E para que identificaran su cereal favorito. A las personas se les informó que solo uno de los tazones contenía su cereal favorito.

a) Si una persona no pudo identificar su cereal favorito y supuso que estaba en el tazón C. ¿Cuál es la probabilidad de que la persona haya adivinado correctamente? b) ¿Cuál es la variable aleatoria en este problema? c) ¿Es la variable aleatoria discreta o continua? ¿Por qué? d) Suponga que a las ocho personas les fue imposible identificar su cereal favorito y trataron de adivinar en cual tazón estaba. ¿Cuál es la probabilidad de que ninguno de los ocho haya adivinado correctamente? e) Desarrolle una distribución binomial para este experimento f) Calcule la media, varianza, y desviación estándar de la distribución. g) Represente la distribución de probabilidad en una gráfica. h) Suponga que siete de las ocho personas identifican el cereal que más les gusta. ¿Es razonable decir que ellos adivinaron? Explique. ¿Cuál es tu conclusión? i) ¿Por qué es la distribución binomial apropiada para este problema?

VARIBLES ALEATORIA DISCRETAS Y F. DE DISTRIBUCIÓN BINOMIAL 1. La probabilidad de que un estudiante que ingresa en la Universidad se licencie es 0,4. Encuentra la probabilidad de que entre 5 estudiantes escogidos al azar: P ( x=0 )=0 ' 0776 a. Ninguno se licencie. P ( x ≤1 ) =0 ' 337 b. No se licencie más de uno. P ( x ≥1 ) =0 ' 92 c. Al menos uno se licencie. P ( x=5 )=0 ' 01 d. Todos se licencien. 2. Se lanza una moneda 10 veces. Calcúlese la probabilidad de: P ( x