GUIA PROCESOS ESTOCASTICOS

DIRECCION DE EDUCACIÓN DE ESTUDIOS A DISTANCIA GUÍA DE PROBABILIDADES Y PROCESOS ESTOCÁSTICOS Tercer Semestre Realizad

Views 140 Downloads 0 File size 825KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

DIRECCION DE EDUCACIÓN DE ESTUDIOS A DISTANCIA

GUÍA DE PROBABILIDADES Y PROCESOS ESTOCÁSTICOS Tercer Semestre

Realizado por: Ing. SHIRLEY DEFAZ

Marzo de 2007

1.

DATOS INFORMATIVOS FACULTAD:

Ciencias de la Computación y Electrónica

ESCUELA:

Electrónica

ASIGNATURA:

Probabilidades y Procesos Estocásticos

NIVEL:

Tercero

AUTOR DE LA GUIA: Ing. Shirley Défaz Silva E-MAIL: FECHA DE EDICIÓN: Marzo de 2007

2.

PRESENTACIÓN DE LA ASIGNATURA

La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla. La Estadística responde a nuevas demandas sociales. Para realizar investigaciones exhaustivas sobre temas sociales surgen tres problemas básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en entrevistar a toda la población y el costo económico y de personal de estas entrevistas. Con las técnicas de muestreo se consigue hacer buenas investigaciones sobre una pequeña parte de esa población, obteniendo resultados válidos para toda ella. La Estadística responde a las necesidades del desarrollo científico y tecnológico de la sociedad. Tras la Revolución Industrial se produce un desarrollo de la sociedad en todos sus ámbitos y, en particular, en el Científico y Tecnológico. Las Comunicaciones, la Industria, la Agricultura, la Salud... se desarrollan rápidamente y se exige el máximo rendimiento y la mejor utilización de estos sectores. Con estudios estadísticos aplicados a la Agricultura y a la Pesca podemos estimar los rendimientos obtenidos en una cosecha, o encontrar bancos de peces. Por otro lado, el desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística, de forma que casi cualquier investigación científica requiere de los fundamentos de la Teoría de la Probabilidad para que pueda desarrollarse adecuadamente. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. En esta asignatura, abarcaremos, tal y como se refleja en los contenidos, los conceptos fundamentales dentro de este campo. Los Procesos Estocásticos constituyen una parte esencial de la Probabilidad y son mucho interés en la actualidad por la cantidad de situaciones prácticas en los que pueden ser de utilidad. Son

modelos probabilísticos utilizados para representar situaciones de la vida cotidiana, que generalmente se desarrollan a lo largo del tiempo, y para hacer predicciones y poder así tomar las decisiones más apropiadas al respecto. En esta asignatura estudiaremos los modelos de procesos estocásticos fundamentales: Los recorridos aleatorios y las cadenas de Markov. Con el estudio de los Procesos Estocásticos se puede tener una mejor comprensión de fenómenos de comportamiento aleatorio como meteorología, física nuclear, campañas de seguridad, etc.

3.

OBJETIVO GENERAL DE LA ASIGNATURA DE PROBABILIDADES Y PROCESOS ESTOCÁSTICOS

Al finalizar el semestre el estudiante estará en capacidad de • Describir situaciones usuales con evolución aleatoria •

Asociar un modelo matemático a una situación observable



4.

Analizar el modelo estocástico

OBJETIVOS ESPECÍFICOS DE LA ASIGNATURA



Describir adecuadamente espacios muestrales asociados a ciertos experimentos aleatorios, previamente planteados. • Definir sucesos aleatorios y asignarles sus probabilidades de ocurrencia. • Efectuar estimaciones puntuales de los parámetros de una población: media, proporción y varianza poblacional

:



SISTEMA DE CONOCIMIENTOS ESENCIALES POR UNIDADES DIDÁCTICAS

PROBABILIDADES Y PROCESOS ESTOCÁSTICOS

ESTADÍSTICA Y PROBABILIDAD BÁSICA

-Estadísticas -Tipos de variables -Medidas de tendencia central -Medidas de dispersión

FUNCIONES PROBABILÍSTICAS

-Distribución de probabilidad -Distribución binomial -Dist. hipergeométrica -Dist. de Poisson -Dist. Normal

-Probabilidad clásica -Técnicas de Conteo -Probabilidad Condicional

PROCESOS ESTOCÁSTICOS

-Ruido -Movimiento Browniano -Matriz de transición -Cadenas de Markov en tiempo discreto -Cadenas de Markov en tiempo continuo -Teoría Ergódica -Ecuaciones de Chapman-Kolmogorov

SISTEMA DE HABILIDADES A DESARROLLAR INTERPRETAR ANALIZAR CALCULAR IDENTIFICAR

Modelar mediante cadenas de Markov situaciones que evolucionan aleatoriamente

REPRESENTAR DEDUCIR RESOLVER APLICAR

Al finalizar el nivel, estudiante va a adquirir las siguientes destrezas y habilidades: •

Distinguir diferentes tipos de procesos estocásticos dependiendo de los instantes de observación y de los resultados observados.



Conocer las propiedades básicas de las cadenas de Markov en tiempo discreto



Modelar mediante cadenas de Markov situaciones que evolucionan aleatoriamente



Describir el comportamiento transitorio de una cadena de Markov mediante la matriz de transición y sus potencias.



Conocer las propiedades y características más relevantes del Proceso de Poisson y de otros procesos en tiempo continuo.

5.

ORIENTACIONES SOBRE EL PROCESO DE EVALUACION DEL APRENDIZAJE

PROCESOS DEL APRENDIZAJE EN LA ASIGNATURA Desde el contenido de los diferentes capítulos y en la realización de las tareas, se trabajará en aspectos vitales de la formación de la personalidad como la responsabilidad al exigir la puntualidad en la entrega de tareas así como asistencia, perseverancia al enfrentar la complejidad gradual de los diferentes temas y en la discusión de la solución de problemas. Investigación al permitir que el alumno evidencie por si solo la importancia de las ciencias físicas en el desarrollo de su profesión. Se dará énfasis en el interés por realizar los trabajos extracurriculares y por destacar los valores de la profesión. Al estudiante se le exigirá fundamentar correctamente sus ideas con una adecuada coherencia, así mismo en sus informes escritos deberá presentarlos con una buena redacción. Se resolverán problemas vinculados a aspectos relevantes de la profesión y de la protección del medio ambiente. Para resolver un problema de una situación real se tiene que: •

Formular el problema



Graficar el problema



Modelar el problema



Resolver el modelo matemático del problema



Interpretar los resultados



Extraer conclusiones

ORIENTACIONES SOBRE EL PROCESO DE EVALUACION DEL APRENDIZAJE •

En cada unidad didáctica Ud. encuentra un objetivo. Él le indica lo que debe dominar o saber hacer al terminar de estudiar la unidad. Esto es muy importante, no deje de analizarlo y hacer que se cumpla.



Si no está seguro que cumplió el objetivo, vuelva a leer y realizar o revisar los ejercicios resueltos que el texto guía le presenta hasta que este seguro de haber cumplido con el objetivo.



Las unidades se encuentran en una secuencia progresiva de aprendizaje. Por tal motivo, se sugiere seguir el orden en el cual se presentan, ya que lo estudiado en un tema es base para el siguiente tema.



Adquiera un cuaderno o una carpeta, en el cual se sugiere anotar los resúmenes de lo que va estudiando y los ejercicios de las diferentes actividades que se proponen en la presente guía, así como la resolución de las autoevaluaciones. Al mismo tiempo debe ir anotando la consulta que necesita hacer a su tutor, de esta forma llevará su proceso de aprendizaje, organizado y podrá Ud. mismo evidenciar el desarrollo y cambios que se están produciendo.



Cada vez que se disponga a estudiar la materia, escoja el sitio más apropiado y el tiempo apropiado.



Lea el tema y revise los ejercicios resueltos del texto guía las veces que sea necesario con el mejor ánimo de entenderlos. Si algún tema no está claro no pierda tiempo ni se mortifique tratando de entenderlo, no dude en llamar o ponerse en contacto con su tutor inmediatamente para solucionar sus inquietudes o dudas.



La autoevaluación es en proceso que le indica el avance en su aprendizaje. No se engañe. No busque quien le haga los trabajos que Ud. debe realizar, busque a través de sus compañeros o de su tutor la asesoría en aquello que no está claro.

6. •

INDICADORES DE EVALUACION Todas las tareas indicadas en cada unidad serán evaluadas sobre diez puntos, de acuerdo a la originalidad, presentación (limpieza, orden, fecha de entrega), cientificidad y el desarrollo en sí de cada problema. Es necesario que en cada tarea presentada por Ud. haga constar su propia autoevaluación entre uno y diez puntos de acuerdo a su dedicación al desarrollo de la misma y al nivel de asimilación logrado.



En cada encuentro se realizarán plenarias, clases talleres, debates, etc.; y, de acuerdo a su participación, se asignará una nota entre uno y diez que resultará del promedio entre su propia autoevaluación, la que le otorgue el grupo y la del profesor.



La resolución de problemas propuestos en el aula, se la realizará utilizando técnicas grupales y de exposición, a fin de desarrollar las capacidades de expresión oral y pensamiento crítico.



Los indicadores principales serán: la correcta interpretación del problema, la lógica del problema a resolver, las conclusiones que se obtengan de esta resolución, la responsabilidad y la honestidad.



El cuaderno de anotaciones será evaluado sobre diez puntos de acuerdo a la presentación ( limpieza, orden), el desarrollo de los contenidos y a la forma coherente y sistémica que ha tratado los temas.



Las tareas integradoras de cada unidad serán evaluadas sobre diez puntos y corresponderá al 50% de la nota a promediarse con la prueba.



La tarea integradora de la asignatura será evaluada sobre diez puntos y corresponderá al 50% del examen final.



La asistencia a los encuentros también será considerada en la evaluación general de acuerdo al consenso con el grupo.

7.

BIBLIOGRAFIA BASICA Y COMPLEMENTARIA

TEXTOS BASICOS •

CHAO Lincoln. Estadística para las Ciencias Administrativas. Mcgraw-Hill, tercera edición. Bogotá-Colombia, 1998.



GALINDO Edwin. Estadística para la Ingeniería. Quito-Ecuador, 1998.

DIRECCIONES DE INTERNET •

http://www.monografias.com/trabajos15/estadistica/estadistica.shtml



http://es.wikipedia.org/wiki/estadistica



http://es.wikipedia.org/wiki/Variable_aleatoria



http://es.wikipedia.org/wiki/Medidas_de_tendencia_central



http://es.wikipedia.org/wiki/Dispersi%C3%B3n_(matem%C3%A1ticas)



http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr %20Hipergeometrica.htm



http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Poisson



http://facultad.sagrado.edu/ConceptosBasicos.pdf



http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm



http://weblogs.udp.cl/pplaza/archivos/(4137)Markov-Discreto.pdf



http://usuarios.lycos.es/paradojaparrondo/cadenas_markov.htm



http://www.omerique.net/calcumat/estocasticas1.htm



http://www.bioestadistica.uma.es/libro/node23.htm



http://www.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartinez/magister/confi abilidad/seccion2/distribucion.html

ORIENTACIONES PARA EL TRABAJO CON LAS UNIDADES DIDACTICAS La presente guía está dividida en 3 unidades didácticas. Los temas pertenecientes a cada una de las unidades se encuentran agrupados por semanas. Cada una de las semanas se encuentra conformada por: teoría, ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos.

UNIDAD I ESTADÍSTICA Y PROBABILIDAD BÁSICA Objetivos: •

Familiarizarse con los aspectos básicos del Cálculo de Probabilidades y la Estadística y aplicar los procedimientos estadísticos para el análisis de una muestra.



Describir adecuadamente espacios muestrales asociados a ciertos experimentos aleatorios, previamente planteados.



Definir sucesos aleatorios y asignarles sus probabilidades de ocurrencia.



Aplicar los conceptos y reglas fundamentales de probabilidad.



Aplicar correctamente las distribuciones de la media, proporción y varianza muestrales en el cálculo de probabilidades



Determinar el tamaño de muestra representativo y sus elementos, mediante las técnicas de muestreo.



Efectuar estimaciones puntuales de los parámetros de una población: media, proporción y varianza poblacional.

ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD I La unidad 1 se estudiará durante las 7 primeras semanas de clases y comprende temas como: tipos de variables estadísticas, medidas de tendencia central, medidas de dispersión, probabilidad clásica y técnicas de conteo aplicadas al cálculo de probabilidades. Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría, ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos. SEMANA 1 ESTADISTICA “La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado población”. La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee. La Estadística se divide en dos ramas: Estadística Descriptiva: Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). Estadística Inductiva: Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos. OTRAS DEFINICIONES IMPORTANTES Población "Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974). Ejemplo: La población de ballenas. Según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de estudiantes de la UNITA. Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística. Muestra "Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).

Ejemplo: El estudio realizado a 33 estudiantes de la FCCE de la UNITA. Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo. Muestreo Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población. Ejemplo: Consideremos como una población a los estudiantes de educación secundaria del Colegio Colón, determinando por lo menos dos caracteres ser estudiados en dicha población: Religión de los estudiantes y Sexo. VARIABLE ESTADÍSTICA Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio. Clasificación de las variables En un estudio científico, podemos clasificar las variables según la escala de medición o la influencia que asignemos a unas variables sobre otras. Según la escala de medición: Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Ejemplo: sexo de una persona (hombre, mujer), color de ojos (cafés, verdes, azules) Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser: •

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Un ejemplo es el número de hijos.



Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.

Ejercicios propuestos 1. Clasificar las siguientes variables: •

Preferencias políticas (izquierda, derecha o centro).



Marcas de cerveza.



Velocidad en Km/h.



El peso en Kg.



Signo del zodiaco.



Nivel educativo (primario secundario, superior).



Años de estudios completados.



Tipo de enseñanza (privada o pública).



Número de empleados de una empresa.



La temperatura de un enfermo en grados Celsius.



La clase social (baja, media o alta). La presión de un neumático en

2. Clasifique las variables que aparecen en el siguiente cuestionario. •

¿Cuál es su edad?



Estado civil:



¿Cuanto tiempo emplea para desplazarse a su trabajo?



¿Está afiliado a la seguridad social?



Tamaño de su ciudad: ciudad pequeña (de 50.000 a 100.000 hab.), ciudad grande (más de 100.000 hab.)

SEMANA 2 MEDIDAS DE TENDENCIA CENTRAL Son un grupo de estadísticos que permiten ver lo dominante, lo típico o la tendencia de una distribución de datos en el sentido de cuáles son sus valores medios. Las medidas de tendencia central más conocidas son: la media aritmética, la mediana y la moda.

Media La media aritmética o promedio, de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación. Por ejemplo, si en una habitación hay

tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no es necesariamente la mitad. Solamente puede utilizarse con variables cuantitativas. Así, dados los números a1,a2, ... , an, la media aritmética será igual a:

Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:

Media ponderada A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Si x1,x2,...,xn son nuestros datos y w1,w2,...,wn son sus ‘pesos’ respectivos la media ponderada se define de la siguiente forma:

Ejemplo: Las calificaciones en la asignatura de Matemáticas de 39 alumnos se registran en la siguiente tabla: Calificaciones

1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2 Moda La moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.

Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta. Ejemplo: En la distribución: 5, 8, 9, 4, 5, 5, 8, 1, 2 La moda es 5, pues es el valor que cuenta con la mayor frecuencia: Aparece 3 veces. Una distribución puede tener más de una moda si dos o más datos, o clases de datos, tienen la misma frecuencia y esta es la más alta de la distribución. Moda de datos agrupados Para calcular la moda de los valores pertenecientes a una clase se cuenta con la siguiente fórmula.

En donde f es la frecuencia del intervalo y x su marca de clase o punto medio. SEMANA 3 Mediana Dentro de la rama de medidas de tendencia central en estadística descriptiva, y considerando los datos de una muestra ordenada en orden creciente (de menor a mayor), definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. Matemáticamente hablando la mediana sería: Me =

, si n es impar --> Me será la observación

central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente.

Me =

, si n es par --> Me será el promedio aritmético de las dos observaciones

centrales. Observaciones: - La mediana de un conjunto de datos es única.

- El valor de la mediana no es sensible a la presencia de datos extremos.

Ejemplo (sobre la representatividad) Supongamos que hay 19 pobres y un millonario en una habitación. Cada uno pone $5 sobre la mesa pero el millonario aporta un millón. Eso da un total de $1.000.095. Si el dinero se repartiese por partes iguales, eso daría un promedio (media) de $50.004,75, pero la mediana da $5, ya que si uno divide el grupo en 2, se puede decir que 10 personas aportaron $5 o menos, mientras que las otras 10 personas aportaron $5 o más. En ese sentido, la mediana representa la cantidad típica que cada persona aportó. xi fi Fi En contraste, el promedio es para nada típico, ya que nadie aportó ni cerca de los 1 2 2 $50.004.75 2 2 4 3 4 8 Ejemplo ( N impar )

4 5 13

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase 5 8 21 > 19.5 6 9 30

viene dada por la siguiente tabla (debajo): Calificaciones

1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 8 9 3 4 2 Calculemos la Mediana:

7 3 33 8 4 37 9 2 39

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N19 < 19.5 < N20 Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos) La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo ( N par ) Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones

1 2 3 4 5 6 7 8 9

Número de alumnos 2 2 4 5 6 9 4 4 2

xi fi Fi 1 2 2 2 2 4 3 4 8 Calculemos la Mediana: Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).

4 5 13 5 6 19 = 19 6 9 28

7 4 32 Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos 8 4 36 X(38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias 9 2 38 absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19 Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos. La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más SEMANA 4 MEDIDAS DE DISPERSION La dispersión mide cuan alejados están un conjunto de valores respecto a su media aritmética. Así cuanto menos disperso sea el conjunto más cerca del valor medio se encontrarán sus valores. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones. Las medidas de dispersión más usadas son: el rango o amplitud, la varianza, la desviación estándar y la covarianza. Ejemplo: Podemos tener un conjunto de átomos de una sustancia con una media de velocidades 0. De ello no cabe concluir que los miembros del sistema están quietos. Ello implicaría que la substancia se encontraría cerca del cero absoluto. Con una media de 0 podemos tener desde un sólido cristalizado hasta un gas muy caliente. La variable que determinará en qué estado de agitación térmica se encuentran los átomos del sistema será la dispersión de velocidades.

EL RANGO O AMPLITUD Es la diferencia entre el valor más grande y el más pequeño de un conjunto de valores. Puede verse afectada por valores extremos, poco representativos. Además, esta medida al aumentar el número de valores aumenta o se queda igual pero nunca disminuye. Esta medida presenta problemas que la hacen poco apta para usos estadísticos. VARIANZA La varianza representa la media aritmética de las desviaciones de la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación. Expresión de la varianza muestral:

Expresión de la varianza poblacional:

DESVIACION ESTANDAR La desviación estándar (DS/DE), también conocida como desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma,

. Una desviación estándar grande indica que los puntos están lejos de la media, y una

desviación pequeña indica que los datos están agrupados cerca de la media. Una vez entendida la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Expresión de la desviación estándar muestral:

Expresión de la desviación estándar poblacional:

Ejemplo: Las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. Ejemplo: Aquí se muestra cómo calcular la desviación estándar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de niños. { 4, 1, 11, 13, 2, 7 } 1. Calcular el promedio o media aritmética

.

.

Este es el promedio. 2. Calcular la desviación estándar

Esta es la desviación estándar. Ejemplo: Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros: 3,3,4,4,5

Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. Éste es la media:

La varianza es:

siendo la desviación típica su raíz cuadrada:

SEMANA 5 TEORIA DE LA PROBABILIDAD La teoría de probabilidad es la teoría matemática que modela los fenómenos aleatorios, éstos deben contraponerse a los fenómenos determinísticos, Fenómeno determinístico Son fenómenos en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado único o previsible. Ejemplo: El agua calentada a 100 grados centígrados, a presión normal, se transforma en vapor. Fenómeno aleatorio Un fenómeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas. Ejemplo: lanzar un dado o una moneda. Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la modelación matemática de sofisticados fenómenos aleatorios. Actualmente, estos fenómenos encuentran aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones). VARIABLE ALEATORIA

En estadística y teoría de probabilidad una variable aleatoria se define como el resultado numérico de un experimento aleatorio en el cual dicha variable toma diferentes valores. Matemáticamente, es una función medible

que da un valor numérico, del conjunto de

los reales, a cada suceso en el espacio Ω del espacio muestral del experimento. El espacio muestral está conformado por los posibles resultados de un experimento. Al conjunto de los valores posibles de una variable aleatoria se conoce como rango. Dado una variable aleatoria X se pueden calcular estimadores estadísticos diferentes como la media (Media aritmética, Media geométrica, Media ponderada) y valor esperado y varianza de la distribución de probabilidad de X.

Ejemplo Suponga que lanzamos dos monedas al aire y, sea X la variable aleatoria que identifica el número de caras obtenidas en el lanzamiento. X: Número de caras obtenidas en el lanzamiento. Ω = { cc, cs, sc, ss } (c identifica una cara, s una cruz) RX = { 0, 1, 2 } (Recorrido de X) Entonces asociando Omega con el Recorrido de X, tenemos que:

Tipos de Variables aleatorias •

Variable aleatoria discreta: variable que toma un número finito o infinito de valores

numerables. Variable aleatoria que puede tomar sólo un número limitado de valores. •

Variable aleatoria continua: variable que toma un valor infinito de valores no numerables.

Variable aleatoria que puede tomar cualquier valor dentro de un intervalo dado de valores.

DEFINICIÓN CLÁSICA DE PROBABILIDAD La probabilidad es la característica de un suceso del que existen razones para creer que se realizará. Los sucesos tienden a ser una frecuencia relativa del número de veces que se realiza el experimento. La probabilidad pude tomarse como una medida del riesgo de que un evento ocurra. Así, la probabilidad se calcula de la siguiente forma:

P(A) =

# casos favorables -----------------------------------# total de resultados posibles

Probabilidad discreta Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes que son el resultado de la cuenta de alguna característica de interés. Estos Valores pueden ser de varios tipos ya sean Finitos o Infinitos, Numerables o innumerables Ejemplo: Sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los valores de X son x = 0, 1, 2, 3 Como se muestra en el ejemplo 1 estos valores son Numerables, y Finitos, ya que se nos da un número de específico de casos y solo nos pueden dar un numero especifico de resultados.

Probabilidad continua Una variable aleatoria es una función que da un valor numérico a cada suceso en Ω. Ejemplos: a) la posibilidad de seleccionar una carta de un mazo b) la posibilidad que un producto nuevo tenga aceptación en el mercado c) la posibilidad de que un estudiante seleccionado al azar en una clase tenga un promedio de B Ejemplo: Se lanzan dos monedas al aire, ¿cuál es la probabilidad de que ambas salgan cara? S = { cc, cs, sc, ss } P ( cc ) = 2/4 = 0.5 Ejemplo: Se lanzan dos dados al aire, ¿cuál es la probabilidad de que la suma sea mayor de 7? S = {1,1; 1,2; 1,3; 1,4; …………… 6,1; 6,2;…. 6,6} Tamaño de S = 36 P ( ∑ d > 7 ) = 15 / 36

DEFINICIONES BASICAS Experimento. Cualquier acción cuyo resultado se registra como un dato. Espacio Muestral (S). El conjunto de todos los posibles resultados de un experimento. Ejemplo: Supongamos el lanzar un dado al aire y observaremos los resultados siguientes: S = {1, 2, 3, 4, 5, 6 } S = { 6 } Ejemplo: En el lanzamiento de dos monedas tenemos S = {cc, cs, sc, ss } S = { 4 } Evento. Es el resultado de un experimento. Cuando cada evento es seleccionado al azar, el experimento se denomina aleatorio o al azar. Evento Simple (E). Cada uno de los posibles resultados de un experimento y que no se puede descomponer. En el caso del lanzamiento del dado, cada uno de los posibles números en la cara del dado es un evento simple. Evento Compuesto. Los eventos A, B, C, etc., son eventos compuestos si se componen de dos o más eventos simples. Ejemplos de eventos simples y compuestos: Evento simple: Lanzamiento de un dado A = {evento que salga un # impar} A = {1, 3, 5} B = {el número sea ≤ 4} = {1, 2, 3, 4} Evento Compuesto: Lanzamiento de dos monedas A = el evento de observar una cara A = {cc, cs, sc, ss} Operaciones de conjuntos Es necesario recordar las operaciones de conjuntos puesto que constituyen el fundamento de las probabilidades. •

Unión. La unión de dos conjuntos A y B es el conjunto C que está formado por los

elementos de A, de B o de ambos. •

Intersección. La intersección de dos conjuntos A y B es el conjunto C que está formado por

los elementos que pertenecen a ambos conjuntos simultáneamente. •

Complementos. El complemento de un conjunto A que se denota por A’ son todos los demás

elementos que no se encuentran en A.

Tipos de eventos Eventos Mutuamente excluyentes Si dos conjuntos A y B no tienen elementos en común, su intersección será nula o vacía. En este caso A y B se dicen eventos mutuamente excluyentes. A ∩ B = {Φ} Eventos colectivamente exhaustivos Dos eventos son colectivamente exhaustivos si al hacer la unión de los mismos, se obtiene el espacio muestral. A U B = {S} Reglas Básicas de Probabilidades Para Eventos Simples 1. Ley Fundamental de la probabilidad Una probabilidad siempre estará comprendida entre 0 y 1. Cuando el suceso es imposible se dice que su probabilidad es 0 y se dice que es un suceso cierto cuando siempre tiene que ocurrir y su probabilidad es 1. 0 ≤ P(A) ≤ 1 2. ∑ P(A) = 1. La suma de las probabilidades de todos los eventos simples posibles del espacio muestral es 1. 3. Ley del Complemento. Si A’ es el complemento de A, entonces,

P (A’) + P (A) = 1

Proceso Para Calcular la probabilidad de un Evento 1) Haga una lista de todos los eventos contenidos en el espacio muestral. 2) Asigne la probabilidad que corresponda a cada evento simple. 3) Determine los eventos simples que constituyen el evento de interés. 4) Sume las probabilidades de todos los eventos simples que constituyen el evento de interés. Regla de Suma de Probabilidades Eventos Mutuamente Excluyentes Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo tiempo. P(A U B) = P(A) + P(B) ssi [ P(A∩B) = 0 ] b. Eventos No Mutuamente Excluyentes Dos eventos A y B son no mutuamente excluyentes si ambos pueden ocurrir simultáneamente. P(A U B) = P(A) + P(B) - P(A_B)

Ejercicio propuesto 1. La tabla siguiente muestra el número de hornos microondas vendidos por día en una tienda de ventas al detalle del área metropolitana de San Juan # de microhondas (E) 0 1 2 3 4

# de días 15 48 25 22 10

Determinar la probabilidad de que el número de microondas que se vendan actualmente sean: a) 3 b) menos de 2 c) más de 1 d) por lo menos 2 e) entre 1 y 3 ambos incluidos f) exactamente 4 SEMANA 6 TÉCNICAS DE CONTEO El análisis de los problemas de probabilidad se facilita a través de métodos sistemáticos de conteo de los grupos y arreglos de los datos. Principio de Multiplicación Si un experimento puede describirse como una secuencia de k pasos y en cada paso hay n1 resultados en el primer paso, n2 resultados en el segundo paso, n3 resultados en el tercer paso, y así sucesivamente, entonces el número de eventos que pueden ocurrir será, (n1) • (n2) • (n3) • (n4) • • • • • • (nk) Ejemplos: 1. Lanzar dos dados: (n1) • (n2) = (6) • (6) = 36 2. Suponga que se desea formar un comité de tres miembros en el cuál se elegirá un presidente, un vicepresidente y un tesorero. Hay dos candidatos para la presidencia, 4 para la vicepresidencia y 3 para el tesorero. ¿De cuántas formas se puede formar el comité? # de formas para escoger presidencia: 2 # de formas para escoger vicepresidencia : 4 # de formas para escoger el tesorero : 3 # formas para escoger las posiciones: 2 • 4 • 3 = 24

Muestras Ordenadas PERMUTACIÓN (P) Cada arreglo de datos donde el orden es importante y que puede realizarse tomando algunos datos o todos los datos contenidos en el grupo. NPn = N! / [N – n]! N = # de elementos diferentes disponibles (población) n = # número de elementos tomados de N (muestra) También se denota como:

o NOTA Definición de Factorial. El simbolo n! que se lee “n factorial “ se refiere al producto de todos los enteros desde n hasta 1. n ! = n ( n – 1 ) ( n – 2 ) ( n – 3 ) ……….3.2.1 definición: 0 ! = 1 ( cero factorial es 1 ) ejemplos; 5 ! = 5 . 4 . 3 . 2 . 1 5!=5.4! 4!=4.3.2.14!=4.3! 3!=3.2.13!=3.2! 2!=2.1 Ejemplo. ¿De cuántas maneras se pueden ordenar las letras A, B, C tomándolas todas a la vez? Solución: 3P3 = 6 ; P= [ ABC, BCA, CAB, BAC, CBA, ACB ] Ejemplo: Un examen de candidatura consta de 5 partes que pueden obtenerse de un total de 10 temas. ¿de cuántas maneras se pueden escoger las 5 partes?

10P5 = 10! / [10 – 5]! = 120 Ejemplo: Haga una lista de las permutaciones que pueden formarse con los #s: 1, 2, 3 y 4 tomando dos a la vez. 4P2 = 4! = 4 • 3 • 2! = 12 (4- 2)! 2 ! Muestras no ordenadas sin repetición. Cuando el orden en que se seleccionan los objetos no importa, tenemos lo que se denomina una Combinación. COMBINACIONES (C) Número de formas diferentes que se pueden seleccionar n objetos de un total de N objetos distintos sin importar el orden (Ej. juego de póker). NCn = N! / n! ( N – n ) ! También se denota como:

o como:

o como:

Ejemplo: Se dispone de 8 personas, 5 hombres y 3 mujeres, para formar un comité de 5 personas. ¿De cuántas maneras se puede formar el comité si debe incluir 3 hombres y 2 mujeres? NCn = 8C5 = [5C3][3C2 ] = [ 5! / 3! (5-3)! ] [ 3! / 2! (3-2)!] NCn= 8C5 = [10] [3] = 30 Las permutaciones están ligadas a las combinaciones mediante la siguiente identidad:

Ejercicios resueltos1 1. ¿Cuántos números de 3 cifras distintas se pueden formar con los números 2, 3, 5, 7, 8, 9? Solución: 6P3 = 120 2. Cinco personas entran en un vagón de ferrocarril en que hay 7 asientos. ¿De cuántas maneras distintas pueden sentarse? 1

Tomado de: http://ima.ucv.cl/mapoyo/guias/nat_combinatoria.pdf

Solución: 7P5 = 2520 3. ¿Cuántos números de 4 cifras distintas se pueden formar con los números 1, 3, 5, 6, 8, 0? ¿Cuantos de ellos son pares? Ayuda: No hay que considerar los que empiezan con 0, por ejemplo 0135 135, y éste no es un número de 4 cifras. Respuesta: 6P4 – 5P3 = 360 – 60 = 300; pares = 5P3 * 3 – 5P3 = 120

20. ¿Cuántas permutaciones pueden formarse con las letras de la palabra CUADERNO? ¿Cuántas comenzarán con C y terminarán con O? 21. ¿De cuántas maneras 4 hombres y 4 mujeres pueden sentarse alrededor de una mesa redonda, si se intercalan los sexos?

SEMANA 7 PROBABILIDAD CONDICIONAL En muchas ocasiones la probabilidad de que ocurra un evento depende de lo que ha ocurrido con otro evento. En este caso tenemos lo que se llama probabilidad condicional. Definición de probabilidad condicional Se llama probabilidad condicional a la probabilidad de que un suceso se cumpla habiéndose cumplido ya otro. Se nota "probabilidad de A sabiendo que B se ha cumplido" de la siguiente manera: pB(A) ó p(A\B) Dicha probabilidad se calculará de la siguiente forma:

La probabilidad condicional de A, dado que ha ocurrido el evento B, se escribe P(A/B). O sea, es la probabilidad de que ocurra un evento A cuando se conoce cierta información relacionada con la ocurrencia de otro evento B. P(A/B) probabilidad de que ocurra A dado que B ha ocurrido. P(B/A) probabilidad de que ocurra B dado que A ha ocurrido. P(A/B) = P(A_B) / P(B) probabilidad condicional de A P(B/A) = P(A_B) / P(A) probabilidad condicional de B P(A_B). Es la probabilidad conjunta porque denota la intersección de dos eventos, A y B. P(A) y P(B) se denominan probabilidades marginales Eventos Independientes y Dependientes Se dice que dos eventos son independientes si y solo si, P(A/B) = P(A) Se dice que dos eventos son dependientes si la ocurrencia de uno de ellos afecta la ocurrencia del otro.

P(A/B) ≠ P(A)

Regla de Multiplicación de probabilidad Esta regla de probabilidad se deriva de la definición de probabilidad condicional y utiliza el concepto de intersección de eventos para su aplicación. a. Si A y B son eventos independientes, entonces,

P(A_B) = P(A) • P(B) b. Si A y B son eventos dependientes, entonces, P(A_B) = P(B) • P(A/B) P(A_B) = P(A) • P(B/A) Ejemplo de probabilidad condicional 1: Un importador de piñas recibe un cargamento de 500 cajas de la República Dominicana. Los datos de piñas dañadas en cada caja se muestran a continuación. El cálculo de las probabilidades correspondientes se muestra en la columna P(E). Evento ( E )

# de cajas

P(E)

# de piñas dañadas 0 1 2 3

385 90 14 11

385 / 500 = 0.77 90 / 500 = 0.18 14 / 500 = 0.028 11 / 500 = 0.022

Ejemplo de probabilidad condicional 2: La tabla a continuación nos presenta el ascenso a catedráticos de los profesores de una institución durante los últimos 5 años. Tabla de Ascenso al rango de Catedrático Hombres Mujeres Totales Ascendido A 278 26 304 No ascendido A' 662 194 856 Totales 940 220 1,160 En la tabla de las probabilidades las probabilidades conjuntas aparecen en el interior de la tabla y las probabilidades marginales en los márgenes. Estas últimas se llaman probabilidades marginales. Tabla de Probabilidades Conjunta Hombres Mujeres Totales A 0.24 0.02 A' 0.57 0.17 Totales 0.81 0.19 A- ascendido A'- no ascendido

0.26 0.74 1.00

¿Cuál es la probabilidad de que un profesor seleccionado al azar sea hombre (H) y fue ascendido? P(H_A) = 278 / 1160 = 0.24 ¿Cuál es la probabilidad de que un profesor seleccionado al azar sea hombre (H) y no fue ascendido?

P(H_A') = 662 / 1160 = .57 ¿Cuál es la probabilidad de que un profesor seleccionado al azar sea mujer (M) fue ascendido? P(M_A) = 26 / 1160 = .02 ¿Cuál es la probabilidad de que un profesor seleccionado al azar sea mujer (M) y no fue ascendido? P(M_A') = 194 / 1160 = .17 Ejemplo de probabilidad condicional 3: Considerando los datos del ejemplo anterior, calcule: a. Cuál es la probabilidad de que un profesor escogido al azar sea ascendido dado que es hombre (H)? P(A/H) = 278 / 940 = 0.30 Alternativamente P(A_H) = P(H) • P(A/H) P(A/H) = P(A_H)/P(H) = 0.24 / 0.81 = .030 b. La probabilidad de que un profesor escogido al azar sea ascendido dado que es hombre (M) P(A/M) = 26 / 220 Alternativamente P(A_M) = P(M) • P(A/M) P(A/M) = P(A_M) / P(M)= 0.02 / 0.19 = 0.12 Ejercicios de probabilidades propuestos 2 1. Una urna contiene 10 bolas, 6 blancas y 4 negras. Si se saca una bola al azar, ¿cuál es la probabilidad de que la bola sea blanca? Respuesta: 0.60 2. Se saca una carta de un mazo de 52 cartas: a. la probabilidad de que la carta sea un rey. Respuesta: 0 .071 b. la probabilidad que sea un As de corazón rojo. Respuesta: 0.019 c. la probabilidad que la carta sea negra. Respuesta: 0 .5 d. la probabilidad que la carta sea de espada. Respuesta: 0.25 3. Se saca una carta de un mazo de 52 cartas, ¿cuáles la probabilidad de que sea un As o un Rey? Respuesta: 0.1538 4. Se saca una bola de una urna que contiene 12 bolas, 7 azules y 5 blancas, ¿cuál es la probabilidad de que sea azul o blanca. 5. Un individuo que entra a una farmacia tiene una probabilidad de comprar pasta dental de 0.45, de comprar desodorante de 0.35 y de comprar ambos de 0.25. Si ese individuo entra a la farmacia, ¿cuál es la probabilidad la de que compre pasta dental o desodorante? Respuesta: 0.55 2

http://facultad.sagrado.edu/ConceptosBasicos.pdf

6. Se saca una carta de un mazo de 52 cartas, ¿cuál es la probabilidad de que se obtenga un As o una carta roja? Respuesta: 0.538 7. En la población de Puerto Rico se ha estimado que la probabilidad de fumar es de 0.65 y la de fumar ocasionalmente de 0.20, ¿cuál es la probabilidad de no fumar para esa población? 8. En una universidad 40% poseen un diploma en el idioma Francés, 30% poseen un diploma en el idioma Italiano y 10% poseen un diploma en ambos idiomas. Si se escoge un miembro de esa comunidad al azar, ¿cuál es la probabilidad de que posea un diploma de Francés o Italiano? 9. Suponga que un distribuidor de autos recibe 12 nuevos modelos, 8 automáticos y 4 estándares. Si se venden cuatro autos el próximo mes, ¿cuál es la probabilidad de que los autos vendidos sean dos automáticos y dos estándares? ¿Cuál es la probabilidad de que los 4 sean o automáticos o estándares? Respuesta: 0.33 y 0.1434 10. La probabilidad de que ocurra el evento A es 0.35, la probabilidad de que ocurra el evento B es 0.10. Si A y B son eventos independientes, ¿cuál es la probabilidad de que ocurra el evento [P(A∩B]? 11. 55 porciento de las personas de Puerto Rico viven en el área metropolitana de San Juan (SJMA). Además, 70 porciento de esas personas se sienten felices y 40 porciento de todas las personas de PR viven en el SJMA y son felices. Demostrar si los eventos vivir en el SJMA y ser felices son eventos dependientes o independientes. 12. Si los eventos A y B son mutuamente excluyentes y si P(A) = 0.30 y P(B) = 0.45, determinar P(A B ) y P( A / B) 13. El 50% de las personas de una comunidad poseen una cámara digital y una computadora. Además, 30% posee una computadora y 40% una cámara digital. ¿Cuál es la probabilidad que si seleccionamos una persona al azar posea una cámara o una computadora?

UNIDAD II FUNCIONES PROBABILÍSTICAS Objetivos: •

Determinar y graficar las funciones de probabilidad y de distribución de una cierta variable aleatoria discreta y continua.



Distinguir una ley de probabilidades de otra mediante sus características

ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD II La unidad 2 se estudia desde la 8va hasta la 11ra semana de clases y comprende temas como: distribución de probabilidad, distribución binomial, distribución hipergeométrica, distribución de Poisson, distribución de Gauss. Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría, ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos. SEMANA 8 DISTRIBUCIONES DE PROBABILIDAD Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan sino sólo unas pocas. Los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen todos los parámetros que intervienen o no son reproducibles sus condiciones iniciales (teoría del caos). Para simplificar, generalmente a este tipo de problemas también se le considera aleatorio aunque estrictamente hablando no lo sea. La distribución de probabilidad es un modelo teórico que describe la forma en que varían los resultados de un experimento aleatorio. Lista de los resultados de un experimento con las probabilidades que se esperarían ver asociadas con cada resultado.

Función de densidad de probabilidad La función de densidad, o densidad de probabilidad de una variable aleatoria, es una función a partir de la cual se obtiene la probabilidad de cada valor que toma la variable. Su integral en el caso de variables aleatorias continuas es la distribución de probabilidad. En el caso de variables aleatorias discretas la distribución de probabilidad se obtiene a través del sumatorio de la función de densidad. Es una función que mide concentración de probabilidad alrededor de los valores de una variable aleatoria continua. •

Función de probabilidad: función que asigna probabilidades a cada uno de los valores de una variable aleatoria discreta.



Función de distribución: función que acumula probabilidades asociadas a una variable aleatoria.

ESPERANZA MATEMATICA O VALOR ESPERADO En estadística la esperanza matemática o valor esperado de una variable aleatoria es la suma de la probabilidad de cada suceso multiplicada por su valor. Por ejemplo en un juego de azar el valor esperado es el beneficio medio. Es el valor de la variable aleatoria para el cual la función de distribución se maximiza. Para funciones de distribución simétricas con un máximo central el valor esperado coincide con la Media ponderada. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética.

Definición de la esperanza Para una variable aleatoria discreta con valores posibles

y sus posibilidades

representadas por la función de masa p(xi) la esperanza se calcula con

Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la función de densidad f(x):

o La esperanza también se suele simbolizar con μ = E[X]

Las esperanzas los momentos centrados

para

se llaman momentos de orden . Más importantes son .

No todas las variables aleatorias tienen un valor esperado (por ejemplo la distribución de Cauchy). La esperanza es un operador lineal, ya que , donde

e

son variables aleatorias y y dos constantes cualesquiera

SEMANA 9 DISTRIBUCION BINOMIAL Supongamos que un experimento aleatorio tiene las siguientes características: •

En cada prueba del experimento sólo son posibles dos resultados: el suceso A

(éxito) y su contrario ( fracaso). •

El resultado obtenido en cada prueba es independiente de los resultados

obtenidos anteriormente. •

La probabilidad del suceso A es constante, la representamos por p, y no varía

de una prueba a otra. La probabilidad de A’ es 1- p y la representamos por q . •

El experimento consta de un número n de pruebas.

Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial. La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4,..n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre k). La distribución Binomial se suele representar por B(n,p) siendo n y p los parámetros de dicha distribución. Parámetros de la Distribución Binomial

Función de Distribución de la v.a. Binomial

siendo k el mayor número entero menor o igual a xi.

Esta función de distribución proporciona, para cada número real xi, la probabilidad de que la variable X tome valores menores o iguales que xi. El cálculo de las F(x) = p( X x) puede resultar laborioso, por ello se han construido tablas para algunos valores de n y p que nos facilitan el trabajo. Sea X una variable aleatoria discreta correspondiente a una distribución binomial.

Ejemplo 1 Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa. Solución: Se trata de una distribución binomial de parámetros B(50, 0'007) y debemos calcular la probabilidad p(X=1).

Ejemplo 2 La probabilidad de éxito de una determinada vacuna es 0,72. Calcula la probabilidad de a que una vez

administrada

a)

Ninguno

b)

Todos

a

pacientes:

sufra

la

enfermedad

sufran

la

enfermedad

c) Dos de ellos contraigan la enfermedad Solución : Se trata de una distribución binomial de parámetros B(15, 0'72)

Ejemplo 3

15

La probabilidad de que el carburador de un coche salga de fábrica defectuoso es del 4 por 100. Hallar: a)

El

número

de

carburadores

defectuosos

esperados

en

un

lote

de

1000

b) La varianza y la desviación típica. Solución:

DISTRIBUCION HIPERGEOMETRICA Los experimentos que tienen este tipo de distribución tienen las siguientes características: a)

Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.

b)

Las probabilidades asociadas a cada uno de los resultados no son constantes.

c)

Cada ensayo o repetición del experimento no es independiente de los demás.

d)

El número de repeticiones del experimento (n) es constante.

Se calcula así: p( x , n ) =

a

C x * N −a C n − x N Cn

Donde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados a

C x * N −a C n− x = muestras de n objetos en donde hay x que son defectuosos y n-x buenos

N

C n = δ = todas las muestras posibles de seleccionar de n objetos tomadas de entre N

objetos en total = espacio muestral Ejemplo: Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? Solución: N = 10 objetos en total a = 3 objetos defectuosos n = 4 objetos seleccionados en muestra x = 2 objetos defectuosos deseados en la muestra

p( x = 2, n = 4 ) =

3

C2*10 − 3 C4 − 2 10 C4

3! 7! * C* C ( 3 − 2 )!2! ( 7 − 2 )!2! = 3 2 7 2 = = 10! 10 C4 ( 10 − 4 )!4!

3! 7! 3 x 2 x1! 7 x 6 x5! * * 1 ! 2 ! 5 ! 2 ! 1 ! 2 ! 5!2! = 3 x 2 x 7 x6 * 4! = = = 10! 10 x9 x8 x7 x 6! 10 x9 x8 x7 2!2! 6!4! 6!4!

donde: 3 x 2 x7 x6 = 10 x9 x8 x7

probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con

lo que se demuestra que las probabilidades no son constantes 4! = 2!2!

formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados =

muestras de 4 objetos entre los que 2 son defectuosos Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería:

=

3 x 2 x7 x 6 4! 252 24 6048 * = * = = 0.30 10 x9 x8 x7 2!2! 5040 4 20160

Ejemplo: Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos? Solución: a) N = 9+6 =15 total de tabletas

a = 6 tabletas de narcótico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico) = p( x = 1,2ó3tabletas ; n = 3 ) = =

6

C1* 9 C2 6 C2* 9 C1 6 C3* 9 C0 + + = C C C 15 3 15 3 15 3

( 6 )( 36 ) ( 15 )( 9 ) ( 20 )( 1 ) 216 + 135 + 20 371 + + = = = 0.81538 455 455 455 455 455

otra forma de resolver; p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas seleccionadas no haya una sola de narcótico) = 1 − p( x = 0; n = 3 ) = 1 −

= 1−

a)

6

C0* 9 C3 = 15 C3

( 1 )( 84 ) = −0.184615 = 0.815385 455

p(no sea arrestado por posesión de narcóticos) = p( x = 0; n = 3 ) = =

6

C0* 9 C3 = C 15 3

( 1 )( 84 ) = 0.184615 455

Ejemplo: De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten? Solución: a) N = 10 proyectiles en total a = 7 proyectiles que explotan n = 4 proyectiles seleccionados x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles que explotan entre la muestra que se dispara

p( x = 4; n = 4 ) =

7

C4* 3 C0 ( 35 )( 1 ) 35 = = = 0.16667 210 210 10 C4

b) N = 10 proyectiles en total a = 3 proyectiles que no explotan n = 4 proyectiles seleccionados x = 0, 1, 2 o 3 proyectiles que no explotan p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) = =

3

C2* 7 C2 + 3 C3* 7 C1 ( 3 )( 21 ) + ( 1 )( 7 ) 63 + 7 70 = = = = 0.333333 210 210 210 10 C4

Ejemplo: Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?, b) ¿Cuál es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a menores de edad? Solución: a) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad 4

p( x = 2,n = 5 ) =

C2 * 5 C3 9

C5

=

( 3 )( 10 ) = 0.238095 126

b) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el número de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

p( x = 0 ,1,2; n = 5 ) =

4

C0* 5 C5 + 4 C1* 5 C4 + 4 C2* 5 C3 ( 1 )( 1 ) + ( 4 )( 5 ) + ( 6 )( 10 ) = = 126 9 C5

=

1 + 20 + 60 81 = = 0.64286 126 126

Ejercicio propuesto 1. Una compañía manufacturera utiliza un esquema para la aceptación de los artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algún artículo defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca. a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos defectuosos?, b) ¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso se regresa para verificación? SEMANA 10 DISTRIBUCION DE POISSON Es una distribución de probabilidad discreta. Expresa la probabilidad de un número de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son independientes del tiempo desde el último evento. Su distribución de probabilidad está dada por:

Donde: •

e es el base del logaritmo natural (e = 2.71828...),



k! es el factorial de k,



λ es un número real positivo, equivalente al número esperado de ocurrencias durante un intervalo dado. Por ejemplo, si los eventos ocurren de media cada 4 minutos, y se está interesado en el número de eventos ocurriendo en un intervalo de 10 minutos, se usaría como modelo una distribución de Poisson con λ = 2.5.

Ejemplo: Por ejemplo, si 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas.

SEMANA 11 DISTRIBUCION NORMAL La distribución normal, también llamada distribución de Gauss o distribución gaussiana, es la distribución de probabilidad que con más frecuencia aparece en estadística y teoría de probabilidades. Esto se debe a dos razones fundamentalmente: •

Su función de densidad es simétrica y con forma de campana, lo que favorece su aplicación como modelo a gran número de variables estadísticas.



Es, además, límite de otras distribuciones y aparece relacionada con multitud de resultados ligados a la teoría de las probabilidades gracias a sus propiedades matemáticas.

La función de densidad está dada por:

donde μ (Μ) es la media y σ (sigma) es la desviación estándar (σ2 es la varianza). Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal: •

Caracteres morfológicos de individuos



Caracteres fisiológicos como el efecto de un fármaco



Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos



Caracteres psicológicos como el cociente intelectual



Errores cometidos al medir ciertas magnitudes



Valores estadísticos muestrales como la media

Distribución normal estándar. Estandarización Cuando μ = 0 y σ = 1, la distribución se conoce con el nombre de normal estándar.

Dada una variable aleatoria normal X, con media (también llamada Esperanza matemática) μ y

desviación típica σ, si definimos otra variable aleatoria

entonces la variable aleatoria

Z tendrá una distribución normal estándar μ = 0 y σ = 1. Se dice que se ha tipificado la variable X. Ejemplo: Para hallar la probabilidad de la distribución normal, se deben usar tablas predefinidas que nos dan estos valores directamente, si bien éstas se calculan para la distribución Normal Tipificada. En el caso de que la distribución no sea estándar, por ejemplo, x=2.6 y N(μ,σ) con μ = 2 y σ = 3, tendremos que tipificar la variable:

Obtenemos una variable Z normal, que además está tipificada. Si ahora consultamos en la tabla,

UNIDAD III PROCESOS ESTOCÁSTICOS Objetivos: •

Introducir al estudiante en la problemática del modelamiento de sistemas estocásticos.



Resolver problemas asociados a las transiciones entre estados



Adquirir los conceptos de irreducibilidad y periodicidad. Clasificar los estados de una cadena de Markov.



Utilizar la clasificación de los estados y la periodicidad de los mismos para conocer el comportamiento a largo plazo de una cadena de Markov.

ORIENTACIONES PARA EL TRABAJO CON LA UNIDAD III La unidad III se estudiará desde la 12da hasta la 18va semana de clases y comprende temas como: Ruido, movimiento Browniano, cadenas de Harkov en tiempo discreto y continuo, teoría ergódica, para finalmente terminar revisando las ecuaciones de Chapman-Kolmogorov. Los temas a revisarse durante cada una de las semanas se encuentran conformados por: teoría, ejercicios resueltos y ejercicios propuestos. El estudiante debe leer las bases teóricas y adicionalmente complementar estas definiciones con investigaciones personales sobre el tema. Se sugiere estudiar los ejercicios propuestos para posteriormente resolver los ejercicios propuestos. SEMANA 12 PROCESOS GAUSSIANOS RUIDO El ruido es la suma de múltiples interferencias, de origen desconocido y de naturaleza aleatoria. Origen del ruido El ruido se genera de varias formas entre las que tenemos: •

La agitación térmica producida en las moléculas del material que forma el conductor, por el choque con los electrones en movimiento.



La irradiación de los cuerpos negros es otro factor importante en el ruido de las comunicaciones por radio, ya que todos los objetos del universo, dependiendo de su temperatura, emiten energía en forma de ondas electromagnéticas.



El ruido producido por fuentes tales como contactos defectuosos, artefactos eléctricos, radiación por ignición y alumbrado fluorescente.



El ruido errático producido por fenómenos naturales tales como tormentas eléctricas con relámpagos y rayos.

La magnitud del ruido generado por un dispositivo electrónico, se puede expresar mediante el denominado factor de ruido (F), que es el resultado de dividir la relación señal/ruido en la entrada (S/R)ent por la relación señal/ruido en la salida (S/R)sal. El factor de ruido es un parámetro importante en los sistemas de transmisión, ya que mientras el ruido externo nunca se podrá eliminar totalmente, la reducción del ruido generado por los equipos depende del cuidado de su diseño. MOVIMIENTO BROWNIANO Observemos con cuidado la bocanada de humo que lanza al aire un fumador. Veremos que está compuesta de pequeñísimas partículas que se están moviendo continuamente en todas las direcciones, también en zigzag. Se observa que partículas muy pequeñas se hallan inmersas en un fluido, que en éste caso es el aire de la atmósfera. El movimiento descrito, que lleva a cabo una partícula muy pequeña que está inmersa en un fluido, se llama movimiento browniano. Este movimiento se caracteriza por ser continuo y muy irregular. La trayectoria que sigue la partícula es en zigzag.

El movimiento browniano es de tipo estocástico y su descripción se hace en términos de su distribución. Además hay que tener en mente que esta fuerza estocástica cambia al transcurrir el tiempo, lo que significa que no sólo hay que decir algo acerca de su distribución en un instante dado de tiempo, sino también algo acerca de cómo están relacionados los valores de las fuerzas estocásticas en distintos instantes.

Langevin formuló la hipótesis, que de hecho es la más sencilla, de que la distribución de la fuerza estocástica es gaussiana. Por tanto, su determinación se reduce a conocer su promedio y su desviación estándar. DISTRIBUCION DE RAYLEIGH Esta distribución es usada en trabajos de confiabilidad asociados a problemas en teoría del sonido. Su función de densidad está dada por

La función de distribución acumulada está dada por

Si T es una variable aleatoria que sigue esta ley de probabilidad se puede demostrar que su esperanza es

Siendo G ( ) la función gamma definida por

Ejemplo: Se suele presentar cuando un vector bidimensional (por ejemplo, el que representa la velocidad del viento) tiene sus dos componentes, ortogonales, independientes y siguen una distribución normal. Su valor absoluto seguirá entonces una distribución de Rayleigh. Esta distribución también se puede presentar en el caso de números complejos con componentes real e imaginaria independientes y siguiendo una distribución normal. Su valor absoluto sigue una distribución de Rayleigh. Ejemplo: Interfaz de radio con GSM Si suponemos que el móvil se mueve (como es evidente), añadimos los efectos de la propagación terrestre, que está dominada por la influencia más destructiva de todas: los desvanecimientos Rayleigh. Dado que las ondas de radio pueden seguir una variedad de caminos hasta el receptor móvil, pueden ocurrir cambios de fase, que son dependientes de la frecuencia. Este tipo de desvanecimientos ocurren con una distribución estadística llamada distribución Rayleigh. La distribución tipo Rayleigh que involucra el voltaje recibido antes de la detección de envolvente, y la potencia media de la señal recibida antes de la detección de envolvente. La probabilidad de que la

envolvente de la señal recibida no exceda un valor especificado R está data por la correspondiente función de distribución acumulativa

SEMANA 13 PROCESOS ESTOCASTICOS DEFINICIONES DE PROCESOS ESTOCASTICOS Palabra proveniente del griego: στοχαστικός, hábil en conjeturar. Significa "perteneciente o relativo al azar" según el diccionario. Se denomina estocástico a aquel sistema que funciona, sobre todo, por el azar. Las leyes de causaefecto no explican cómo actúa el sistema (y de modo reducido el fenómeno) de manera determinista, sino en función de probabilidades. En Matemáticas y en concreto en Estadística y Teoría de la Probabilidad un proceso aleatorio o proceso estocástico (o probabilístico) es un concepto matemático que sirve para caracterizar y estudiar todo tipo fenómenos aleatorios (estocásticos) que evolucionan, generalmente, con el tiempo. Ejemplo: El índice de la bolsa es un ejemplo de proceso estocástico de tipo no estacionario, por eso no se puede predecir. Los siguientes son ejemplos de procesos estocásticos dentro del amplio grupo de las series temporales: o

Señales de telecomunicación

o

Señales biomédicas (electrocardiograma, encefalograma, etc...)

o

Señales sísmicas

o

El número de manchas solares año tras año

o

El índice de la bolsa segundo a segundo

o

La evolución de la población de un municipio año tras año



El tiempo de espera en cola de cada uno de los usuarios que van llegando a una ventanilla



El clima es un gigantesco cúmulo de procesos estocásticos interrelacionados (velocidad del viento, humedad del aire, temperatura, etc.) que evolucionan en el espacio y en el tiempo.

Definición matemática

Un proceso estocástico se puede definir equivalentemente de dos formas diferentes: •

Como un conjunto de variables aleatorias Xk indexadas por un índice k, que puede ser continuo o discreto



Como un conjunto de realizaciones temporales y un índice aleatorio que selecciona una de ellas.

Las variables aleatorias Xk toman valores en un conjunto que se denomina espacio de estados CADENAS DE MARKOV Una cadena de Markov, propuesta por el matemático ruso Andrei Markov en 1907, es una serie de eventos (X1, X2, …,Xn), en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. El rango de estas variables, es llamado espacio estado, el valor de Xn es el estado del proceso en el tiempo n. Las cadenas de este tipo tienen memoria. "Recuerdan" el último evento y esto condiciona las posibilidades de los eventos futuros. Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. Ejemplo: En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra de los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo. Todos estos procesos se caracterizan porque su estado presente resume toda la información relevante para describir en probabilidad su estado futuro. Ejemplo: Escogemos 4 estudiantes al azar en una clase formada por 10 chicos y 5 chicas. ¿Cuál es la probabilidad de que hayan sido elegidos chico, chica, chica, chica en ese orden? Solución: Nótese que éstos sucesos son dependientes pero NO son estocásticos ya que por ejemplo la ocurrencia del último evento no de pende solo del inmediatamente anterior, sino de todos los anteriores puesto que existe un orden predefinido. P(O1∩A2∩A3∩A4)=P(O1).P(A2/O1).P(A3/O1∩A2).P(A4/O1∩A2∩A3)=

Ejemplo:

10 5 4 3 . . . = 0.0183 15 14 13 12

Sea el experimento de tirar dardos 4 veces sobre una diana con probabilidad de acertar cada vez igual a 0.4. Solución: Otra vez es una sucesión de 4 pruebas y cada una de ellas tiene dos acontecimientos posibles: acertar o errar. Pero ahora las pruebas son independientes y, por lo tanto, la probabilidad de que ocurra un suceso determinado en una de las pruebas es independiente del resultado de las anteriores. Por ejemplo la probabilidad de que hayan ocurrido acierto, error, error, error en ese orden sería: P(A1∩E2∩E3∩E4)=P(A1).P(E2).P(E3).P(E4)= (0.4).(0.6).(0.6).(0.6)= 0.0864 Este es un proceso probabilística que NO es estocástico. Ejemplo: Durante las cuatro horas a la semana que tienen los alumnos de Estadística se reparten entre dos aulas: o van al aula de Informática, o trabajan en clase. Nunca van a los ordenadores dos días seguidos pero si un día trabaja en clase es igualmente probable que el día siguiente realice cualquiera de las dos tareas. El lunes, el profesor tira una moneda para decidir a dónde van. Solución: Una vez más el experimento consta de cuatro pruebas con dos sucesos en cada una de ellas (ir al aula de informática o no ir). A diferencia de los experimentos anteriores, la probabilidad de que en cada una de las pruebas ocurra un acontecimiento depende únicamente del resultado de la prueba anterior. Procesos de este tipo SI son estocásticos. La probabilidad de ir al aula de informática sólo el primer día: (I :"ir al aula de informática"; C=" trabaja en clase"). P( I1∩C2∩C3∩C4)= P(I1).P(C2/I1).P(C3/C2).P(C4/C3)=

1 1 1 .1. . = 0.125 2 2 2

Ejemplo: Calcule la probabilidad de ir al aula de informática el tercer día. p1(2). Solución: (Aquí hay que tener en cuenta las probabilidades iniciales p1(0) y p2(0)) , entonces: p1(2)=p11(2).p1(0)+ p21(2).p2(0)=0.375 ) Ejercicios propuestos Considere que los posibles estados del experimento anterior son: a1="ir

al

aula

de

Informática"

p11=probabilidad de ir del estado a1 al estado a1=0

a2=

"trabaja

en

clase"

p12=probabilidad de ir del estado a1 al estado a2=1

p1(0)=probabilidad inicial de ir al estado a1=1/2 p21=probabilidad de ir del estado a2 al estado a1=1/2 p2(0)=probabilidad inicial de ir al estado p22=probabilidad de ir del estado a2 al estado a2=1/2 a2=1/2 Se llaman probabilidades de transición entre estados de la cadena Ahora, escriba los valores de las probabilidades de la matriz de transición del problema anterior a lo largo de cuatro días seguidos (n=3 pasos) ¿Qué ocurrirá? 1. Observe los caminos que hay para ir de a1(primer día) a a1 el cuarto día (en n=3 pasos). La escena te da la probabilidad que será llamada p11(3). Compruebe que te da lo mismo que la probabilidad de ir al aula de informática en tres pasos (el cuarto día) sabiendo que también fueron el primer día. 2. Lo mismo para ir de a1 a a2 en tres pasos. p12(3). 3. ¿Y de a2 a a1 en tres pasos? p21(3). 4. Lo mismo de a2 a a2 en tres pasos. p22(3).. 5. Observe que tiene que ocurrir que p1(0)+ p2(0)=1 6. Observe que tiene que ocurrir que

p11+ p12=1 p21+ p22=1

Calcule ahora las siguientes probabilidades para el problema anterior: 7. Calcule la probabilidad de ir al aula de informática en tres pasos (el cuarto día): p1(3). ¿Qué diferencia observas entre la cuestión 1ª y esta?¿Qué probabilidades intervienen? SEMANA 14 CADENAS FINITAS DE MARKOV Un proceso estocástico finito en el que se verifica que el resultado de una prueba determinada depende como máximo de la prueba inmediatamente anterior y no de ninguno de los resultado previos , recibe el nombre de Cadena finita de Markov. En una cadena de Markov hay: •

Un espacio de estados E={a1,a2,a3,.... an } (Cada estado son todos los resultados posibles de cada una de las pruebas).

Cuando el resultado de la prueba r es ai decimos que el proceso está en el estado ai en el paso résimo.



Para cada dos estados ai y aj , la probabilidad de que el estado aj ocurra inmediatamente después que el estado ai, que llamaremos probabilidad de transición del estado ai al estado aj , y que designaremos por Pij. •

Si ordenamos todas las probabilidades de transición Pij en una matriz nxn obtenemos

la matriz de transición del proceso:

 P11  P P =  21 .....  P  n1

P12 P22 ..... Pn 2

....... ....... ....... .......

P1n   P2 n  .....   Pnn 

Ejemplo: El departamento de estudios de mercado de una fábrica estima que el 20% de la gente que compra un producto un mes, no lo comprará el mes siguiente. Además, el 30% de quienes no lo compren un mes lo adquirirá al mes siguiente. En una población de 1000 individuos, 100 compraron el producto el primer mes. ¿Cuántos lo comprarán al mes próximo? ¿Y dentro de dos meses ? Solución Para entender el problema, se recomienda realizar un gráfico del mismo.

Así, la matriz de probabilidades de transición es: Compra el producto No compra el producto Al estado 0,80 0,30 Compra el producto 0,20 0,70 No compra el producto

La matriz es estocástica (P) porque sumando todas sus columnas, el resultado es 1. Ahora formamos la matriz de estado con los datos del problema (le llamaremos X). Nótese que en X, en la primera fila he puesto las personas que compran el producto 100, en la segunda los que no lo compran 1000-100=900.

Ahora para averiguar la nueva matriz de estado en el primer mes se debe multiplicar la matriz de probabilidades de transición P por la matriz inicial de estado X. Al primer mes, 350 han comprado el producto y 650 no lo han comprado.

Para el siguiente mes, vuelvo a multiplicar la matriz de probabilidades de transición por la nueva matriz de estado obtenida. En este caso, primero se ha asignado a X el producto de P.X, con lo cual se tiene la nueva matriz de estado al cabo del primer mes. Para el siguiente mes, el proceso se repite, y la matriz obtenida sería la nueva matriz de estado (en el segundo mes de estudio).

Otro procedimiento sería haber dejado la matriz de estado inicial X y para el segundo mes, como se debe multiplicar dos veces por P (por la izquierda), se podría haber efectuado (P2 . X). El resultado indica que en el segundo mes 475 personas han comprado el producto y 525 no.

Vamos a hacer un experimento ya que disponemos de la Classpad que nos ahorra cálculos repetitivos. ¿Qué pasará en los meses siguientes suponiendo que no cambia la matriz de probabilidades de transición?

Nótese que en este tipo de problemas, el producto Pn . X tiende a un estado estacionario, el cual es independiente de la matriz de estado inicial X. MATRIZ ESTOCÁSTICA O DE PROBABILIDADES DE TRANSICIÓN En esta matriz cada línea contiene las probabilidades de transición de un estado determinado a todos los demás, es decir, las probabilidades de todos los resultados posibles de la próxima prueba. La suma de todas estas probabilidades debe de ser 1 y, por tanto, la suma de los elementos de cada fila de la matriz de transición vale 1. Como además todos los elementos de la matriz son ≥0 por ser probabilidades, la matriz de transición es una matriz estocástica. •

El vector formado por las probabilidades del estado inicial del sistema., llamado

vector de probabilidad inicial (0)

P ( 0 ) = ( P1 , P2( 0 ) ,.......,Pn( 0 ) ) Obsérvese que la suma de las probabilidades que expresan los elementos del vector debe ser igual a 1 y, por lo tanto, el vector de probabilidad inicial es un vector estocástico. Ejercicios propuestos 1. Escriba el espacio de estados y la matriz de transición para el ejemplo de la escena anterior. 2. Un alumno acude al Instituto, o bien en bicicleta o andando. Si un día emplea la bicicleta, al día siguiente utilizará la bicicleta con probabilidad 1/2, y si va andando al día siguiente también lo hará con probabilidad 3/4. Calcule el espacio de estados, la matriz de transición del proceso. 3. En una región, si un día hay niebla al siguiente llueve pero, si llueve, el día siguiente es soleado. Se tiene observado que las probabilidades de que a un día con sol suceda un día nublado o lluvioso son, respectivamente, 0.4 y 0.6. Definir el espacio de estados y la matriz de transición del proceso. 4. Una Central de seguridad vial chequea a menudo uno de tres puntos conflictivos A, B y C. La probabilidad de que un día controle el mismo lugar que el día anterior es 1/2 y las probabilidades de que controle uno cualquiera de los otros dos puntos restantes son iguales. Definir el espacio de estados y la matriz de transición del proceso. PROBABILIDAD DE TRANSICIÓN EN K PASOS Es la probabilidad de que un proceso pase del estado ai al estado aj en k pasos . se escribe

Pij

(k )

para i,j=1,2,3,....,n. Estas probabilidades se pueden ordenar en una matriz que se llama matriz de transición en k pasos:

P (k )

 P11 ( k )  (k ) P =  21  ......  P (k )  n1

(k )

P12 (k ) P22 ....... (k ) Pn 2

(k ) P1n   (k ) P2 n   ....... .......  (k ) ...... Pnn 

...... ......

Teorema: Si P es la matriz de transición de una cadena de Markov, entonces la matriz de transición de k pasos es la k-ésima potencia de P

P (k ) = P k Ejercicios propuestos 1. En una ciudad existen dos partidos políticos, uno de derechas y otro de izquierdas. Los alcaldes son elegidos por un período de un año y se ha observado que la probabilidad de que a un alcalde de derechas suceda otro del mismo signo político es 3/5 y que a un alcalde de izquierdas siga otro de izquierdas es 1/2. a) Supongamos que en 2005 hay alcalde de izquierdas. ¿Cuál será la probabilidad de que en 2008 siga un alcalde de izquierdas al frente del concejo? 2. Un hombre conduce su coche o toma el tren para ir a trabajar cada día. Supongamos que nunca toma el tren dos días seguidos; pero si conduce para ir a trabajar, entonces al día siguiente es tan probable que conduzca de nuevo como que tome el tren. a) Escribe la matriz de transición del proceso. b) Calcule la probabilidad de que vaya en coche, cuatro días después de haber ido en tren. 3. Un ascensor de un edificio con bajo y dos pisos realiza viajes de uno a otro piso (lleno o vacío de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una cadena de Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de los otros dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25 % de las veces finaliza en el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en el bajo. A)

Calcular la matriz de probabilidades de transición de la cadena.

B)

Dibujar su gráfico asociado. Es regular.

C) ¿Dónde es más probable que esté el ascensor después de cuatro viajes, si salió del Bajo? 4. Una familia planifica cada año sus vacaciones de la siguiente manera. Si un año va a la montaña al año siguiente va al mar y al segundo año descansa en la casa. Pero al año siguiente es igualmente

probable que se traslade al mar o a la montaña. En 2005 quedarán en casa. ¿Dónde es más probable que pasen sus vacaciones en el año 2010? SEMANA 15 PROBABILIDADES TOTALES La probabilidad de que el proceso se encuentre en el estado ai después de k pasos recibe el nombre de probabilidad total o absoluta.

Pi

(k )

A cada paso k le corresponde un vector estocástico formado por todas las probabilidades totales de ese paso: (k )

P ( k ) = ( P1 , P2

(k )

,...., Pn

(k )

)

en particular el vector de probabilidad inicial: (0)

(0)

(0)

P ( 0 ) = ( P1 , P2 ,....,Pn ) descrito en la primera escena de la página 1, que corresponde a la distribución de probabilidades de paso 0. El siguiente teorema nos proporciona un método para calcular las probabilidades absolutas correspondientes a una prueba k del sistema: Teorema: En una cadena de Markov con matriz de transición P se obtiene lo que sigue:

P ( 1 ) = P ( 0 ) .P P ( 2 ) = P ( 1 ) .P = P ( 0 ) .P 2 P ( 3 ) = P ( 2 ) .P = P ( 0 ) .P 3 ..... P (k) = P (k −1 ) .P = P ( 0 ) .P k Es decir las distribuciones de probabilidad del paso k se pueden calcular multiplicando el vector de probabilidad inicial por la potencia correspondiente de la matriz de transición Ejercicios propuestos 1. Dada la matriz de transición 0   1  P =  1 / 2 1 / 2 

con distribución de probabilidad P(0)=(1/3 2/3). Definir y hallar P21( 3) , P2( 3) , P ( 3)

2. En una ciudad existen dos partidos políticos, uno de derecha y otro de izquierda. Los alcaldes son elegidos por un período de un año y se ha observado que la probabilidad de que a un alcalde de derechas suceda otro del mismo signo político es 3/5 y que a un alcalde de izquierdas siga otro de izquierdas es 1/2. ¿Cuál serán las probabilidades de cada partido en el año 2010? 3. Un hombre conduce su auto o toma el tren para ir a trabajar cada día. Supongamos que nunca toma el tren dos días seguidos; pero si conduce para ir a trabajar, entonces al día siguiente es tan probable que conduzca de nuevo como que tome el tren. Si se sabe que el primer día de trabajo el hombre lanza un dado para decidir que si sale un 6 lleva el coche y si no va en tren. Calcula la distribución de probabilidad después de cuatro días. 4. Un supermercado realiza la experiencia siguiente en relación con las preferencias de sus clientes. Se observa que: El 80% de las personas que compran un día el producto A repite al día siguiente. El 60% de los que no lo compran el producto A un día, lo compran al día siguiente. Si el 50% compró el producto un día determinado, ¿qué podemos predecir para la compra del producto el segundo día? ¿Y para el tercero? 5. Una persona puede escoger entre tres restaurantes para comer diariamente. si un día escoge el restaurante A, al día siguiente escoge el B y al día siguiente del B siempre el C, pero cuando va a C es igualmente probable que al día siguiente vaya a A o a B. Escribir la matriz de transición del proceso y calculando después la tercera potencia de esa matriz, estimar a) la probabilidad de que vaya a B tres días después de ir a A. b) Las probabilidades absolutas de ir a cada restaurante después de cuatro días. CADENAS DE MARKOV REGULARES •

Son aquellas en las que es posible pasar a través de todos los estados de la cadena sin que este paso se realice de una forma cíclica. A su correspondiente matriz de transición se le denomina MATRIZ DE TRANSICIÓN REGULAR.



Se prueba que una matriz estocástica es regular si todos los elementos de una potencia Pn son positivos, para un cierto valor de n. Todos los estados son transitorios.



Si una matriz tiene un 1 en la diagonal principal, NO es regular (el estado al que corresponde se dirá estado absorbente)

Compruebe con las siguientes escenas que las matrices

M y H son regulares y que las R y S no

son regulares. Observa el diagrama, los 1 en la diagonal principal y las potencias de P.

 0 3 / 4 1/ 4   0 1 0     1 / 2 1 / 2  1 / 3 2 / 3   H =  1 / 5  S =  0 0 1  M =  0 4 / 5  R =  0  1   1  0 3 / 4 1/ 4  1 0 0 0     Ejercicios propuestos 1. Utilizando la escena anterior decir cuáles de las siguientes matrices son regulares y cuáles no. Apunta en tu cuaderno los resultados con las aclaraciones que consideres oportunas a cada caso. 2. Observe, para n grande, cómo son las filas de las matrices regulares y de las no regulares. Interprete este resultado. 1  1  0   0  0  1 1 / 4 3 / 4   B =   C =   D =   A =   − 1/ 2 3 / 2 1 / 2 1 / 2  1 / 2 1 / 2   1 / 3 2 / 3 0 1  1 / 2 1 / 4 1 / 4   0 1 / 7 3 / 7 3 / 7   0 1/ 2 1/ 2  1 / 3 0 2 / 3            A= 0 1 0 ; B = 1 / 2 1 / 4 1 / 4 ; C =  0 1 / 4 3 / 4 ; D =  0 0 0 ; E =  0 1 / 3 2 / 3 1 / 2 1 / 2 0   0  0  0 1 / 5 4 / 5 1 / 3 2 / 3 0  1 0  0 1         

VECTOR FIJO DE UNA MATRIZ DE TRANSICIÓN REGULAR Para tratar este tema, es conveniente repasar la resolución de sistemas. Vector fijo de probabilidad de orden 2 Se llama vector fijo de probabilidad de la matriz regular P de orden 2, al vector de probabilidad

v = ( x, 1 − x )

tal que verifica:

  v .P = v

Es decir que tiene que cumplir:

 P11 P12   = ( x, 1 − x ) ( x, 1 − x ) ⋅   P21 P22  Sus coordenadas se obtienen resolviendo la ecuación lineal en la variable x correspondiente, tras hacer el producto de matrices. O bien utilizando la escena siguiente: Ejercicios propuestos 1. Calcule el punto fijo de las matrices regulares de orden 2 de los apartados anteriores. Por ejemplo para la matriz 1   0  P =  1 / 2 1 / 2  resulta el vector fijo: (1/3,2/3)

A. Compruebe con las potencias de P que dicha cadena es regular, pues para cadenas no regulares no hay punto fijo. B. Una vez calculado el vector fijo, observe qué vector aparece en las sucesivas potencias de P como vectores fila de esa potencia. Vector fijo de probabilidad de orden 3 Se llama vector fijo de probabilidad de la matriz regular P de orden 3, al vector de probabilidad

 v = ( x, y , 1 − x − y )

tal que verifica:

  v .P = v

Es decir que tiene que cumplir:

 p11 p12 p13    ( x, y, 1 − x − y ) ⋅  p 21 p 22 p 23  = ( x, y, 1 − x − y ) p p   31 32 p33  Sus coordenadas se obtienen resolviendo la ecuación lineal en la variable x correspondiente, tras hacer el producto de matrices. Ejercicios resueltos: En una población de 10000 habitantes, 5000 no fuman, 2500 fuman uno o menos de un paquete diario y 2500 fuman más de un paquete diario. En un mes hay un 5% de probabilidad de que un no fumador comience a fumar un paquete diario, o menos, y un 2% de que un no fumador pase a fumar más de un paquete diario. Para los que fuman un paquete, o menos, hay un 10% de probabilidad de que dejen el tabaco, y un 10% de que pasen a fumar más de un paquete diario. Entre los que fuman más de un paquete, hay un 5% de probabilidad de que dejen el tabaco y un 10% de que pasen a fumar un paquete, o menos. ¿Cuántos individuos habrá de cada clase el próximo mes? ¿Y dentro de dos meses? Solución: El esquema para esta situación es el siguiente:

A partir del esquema, se puede construir la matriz de probabilidades de transición P y la matriz de estado X (esta última con los datos del problema). No fuman Fuman 1 paquete o menos Fuman más de 1 paquete Al estado 0,93 0,05 0,02

0,10 0,80 0,10

0,05 0,10 0,85

No fuman Fuman 1 paq. o menos Fuman más de 1 paquete

Ejercicios Propuestos I 1. Un psicólogo hace los supuestos siguientes que conciernen al comportamiento de ratas sujetas a un régimen especial de alimentación. Para una prueba particular, 80% de las ratas que fueron para la derecha en el experimento previo hicieron lo mismo en esta prueba, y 60% de aquellas que fueron para la izquierda en el experimento previo, fueron para la derecha en esta prueba. Si 50% van a la derecha en la primera prueba, ¿qué se podría predecir para la milésima prueba? 2. Un ascensor de un edificio con bajo y dos pisos realiza viajes de uno a otro piso (lleno o vacío de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una cadena de Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de los otros dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25 5 de las veces finaliza en el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en el bajo. ¿Cuál es la probabilidad de que, a largo plazo, el ascensor se encuentre en cada uno de los tres pisos? Ejercicios propuestos II 1. Calcule el punto fijo de las matrices regulares de orden 2 de los apartados anteriores. Por ejemplo para la matriz

1/ 3 2 / 3 0     0 2 / 5 3 / 5 1 / 2 0 1 / 2   

 9 10 12  es  , ,  ≅ (0.29,0.32,0.39)  31 31 31 

A. Compruebe con las potencias de P que dicha cadena es regular, pues para cadenas no regulares no hay punto fijo. B. Una vez calculado el vector fijo observe qué vector aparece en las sucesivas potencias de P como vectores fila de esa potencia. 2. Un psicólogo hace los supuestos siguientes que conciernen al comportamiento de ratas sujetas a un régimen especial de alimentación. Para una prueba particular, 80% de las ratas que fueron para la derecha en el experimento previo hicieron lo mismo en esta prueba, y 60% de aquellas que fueron para la izquierda en el experimento previo, fueron para la derecha en esta prueba. Si 50% van a la derecha en la primera prueba, ¿qué se podría predecir para la milésima prueba? 3. Un ascensor de un edificio con una planta baja y dos pisos realiza viajes de uno a otro piso (lleno o vacío de ocupantes). El piso en el que termina el viaje n-ésimo del ascensor sigue una cadena de Markov. Se sabe que la mitad de los viajes que parten del bajo se dirigen a cada uno de los otros dos pisos, mientras que si un viaje comienza en el primer piso, sólo el 25.5% de las veces finaliza en el segundo. Por último, si un trayecto comienza en el segundo piso, siempre termina en el bajo. ¿Cuál es la probabilidad de que, a largo plazo, el ascensor se encuentre en cada uno de los tres pisos? 4. La ilustración

V I

G O

Muestra un anuncio luminoso.

Las letras que lo forman se encienden alternativamente según la siguiente regla: La iluminación de una letra se mueve a la derecha con probabilidad 1/3 y hacia la izquierda con probabilidad 2/3. Cuando está encendida una de las letras de los extremos en el paso siguiente se ilumina la letra central adyacente. Calcular la probabilidad de que si está iluminada la letra G, se ilumine la letra I después de tres pasos. Calcular la distribución de probabilidades absolutas después de cuatro pasos. 5. Dadas las siguientes matrices, estúdiese si son matrices de transición regulares. Calcular los puntos fijos de las matrices regulares. Compruébese el teorema 3 con las matrices regulares.    A =     

1 7 0 0

3 7 1 4 0

3 7 3 4 1

       

;

0  B = 0  0

1/2 0 1/5

1/2  0   4 /5

;

1 / 3  C =  0  1 / 3

0 1/3 2 /3

2 / 3  2 / 3  0 

;

1 / 3  D =  0  1 / 2

2 /3 2 /5 0

0   3 /5  1/2

6. Una persona tiene constatado que si un día está resfriado está un 70% seguro de que no lo estará al día siguiente, pero si un cierto día no está resfriado tiene un 60% de probabilidad de no estar tampoco al día siguiente. A lo largo de los años, ¿con qué frecuencia estará resfriado?

7. Encontrar las distribuciones estacionarias correspondientes a las cadenas de Markov con las matrices de transición siguientes: 1 2 1 2 A =   3 4 1 4 1 / 2 1 / 4 1 / 4   B =  0 0 1    0  1 / 2 1 / 2  1 / 8 3 / 8 1 / 2   C =  0 1 / 2 1 / 2   0  3 /4 1/4 8. Un estudiante va al instituto andando o en autobús. Cuando va andando un día, la probabilidad de que al día siguiente coja el autobús es 0.6. La probabilidad de que vaya en autobús dos días seguidos es 0.7 ¿Aproximadamente con qué frecuencia coge el autobús a lo largo de todo el curso? 9. Escríbanse las siguientes matrices en forma canónica. Cuéntense los estados absorbentes y transitorios en cada caso y compruébese la división en submatrices del ejemplo anterior. 1   1  b )   1 1  1 c)    a)

/2 0 /4 0 /5 /7 /3 0 0

1 / 2  1  0 3 /4  1 0   2 /5 2 /5 2 / 7 3 / 7 1 / 7  2 /3 0 0  0 1 0   0 0 1 

SEMANA 16 DISTRIBUCION ESTACIONARIA Como se ha comprobado en este último ejemplo, hay ocasiones en que las distribuciones absolutas de la cadena parece que convergen, con el paso del tiempo, a una distribución particular, que no dependen del tiempo. ¿Cuándo ocurre esto? Cuando la matriz de transición P de un proceso de Markov es regular, observamos que conforme aumentan las potencias de P, los vectores fila de esas matrices se estabilizan en unos valores determinados hasta coincidir todas las filas y esos valores son precisamente los componentes del vector fijo de P. Entonces  P ( k ) = P ( 0) .P k ≅ v

Teorema: Consideremos una cadena de Markov regular. La probabilidad de que un estado Ai suceda después de un número grande de pruebas es igual a la componente i-ésima del vector fijo asociado. Por tanto las probabilidades absolutas (DISTRIBUCIÓN ESTACIONARIA DE LA CADENA DE MARKOV) de que ocurra un determinado estado son independientes de las condiciones iniciales del sistema. Ejemplo: Una central telefónica pude estar desocupada (estado 0), con una llamada (estado 1) o con una llamada y otra en espera (estado 2) y es observada cada minuto, siguiendo estas observaciones una cadena de Harkov homogénea con matriz de transición Estado 0 Estado 1 Estado 2 Estado 0 0 2/3 1/3 Estado 1 3/8 1/8 1/2 Estado 2 1/2 1/2 0 ¿Cómo se evaluaría la evolución de la central después de un tiempo suficientemente grande? Solución: Calculamos la distribución estacionaria: п = п . P Considerando además que: п0 + п1 + п2 = 1 Da como resultado: п1 = 0.2777 П1 = 0.4166 П2 = 0.3055 Ejercicios propuestos 1. Una persona sabe que si un día tiene indigestión está un 70% seguro de que no la tendrá al día siguiente, pero si un día no tiene indigestión, tiene un 60% de probabilidad de tampoco tenerla al día siguiente. a lo largo de los años, ¿con qué frecuencia estará con indigestión? Si calculas el vector fijo y las sucesivas potencias de P obtendrás que, aproximadamente el 36% de los días la persona estará con indigestión. 2. La región de ventas de un vendedor la componen tres ciudades A, B y C. Nunca vende en la misma ciudad en días seguidos. Si vende en la ciudad A, entonces al día siguiente vende en la ciudad B. Sin embargo, si vende en una de las dos B o C, entonces al día siguiente está en doble posibilidad tanto para vender en A como en la otra ciudad. A la larga con qué frecuencia (en %) vende en cada ciudad? Respuesta: 40% en A, 45% en B y 15% en C

3. Un agente comercial realiza su trabajo en tres ciudades gallegas: La Coruña, Ferrol y Santiago. Para evitar desplazamientos innecesarios está todo el día en la misma ciudad y duerme en ella, desplazándose a otra al día siguiente, si no tiene suficiente trabajo. Después de estar trabajando un día en La Coruña, la probabilidad de tener que seguir trabajando en ella al día siguiente es de 0.4, la de tener que viajar a Santiago es 0.4y la de tener que ir a Ferrol es de 0.2. si el viajante duerme un día en Santiago, con probabilidad del 20% tendrá que seguir trabajando en la misma ciudad al día siguiente, en el 60% de los casos viajará a La Coruña, mientras que irá a Ferrol con probabilidad 0.2. Por último, si el agente comercial trabaja todo un día en Ferrol, permanecerá en al misma ciudad, al día siguiente, con una probabilidad de 0.1, irá a Santiago con una probabilidad de 0.3 y a La Coruña con probabilidad 0.6. ¿Cuáles son los porcentajes de días en los que el agente comercial está en cada una de las tres ciudades? 4. Un estudio de audiencia demuestra que si una persona ve cierto culebrón de televisión una tarde está un 30% segura de que también lo verá a la tarde siguiente, pero se non lo ve una tarde hay un 60% de posibilidades de que no lo vea tampoco a la tarde siguiente. ¿Qué frecuencia de audiencia tendrá el culebrón?

CADENAS DE MARKOV ABSORVENTES Los estados que pueden sucederse a sí mismos y, además, es posible alcanzar, por lo menos, alguno de los restantes desde ellos se llaman estados transitorios. Un estado tal que si el proceso entra en él permanecerá indefinidamente en este estado (ya que las probabilidades de pasar a cualquiera de los otros son cero), se dice estado absorbente. De una cadena de Markov que consta de estados transitorios y absorbentes se dice que es una cadena absorbente de Markov. Si una cadena de Markov contiene algún estado absorbente, la línea de la matriz de transición correspondiente a las probabilidades de transición de dicho estado constará de un 1 en la diagonal principal y ceros en los demás elementos. Será por lo tanto una matriz no regular. Para poder estudiar las cadenas de Markov absorbentes es preciso reordenar la matriz de transición de forma que las filas correspondientes a los estados absorbentes aparezcan en primer lugar. Así ordenada se dirá que la matriz de transición está en la forma canónica.

Podemos dividir la matriz en forma canónica en cuatro submatrices. La primera es la matriz unidad I, del orden correspondiente. La segunda , la matriz nula. La tercera contiene las probabilidades de paso de estados transitorios a estados absorbentes. La cuarta contiene las probabilidades de estados transitorios a estados transitorios. Así se tiene que: Una cadena de Markov absorbente contiene p estados transitorios y q estados absorbentes. La matriz canónica del proceso presentará el aspecto siguiente:

 I O   Q M I: matriz identidad de dimensión q O: matriz nula de dimensión qxp Q: matriz de dimensión pxq que contiene las probabilidades de paso de estados transitorios a absorbentes. M: matriz pxp con las probabilidades de los estados transitorios a estados transitorios. Se llama matriz fundamental de la cadena a la matriz resultado de la operación: F=(I-M)-1 Teorema 5 Se verifica: 1. Supongamos que la cadena comienza en un estado transitorio ai. La probabilidad de que llegue a un estado absorbente aj, vienen dada por el elemento de la fila i y la columna j de la matriz F.Q. 2. La suma de los elementos de la fila i de la matriz F nos proporciona la media del número de veces que la cadena se mueve por estados transitorios antes de caer en un estado absorbente si empieza en el estado transitorio ai. 3. El elemento fij de la matriz F representa la media del número de veces que la cadena está en el estado transitorio aj, sabiendo que comenzó en el estado transitorio ai, antes de caer en un estado absorbente. Ejercicios propuestos

1. Escribe en la forma canónica las siguientes matrices, indicando el o los estados absorbentes y los transitorios. Observa el diagrama correspondiente y ayúdate de las escenas siguientes realizadas para matrices de orden 3

 2 / 3 0 1/ 3   1/ 4 0 3 / 4   2 / 3 0 1/ 3       0 1 0 ; 0 1 0 ; 0 1 0        0 2 / 5 3 / 5  1/ 5 2 / 5 2 / 5  3 / 5 2 / 5 0        Hay un caso más semejante al 4º y al 5º y un caso sin transiciones. Piénsalo. 2. Conteste a cada una de las siguientes preguntas la primera matriz del ejercicio1º) que has puesto antes en la forma canónica: a) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio necesitamos para alcanzar el estado a3? b) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio necesitamos para volver al mismo estado? c) Si el proceso empieza en el estado a1, ¿cuántos pasos por término medio se precisan para caer en uno de los estados absorbentes? d) ¿En qué estado debemos comenzar el proceso para que tarde más en ser absorbido.? e) Si el estado comienza en el estado a1, ¿será más probable que sea absorbido por el a2 o por el a3, en el caso de ser ambos absorbentes?.(matriz tercera) f) ¿Qué estado precisa más pasos del proceso por término medio antes de regresar otra vez a sí mismo? 3. Dos jugadores A y B tienen dos billetes cada uno. Juegan con una moneda a "cara y cruz" apostando un billete en cada lanzamiento hasta que uno de ellos se arruina. Calcular la probabilidad de que A gane después de 4 jugadas y el número medio de lanzamientos (antes de caer en estado absorbente (4), si se comenzó en el estado 2). Solución: Variable : nº de billetes de A. Espacio de estados E={ 0, 1, 2, 3, 4 } Inicialmente A tiene 2, B tiene 2.

Luego

P(0) = (0,0,1,0,0)

Escribe la matriz de transición de orden 4. Calcula P4 y luego P(4)=P(0) .P4, comprueba que da (3/8, 0, 2/8, 0, 3/8 ). Acaba la partida y gana A, tiene 4 y B tiene 0. La solución pedida es el último número (A tiene 4 billetes): 3/8 la probabilidad de que A gane después de 4 jugadas.

Para contestar la segunda parte, hay que utilizar la escena siguiente: Llamando A=I-M, calculamos F=A-1 Y sumar los números de la fila 2 de F (solución: 4 lanzamientos) 4. Indicar la interpretación de cada elemento de F (Ejemplo 1.5: número medio de veces que tiene 1 billete si partió con 1 billete, antes de terminar la partida) 5. Indicar la interpretación dede la suma de las filas de F. 6. Interpretar los elementos de F.Q. Por ejemplo 0.75 (primer elemento de esa matriz F.Q) representa la probabilidad de que llegue al estado absorbente 0 (quedarse sin dinero) si empezó con 1 billete (estado no absorbente). SEMANA 17 CADENAS DE MARKOV EN TIEMPO DISCRETO Un proceso estocástico es una cadena de Markov en tiempo discreto si cumple con las siguientes condiciones: 1. Los estados deben formar un conjunto numerable (caso contrario se hable de un proceso de Markov). 2. Si X(t) es el evento (en el instante t el sistema se encuentra en estado i) se debe cumplir: P {X(t) = i | X(t-1) = j, X(t-2) = k, ….} = P{X(t) = i | X(t-1) = j } 3. Si P {X(t) = i | X(t-1) = j} = P {X(1) = i | X(0) = j } para todo t, entonces se tiene una cadena de Markov en tiempo discreto homogénea. Ejemplo: Supongamos una máquina con dos componentes electrónicos que se inspeccionan cada hora. Un componente que está operativo en el instante n tiene una probabilidad p de fallar antes de la próxima revisión. Un componente que está en reparación en el instante n tiene una probabilidad r de estar operativo la próxima revisión. Se supone que las componentes fallan y se reparan independientemente unas de otras. Plantear la cadena de Markov en tiempo discreto que modela el número de componentes operativos. Solución: El tiempo toma valores 0,1,2,…. Y representa las sucesivas revisiones del equipo. El espacio de estados esta formado por 0,1, 2. La matriz de transición es:

0 1 2

0 (1 - r)2 p(1 - r) p2

1 2r(1-r) pr + (1 – p)(1 – r) 2p(1 – p)

1 r2 (1 – p)r (1 – p) 2

Habrá ocasiones en los que interese conocer la probabilidad de que la cadena esté ocupando el estado i en el instante n, independientemente de la posición en estados anteriores. Así, partiendo de

las

probabilidades

absolutas

se

tiene

que:

donde po nota la distribución inicial de la cadena. Ejemplo: Supóngase que el estado de una componente electrónica puede ser activa (A) o inactiva (I) y que la observación de dicha componente en sucesivos instantes fijos de tiempo (cada día) forma una cadena de Markov homogénea. Supóngase también que la matriz de transición es la siguiente: A I

A 0.7 0.6

I 0.8 0.4

A. Si un día concreto está inactiva, ¿cuál es la probabilidad de que también esté inactiva al día siguiente? Solución: 0.4 B. Si un día concreto está activa, ¿cuál es la probabilidad de que al día siguiente continúe activa? Solución: 0.7 C. Si un día concreto está inactiva, ¿cuál es la probabilidad de que al día siguiente esté activa? Solución: 0.6 D. Si un miércoles está activa, ¿cuál es la probabilidad de que el sábado esté activa? 0.667 0.666

0.333 0.334

Solución: Como P3 = la respuesta es 0.667

E. Si un miércoles está inactiva, ¿cuál es la probabilidad de que el sábado este activa? Solución: 0.666 Supóngase que la probabilidad de que un miércoles esté activa es 0.2 y que la probabilidad que esté inactiva es 0.8: (Es decir, p(0) = (0.2, 0.8) ) F. Determínese la probabilidad de que esté inactiva el jueves p(1) = p(0) P = (0.62, 0.38) entonces la respuesta es 0.38 G. Determínese la probabilidad de que esté inactiva el viernes Como p(2) = p(0) P(2) = (0.662, 0.338),

la respuesta es 0.338

H. Determínese la probabilidad de que esté inactiva el sábado

Dado que p(3) = p(0) P3 = (0.6662, 0.3338),

esta probabilidad es 0.3338

CADENAS DE MARKOV EN TIEMPO CONTINUO Se etiquetan los estados posibles del sistema 0,1,…,M. Se comienza en 0, y t≥ 0. Sea la v.a.X(t´) el estado del sistema en t´. Tomará un valor en 0≤ t´0. P{X(s+t)=j/X(s)=i} es una probabilidad de transición. Si es independiente de s, se llamará probabilidad de transición estacionaria. Un proceso estocástico de tiempo continuo {X(t); t≥ 0} es una cadena de Markov de tiempo continuo si tiene la propiedad markoviana. SEMANA 18 TEORIA ERGÓDICA DE CADENAS DE MARKOV En matemáticas, un shift o transformación que preserva la medida T en un espacio de probabilidad, se dice que es ergódico si un conjunto medible que es invariante bajo T, tiene medida 0 ó 1. Un antiguo término para esta propiedad era métricamente transitivo.

Definición de ergódico Considere el promedio en el tiempo de una función f de "buen comportamiento"(well-behaved). Esta se define como el promedio (si existe) sobre iteraciones de T empezando en algún punto inicial x0:

Considere también el promedio en el espacio de f, que se define como:

Donde μ es una medida en el espacio de probabilidad. En general, el promedio en el tiempo y el promedio en el espacio no son necesariamente iguales. Pero si la transformación es ergódica, y la medida es invariante, entonces el promedio en el tiempo es igual al promedio en el espacio excepto quizá para un conjunto de medida 0. Éste es el famoso Teorema ergódico en forma abstracta, elaborado por George David Birkhoff. El Teorema de Weyl

es un caso especial del Teorema ergódico, que se basa en la distribución de probabilidad en el intervalo unitario [0,1]. ERGODICIDAD La ergodicidad es una propiedad muy importante de algunos sistemas mecánicos que permite justificar ciertos resultados de la mecánica estadística. Un sistema es ergódico si los únicos conjuntos invariantes de medida no nula de la hipersuperficie de energía constante del espacio de las fases es toda la hipersuperficie de energía constante. Ergodicidad y teorema ergódico de Birkhoff En los sistemas ergódicos es válido el teorema de Birkhoff que permite sustituir promedios temporales del sistemas por un promedio espacial sobre una región del espacio de las fases. El enunciado del teorema ergódico, debido a Birkhoff (1931). Sea

una transformación que preserva la medida en un espacio de medida

(X,Σ,μ). Uno puede considerar el "promedio temporal" de una función f suficientemente bien comportada (más precisamente,

). Este "promedio temporal" se define como la medida

sobre las iteraciones de T empezando en cierto punto x y cuando existe es:

Si se considera además el "promedio espacial" de f, definido como:

donde μ es la medida de probabilidad del espacio. Ecuaciones de Chapman-Kolmogorov Si Pij (n) es la probabilidad condicional de que la variable aleatoria X, comenzando con el estado i se encuentre en el estado j después de n pasos, entonces, las ecuaciones de Chapman-Kolmogorov proporcionan un método para calcular estas probabilidades de transición en n pasos.