Fase 3 - Grupo 1

ESTADISTICA DESCRIPTIVA UNIDAD 2: FASE 3 – DISTRIBUCIÓN Y PROBABILIDAD LAURA MELISSA BACCA DOUSDEBES 1.119.894.286 DAN

Views 179 Downloads 15 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADISTICA DESCRIPTIVA

UNIDAD 2: FASE 3 – DISTRIBUCIÓN Y PROBABILIDAD

LAURA MELISSA BACCA DOUSDEBES 1.119.894.286 DANNA NATHALY AVILA CASALLAS 1.007.702.259 JORGE LUIS ACERO RUEDA

1.070.959.147

WUYLMERT HELADIO SEGURA PINEDA 1.013.664.012

LUIS ALBERTO CACERES TORRES

UNIVERSIDAD ABIERTA Y A DISTANCIA UNAD OCTUBRE 2020 FACATATIVA

Introducción En el presente trabajo abordaremos temas de distribución y probabilidad en donde se representaran resultados de manera gráfica de experimentos aleatorios de azar definiendo y aplicando conceptos básico y de esta forma validar la posibilidad de la ocurrencia de los posibles resultados que ya se tenían contemplados en el experimento, de igual manera se realizaran análisis rápidos en base a las gráficas obtenidas desde el software "Programa R" siguiendo las indicaciones propuestas por el tutor y fortaleciendo conocimientos que se han venido aprendiendo durante el desarrollo del curso estadística descriptiva (para agrarias).

A. Que es el espacio muestral, con qué letra se denota. El espacio muestral se conoce como el conjunto de todos los resultados posibles al realizar un experimento aleatorio, algo particular es que se puede realizar los experimentos las veces que sean necesarias bajo las mismas condiciones siempre sabiendo el conjunto de posibles resultados. Se denota con la letra E, S o Ω  B. Que es el punto muestral. Los puntos muestrales se conocen como todos los posibles elementos que se encuentran en el espacio muestral de un experimento aleatorio C. Que es un evento muestral. Es un subconjunto del espacio muestral, es decir uno o varios elementos dentro del experimento aleatorio. D. Que es una variable aleatoria Una variable aleatoria es una función real medibles que asocia un valor numérico a cada resultado del espacio muestral el cual está asociado a un experimento aleatorio, algo interesante de la variable aleatoria es que permite aplicar análisis matemáticos a situaciones con incertidumbre

E. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no contable? Los espacios muestrales se han dividido en dos categorías que son: Espacio muestral discreto y el Espacio muestral continuo. En el Espacio muestral discreto hay un número determinado de opciones conocidas, por ejemplo: 6 caras en un dado. No es posible obtener más de seis posibilidades. Están limitadas, ya que estamos dentro de x número de opciones. En cambio, el Espacio muestral continuo es

cuando la variabilidad obtenida es continua y no podemos deducirla. Se desconoce la variabilidad que vamos a tener, no suele ser muy exacta, porque depende del instrumento utilizado y el juicio del espectador. Esto quiere decir que los datos que tengamos generalmente estarán sujetos de error. [ CITATION Gar14 \l 3082 ] F. ¿Qué son variables aleatorias discretas proporcionales y que son variables aleatorias discretas de conteo no acotado? De ejemplos de este tipo de variables. Las variables aleatorias discretas proporcionales son un numero finito o lo más numerable de valores. Por ejemplo, el número exacto de una cantidad en una manada de caballos. Las variables aleatorias discretas de conteo no acotado es cuando la variable solo es capaz de poder adquirir un numero finito de valores dentro de un intervalo, lo que quiere decir que es aleatoria discreta. Por ejemplo, el número de semillas germinadas en las cajas de Petri con 25 semillas cada caja. Los resultados se expresarían como proporciones porque existe un denominador natural. [ CITATION Gar14 \l 3082 ] G. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina cada uno. La probabilidad clásica es el número de resultados favorables a la presentación de un evento dividido entre el número total de resultados posibles. Se aplica cuando cada evento simple del espacio muestral tiene la misma probabilidad de ocurrir. La probabilidad frecuencial hace referencia a la probabilidad entendida como el cociente entre el número de casos favorables y el número de casos posibles, cuando número de casos tiende a infinito. [ CITATION Jos1 \l 3082 ] H. En el caso de la probabilidad frecuencial, explique el experimento de germinación de una semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos muestrales tiene. Entonces la probabilidad de que germine una semilla es de 50%

El evento es que A=germine la semilla o B=la semilla no germina Y como resultado A=Obtienes una planta o B=No obtienes nada El punto muestral es una semilla.[ CITATION Jos1 \l 3082 ][ CITATION Gar14 \l 3082 ] I. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad? La frecuencia relativa se calcula con el cociente de la frecuencia absoluta de algún valor de la población o la muestra, entre el total de valores que compone la población o la muestra. La frecuencia de probabilidad hace referencia a la definición de probabilidad entendida como el cociente entre el número de casos favorables y el número de casos posibles, cuando el número de casos tiende a infinito. J.

¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos eventos mutualmente excluyentes? ¿Si son excluyentes, dado un evento A y uno B, a que es igual la P (AUB)?

Los eventos mutualmente excluyentes se dan cuando dos o más eventos no pueden suceder al mismo tiempo, y la suma de sus probabilidades individuales es la probabilidad de que el evento ocurra. La probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacío por lo tanto no hay que restarle nada). K. En el caso de distribuciones de variables aleatorias, si una variable es continua y simétrica, ¿Qué modelo se usa? Dada una variable aleatoria continua X, definida en el intervalo [a, b] de la recta real, diremos que X tiene una distribución uniforme en el intervalo [a, b] cuando su función de densidad sea X~U ([a, b]) f (x) = 1/(b-a) para x E [a, b]

Una variable aleatoria X o, equivalentemente, su distribución es simétrica alrededor de un

punto

a Er

P (X ≤ α + x) = P (X ≥ α − x), ∀x ∈ R. Para una variable de conteo no acotado ¿Qué modelo se utiliza? Variables de interés: Y ∈ {0, 1, 2, . . .}, se debe analizar Y como función de variables explicativa: E (Y |X1, X2, . . ., Xk) M. Para una variable de conteo no acotado, ¿qué modelo se utiliza? Para una variable de conteo no acotado el modelo usado es el modelo de distribución binomial en el cual se determina la probabilidad de éxito constante Los resultados de cada realización del experimento se clasifican en dos categorías probabilidad de éxito, y otra la de fracaso. N. Para variables de proporciones ¿qué modelo se utiliza? Para la variable de proporciones el modelo que se utiliza es de distribución de pisson debido a que este modelo se emplea para describir varios procesos, y asume valores enteros fácilmente notables, esta distribución nos muestra la probabilidad de que ocurra un determinado suceso en número de veces K en un intervalo determinado de tiempo, longitud, área y demás. O. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de densidad? VARIABLES CON FUNCION DE PROBABILIDAD Distribución binomial Distribución de poisson VARIABLES CON FUNCION DE DENSIDAD Distribución uniforme continua

Distribución normal tipificada o estandarizada Distribución Chi-cuadrado de Pearson Distribución t-Student Distribución F-Snedecor P. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar funciones de distribución de variables aleatorias? PARAMETROS DE DISTRIBUCION DE VARIABLES ALEATORIAS Media Probabilística Aritmética Geométrica Armónica Cortada Mediana Moda Q. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se denota? La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio. Dicho de otra forma, es el valor medio de un conjunto de datos. Esto, teniendo en cuenta que el término esperanza matemática está acuñado por la teoría de la probabilidad. Mientras que, en matemáticas, se denomina media matemática al valor promedio de un suceso que ha ocurrido. En distribuciones discretas con la misma probabilidad en cada suceso, la media aritmética es igual que la esperanza matemática.



Abra “Código Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes

preguntas: a) Explique en sus propias palabras el experimento aleatorio del dado. El experimento aleatorio del dado nos dice que de dos dados pueden tener 36 posibles resultados ya que al combinar cada uno con los demás van arrojando diferentes opciones así que al realizar varios lanzamientos no se sabrá cual será el resultado, pero si se sabe el conjunto de todos los resultados posibles y la probabilidad del mismo. b) Adjunte en el informe los tres gráficos generados por el código

Frecuencias relativas acumuladas

0.6 0.4 0.2 0.0

Frecuencias relativas

0.8

1.0

PERIODO 764 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS

2

3

4

5

6

7

8

9

10

11

12

En la gráfica que Frecuencia relativa acumulado se puede observar que la probabilidad al sumar las dos caras es del 0.027 y este a su vez al ir realizando más experimentos aleatorios y

sumando las caras nos va arrojando la probabilidad que hay de obtener un mayor resultado sin salirse del rango de resultados del experimento.

Frecuencias Absolutas

4 3 2 0

1

Frecuencias absolutas

5

6

PERIODO 764 - Gráfico de barras SUMA DE CARAS

2

3

4

5

6

7

8

9

10

11

12

En la gráfica de frecuencia absoluta de la suma de caras podemos observar la cantidad de veces que se repite el número de pruebas aleatorias al arrojar los dados y así obteniendo el mismo resultado en varias ocasiones.

Frecuencias relativas

0.10 0.05 0.00

Frecuencias relativas

0.15

0.20

PERIODO 764 - FRECUENCIAS RELATIVAS SUMA DE CARAS

2

3

4

5

6

7

8

9

10

11

En esta grafica podemos observar la frecuencia relativa de la suma de caras al realizar el experimento aleatorio en donde los valores que se observan el eje x el resultado de la barra que indica el numero 7 tiene mayor número de veces de arrojar el resultado según los valores del eje y.

12

"Producción de leche - Función de Distribución N (misma varianza, distinta media)

0.00

0.02

0.04

0.06

F(x)

0.08

0.10

0.12

ERIODO 764 - Producción de leche Función de Distribución N (misma varianza, distinta

10

15

20

25

30

35

40

Producción de leche (litros/día) En esta grafica nos indica como la frecuencia relativa para la producción de leche, se representa con una frecuencia de 0.12 en el valor del eje x, por cada 25Lt (litros) de leche en los valores del eje y. "Producción de leche - Función de Distribución N (misma media, distinta varianza"

0.2 0.1 0.0

F(x)

0.3

0.4

PERIODO 764 - Producción de leche Función de Distribución N (misma media, distinta varianza

10

15

20

25 Producción de leche (litros/día)

30

35

40

A diferencia de la primera frecuencia, en el período 764 muestra que se producen 25 litros en los valores del el eje y, en una frecuencia de 0,1 en los valores del eje x. Rendimiento de maíz - Función de Distribución N(media.sigma)

0.03 0.00

0.01

0.02

F(x)

0.04

0.05

PERIODO 764 - Rendimiento de maíz Distribución Normal con área bajo la curva

20

40

60

80

100

Rendimiento (qq/Ha) En esta grafica se puede apreciar la función de distribución del maíz se ve la dinámica y los valores alcanzados en cada una de las variables de siembra, se obtuvo un crecimiento acelerado dentro de la variable de 20 a 100 de rendimiento, se encuentra entre 50 a 80 unidades de rendimiento, teniendo un tope de frecuencia de 0.05.

"Distribución Binomial Germinación de semillas\n(n=10,p=0.25)"

0.20 0.15 0.10 0.00

0.05

Probabilidad del evento

0.25

PERIODO 764 - Distribución Binomial - Germinación de semillas (n=10,p=0.25)

0

1

2

3

4

5

6

7

8

9

10

Evento (germinación de x semillas) Encontramos en la gráfica de distribución binomial de germinación de semillas (n..10,p..0.25) un modelo de probabilidad discreto en donde se evidencia la probabilidad de que suceda la germinación y el evento que es la plantación de las semillas, encontrando en el evento #2 el más alto nivel de frecuencia obteniendo una probabilidad después de 0.25 niveles de probabilidad .

14. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de Mónica Balzarini y responda las siguientes preguntas:

a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico para una variable aleatoria continua cuando se tienen datos de esa variable. Variable Discreta Un modelo probabilístico de un experimento requiere asociar un valor de probabilidad a cada punto del espacio muestral. En el caso de las variables aleatorias discretas, la función que asocia una probabilidad a la variable se denomina función de probabilidad de masa (fpm), y se designa por px(x0 ) . Esta función representa la probabilidad que la variable aleatoria X tome el valor x0 en la realización del experimento. Usualmente, la función de probabilidad de masa se representa por un gráfico de barras para cada valor de la variable aleatoria. El concepto de función probabilidad de masa puede extenderse al caso de varias variables. En especial, para dos variables, se define la función de probabilidad de masa compuesta, como la probabilidad que los valores experimentales de la variable aleatoria X e Y, al realizar un experimento sean iguales a x0 e y0 respectivamente y se designa por pXY (x0 , y0 ). Análogamente al caso anterior, esta función tiene las siguientes propiedades:

Variable Continua La probabilidad asociada a una variable continua, está representada por la función densidad de probabilidades (fdp). Si X es una variable aleatoria continua en el rango -∞ a + ∞ se define:

Siendo fx (x) = la función densidad de probabilidades.

b. Qué es la estandarización, cuál es su fórmula. La estandarización es el proceso de ajustar o adaptar características en un producto, servicio o procedimiento; con el objetivo de que éstos se asemejen a un tipo, modelo o norma en común. Hay un procedimiento que funciona como una especia de bala de plata para todos estos casos: estandarizar. Lo que hacemos es transformar la variable original, restándole a cada valor la media y dividiendo esto entre la desviación típica. Formalmente, dada una muestra x1,x2,...,xn, calculamos:

Zi =

xi−X Sx

Usualmente en la literatura nos dirán que esta nueva variable Z no tiene unidades, y esto es cierto. Sin embargo, una manera de interpretar los valores zi es pensar que está expresada en desviaciones típicas. Efectivamente, si z1=1, esto significa que xi está una desviación típica por encima de la media. Por ejemplo, si xi=20, la media X¯=15 y la desviación típica Sx=5SX=5, zi = (20−15) / 5=1, y como podemos ver, xi está una desviación típica por encima de la media. c. Qué tipo de conteos se trabajan con la distribución Binomial. Una distribución binomial es una distribución de probabilidad discreta en donde se descubre el numero e éxito al realizar n experimentos independientes entre sí, acerca de una variable aleatoria.

d. En la distribución binomial qué es n y qué es P. n    = Número de ensayos/experimentos

x    = Número de éxitos p    = Probabilidad de éxito q    = Probabilidad de fracaso (1-p e. A qué es igual la esperanza y la varianza en la distribución binomial. Media En una distribución binomial, la media nos indica el valor medio de un fenómeno aleatorio. Se calcula con la siguiente fórmula:

Donde: n es el número de ensayos p es la probabilidad de éxito Varianza Es una medida de dispersión que nos indica qué tan lejos se encuentran los cuadrados de la desviación de la media. Se calcula con la fórmula

Donde: n es el número de ensayos p es la probabilidad de éxito q es la probabilidad de fracaso f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución Binomial. Muestra Generalmente es imposible o impracticable examinar alguna característica en la población entera, por lo que se examina una parte de ella y en base a la información relevada en esa porción se hacen inferencias sobre toda la población. Variables

Las observaciones o mediciones sobre los elementos de una población constituyen la materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser tratadas estadísticamente deben estar expresadas o poder ser reexpresadas en términos numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el mismo valor en cada uno de los elementos que la conforman. Aquellas características que van cambiando en su estado o expresión entre los elementos de la población se denominan "variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes". A modo ilustrativo se presentan algunos ejemplos de notación con subíndices: a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y x6, no interesando otros si existieran. b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito. c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito. Tipos de variables Se llamará variable continua a aquella característica cuyas observaciones pueden asumir cualquier valor dentro de un intervalo. En estos casos el conjunto de posibles valores es no numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los resultados de la variable. Se puede describir el conjunto de posibles valores de una variable continua de distintas formas. Se suele seguir la siguiente convención: a) Un intervalo es cerrado si sus extremos pertenecen al mismo, lo que se denotará con corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b. b) Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotará con paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b.

c) Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b] denota al conjunto de todos los x tal que a< b}. g. Qué tipos de conteos se trabajan con la distribución de Poisson.

Función de cuantía A partir de las hipótesis del proceso, se obtiene una ecuación diferencial de definición del mismo que puede integrarse con facilidad para obtener la función de cuantía de la variable "número de hechos que ocurren en un intervalo unitario de tiempo o espacio

 Que sería :         

 

 La función de distribución vendrá dada por : 

Función Generatriz de Momentos

           Su expresión será :           

                                          

                             dado que 

 tendremos que   

                                                       luego :       Para la obtención de la media y la varianza aplicaríamos la F.G.M.; derivándola sucesivamente e igualando t a cero . Así.

                                                                                   Una vez obtenida la media, obtendríamos la varianza en base a :                                                                           

                                                                       

                                                           haciendo t = 0                                                                                                                                                     por lo que 

=

                                         así se observa que media y varianza coinciden con el parámetro del modelo siendo, l     En cuanto a la moda del modelo tendremos que será el valor de la variable que tenga mayor probabilidad , por tanto si Mo es el valor modal se cumplirá que : 

                           Y, en particular:      A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene que verificar:   De manera que la moda será la parte entera del parámetro l o dicho de otra forma, la parte entera de la media     Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una amplitud de una unidad, de manera que la única posibilidad de que una distribución tenga dos modas será que los extremos de este intervalo sean números naturales, o lo que es lo mismo que el parámetro l sea entero, en cuyo caso las dos modas serán l -1 y l. Teorema de adición. La distribución de Poisson verifica el teorema de adición para el parámetro l. "La variable suma de dos o más variables independientes que tengan una distribución de Poisson de distintos parámetros l (de distintas medias) se distribuirá, también con una distribución de Poisson con parámetro l la suma de los parámetros l (con media, la suma de las medias):

En efecto: Sean x e y dos variables aleatorias que se distribuyen con dos distribuciones de Poisson de distintos parámetros siendo además x e independientes Así 

 e 

        Debemos probar que la variable Z= x+y seguirá una Poisson con parámetro igual a la suma de los de ambas:              

                       En base a las F.G.M para X     

                                                            Para Y   De manera que la función generatriz de momentos de Z será el producto de ambas ya que son independientes : 

             Siendo      

              la F.G.M de una Poisson 

  Convergencia de la distribución binomial a la Poisson     Se puede probar que la distribución binomial tiende a converger a la distribución de Poisson cuando el parámetro n tiende a infinito y el parámetro p tiende a ser cero, de manera que el producto de n por p sea una cantidad constante. De ocurrir esto la distribución binomial tiende a un modelo de Poisson de parámetro l igual a n por p Este resultado es importante a la hora del cálculo de probabilidades , o , incluso a la hora de inferir características de la distribución binomial cuando el número de pruebas sea muy grande  la probabilidad de éxito sea muy pequeña 

 y

.

        El resultado se prueba , comprobando como la función de cuantía de una distribución binomial con  con 



 tiende a una función de cuantía de una distribución de Poisson

  siempre que este producto sea una cantidad constante ( un valor finito)

                En efecto : la función de cuantía de la binomial es 

                Y llamamos 

 tendremos que:

                                    

                                    

                realizando  Poisson

 que es la función de cuantía de una distribución de

  Estimación Bayesiana sobre muestras de poisson.     Análogamente a como planteábamos el problema de necesitar estimar la proporción de una característica, en el caso de un modelo binomial, en alguna situación práctica, podemos estar interesados en determinar el parámetro desconocido de una distribución de Poisson. Por ejemplo, podríamos estar interesados en determinar el número medio de clientes que acuden a una ventanilla de una oficina pública.     El planteamiento de la estimación podría hacerse utilizando información suministrada por una experiencia {las observaciones de cuántos hechos se producen en un intervalo experimental), conjuntamente con algún otro tipo de información a priori. En este caso, estaríamos, como ya comentábamos en el caso binomial ante un planteamiento bayesiano del problema.     La solución requerirá que dispongamos de una información inicial que puede especificarse a través de una distribución a priori de probabilidad. De manera que la función de cuantía de esta distribución a priori (o su f. de densidad si fuera continua) nos asigne probabilidades a cada posible valor del parámetro l. Utilizando únicamente la información inicial la estimación sería la media de la distribución a priori.     Pero realizando una experiencia podremos mejorar la información acerca de l Si observamos la realización de hechos durante un intervalo experimental y se producen x hechos, para cada posible valor de l podremos calcular su verosimilitud definida como la probabilidad de que se dé ese resultado si el valor de l es el considerado:

    Obviamente esta probabilidad condicionada será la función de cuantía de una distribución de Poisson con 

 . para el valor de la variable x.

    Finalmente podemos calcular las probabilidades de cada valor alternativo de, condicionada al resultado de la experiencia aplicando el teorema de bayes:

    Estas probabilidades finales (a posteriori) constituirán la función de cuantía de la distribución a posteriori que nos dará cuenta de toda la información disponible (tanto muestral como no muestral) .     La estimación mejorada del parámetro será, entonces, la media de la distribución a posteriori. Planteamos un ejemplo:     Tres ejecutivos del Insalud opinan que el número medio de pacientes que llegan a cierto servicio nocturno de guardia durante una hora es 2, según el primero, 3, según el segundo, y 5 según el tercero.     Sus opiniones pueden ponderarse teniendo en cuenta que el primero tiene el doble de experiencia profesional que los otros dos.     Para tomar una decisión de asignación de personal en ese servicio quieren estimar el número medio de pacientes, sin despreciar sus opiniones, por lo que realiza una experiencia controlando una hora de actividad en el servicio en la que acuden 3 pacientes. Esta información la van a combinar con la inicial a través de un proceso Bayesiano.

h. Cómo se denota el único parámetro de la distribución de Poisson. La función de masa de probabilidad de la distribución de Poisson es

donde k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces).  λ es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.  e es la base de los logaritmos naturales (e = 2,71828…) La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parámetro λ0 a 

otra de parámetro λ es

i. ¿A qué es igual la media y la varianza en la distribución de Poisson? Media y varianza de la distribución de Poisson X ∼ P(λ) ⇒ E[X] = Var[X] = λ Calculo directo Calculo directo En primer lugar, obtenemos la expresión de E[X].

Calculo directo En primer lugar, obtenemos la expresión de E[X]

Calculo directo En primer lugar, obtenemos la expresión de E[X].

Calculo directo En primer lugar, obtenemos la expresión de E[X].

Calculo directo En primer lugar, obtenemos la expresión de E[X].

donde la ´ultima igualdad se obtiene teniendo en cuenta que e −λ λ y y! , y = 0, 1, . . . , es la función masa de probabilidad de una variable P(λ), por lo que la suma de esos valores es la unidad.

j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de Poisson. Variables Las observaciones o mediciones sobre los elementos de una población constituyen la materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser tratadas estadísticamente deben estar expresadas o poder ser reexpresadas en términos numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el mismo valor en cada uno de los elementos que la conforman. Aquellas características que van cambiando en su estado o expresión entre los elementos de la población se denominan "variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes". A modo ilustrativo se presentan algunos ejemplos de notación con subíndices: a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y x6, no interesando otros si existieran. b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito. c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito. Tipos de variables Se llamará variable continua a aquella característica cuyas observaciones pueden asumir cualquier valor dentro de un intervalo. En estos casos el conjunto de posibles valores es no numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los resultados de la variable. Se puede describir el conjunto de posibles valores de una variable continua de distintas formas. Se suele seguir la siguiente convención: a) Un intervalo es cerrado si sus extremos pertenecen al mismo, lo que se denotará con corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b.

b) Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotará con paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b. c) Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b] denota al conjunto de todos los x tal que a< b}.

Conclusiones En este trabajo se analizaron e identificaron los diferentes conceptos básicos en cuanto a probabilidad y distribuciones de probabilidad, que suelen ser las más usadas en el campo de las ciencias agrarias. Presentamos resultados de manera gráfica frente a experimentos aleatorios, aplicando los conceptos básicos ya explicados y así mismo poder validar la posibilidad de los resultados que se tienen contemplados en el experimento. Se realizaron análisis breves en cuanto a las gráficas que se obtuvieron desde el software “Programa R” siguiendo las indicaciones regidas por el tutor, también fortaleciendo los conocimientos que se han ido conociendo y aprendiendo durante este curso de Estadística Descriptiva (para agrarias).

Bibliografía García, P. A. (2014). Obtenido de https://elibronet.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802 JoséFranciscoLópez. (s.f.). Economipedia . Obtenido de https://economipedia.com/definiciones/probabilidad-frecuencial.html

Balzarini, M. (15 de Marzo de 2012). Estadística y Biometría. Obtenido de http://www.agro.unc.edu.ar/~mcia/archivos/Estadistica%20y%20Biometria.pdf Di Rienzo, J. A. (20 de Marzo de 2005). Estadística para las Ciencias Agropecuarias. Obtenido de https://aulavirtual.agro.unlp.edu.ar/pluginfile.php/2968/mod_resource/content/0/Estad istica_para_las_Ciencias_Agropecuarias_-_Di_Rienzo.pdf

Resultados obtenidos en el programa R

Código DADO R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out" Copyright (C) 2020 The R Foundation for Statistical Computing Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA. Usted puede redistribuirlo bajo ciertas circunstancias. Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes. Escriba 'contributors()' para obtener más información y 'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda, o 'help.start()' para abrir el sistema de ayuda HTML con su navegador. Escriba 'q()' para salir de R.

> # EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 764 > > # Hay 36 posibles resultados, que da de combinar cada número con los demás

> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis posibles opciones del segundo dado (1,2,3,4,5,6) > # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que puede haber con el segundo y así sucesivamente, > # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a continuación: > #(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), > #(2,1), (2,2), (2,3), (2,4), (2,5), (2,6), > #(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), > #(4,1), (4,2), (4,3), (4,4), (4,5), (4,6), > #(5,1), (5,2), (5,3), (5,4), (5,5), (5,6), > #(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} > > # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO ESTE ES EL ESPACIO MUESTRAL > # La probabilidad siempre tendrá denominador 36 (x/36) > # PUNTOS MUESTRALES = 36 > # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del dado) > # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2 4,4 6,6) > # Otro evento puede ser sacar dos números iguales, en donde se tendrían los siguientes posibles resultados: > # POSIBLE RESULTADOS: (1,1),(2,2),(3,3),(4,4),(5,5),(6,6) > # En este caso habrían 6 resultados de éxito de los 36 posibles del espacio muestral.

> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O 16,6% en términos porcentuales > > # VARIABLE ALEATORIA Y = SUMA DE VALORES > # Es otra forma de presentar los 36 posibles eventos del espacio muestral, en donde se suman los valores obtenidos en cada dado: > > #(2), (3), (4), (5), (6), (7), > #(3), (4), (5), (6), (7), (8), > #(4), (5), (6), (7), (8), (9), > #(5), (6), (7), (8), (9), (10), > #(6), (7), (8), (9), (10), (11), > #(7), (8), (9), (10), (11), (12) > > # De esta forma se puede procesar su análisis en el programa R > >

PROCESAMIENTO EN R

Error: unexpected symbol in "

PROCESAMIENTO EN"

> > # Creamos el vector con los datos sumando los valores de cada dado, como se indicó anteriormente > # EJEMPLO: > # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6) > # Sumando quedará: 2, 3, 4, 5, 6, 7 y así sucesivamente hasta llegar al último evento (6,6):

> > SUMADADOS=c(2, 3, 4, 5, 6, 7, + 3, 4, 5, 6, 7, 8, + 4, 5, 6, 7, 8, 9, + 5, 6, 7, 8, 9, 10, + 6, 7, 8, 9, 10, 11, + 7, 8, 9, 10, 11, 12) > > # TABLAS DE FRECUENCIAS PARA LA VARIABLE DISCRETA "SUMADADOS": > > # En este caso las tabla de frecuencias se desarrollan por pasos: > > table(SUMADADOS)

# Tabla de frecuencias absolutas

SUMADADOS 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 5 4 3 2 1 > fabs=table(SUMADADOS)

# Asignación al comando de Tabla de frecuencias

absolutas el nombre: "fabs" > fabs SUMADADOS 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 5 4 3 2 1 > fabsacum fabsacum

# Frecuencias absolutas acumuladas

2 3 4 5 6 7 8 9 10 11 12 1 3 6 10 15 21 26 30 33 35 36 > frel=prop.table(table(SUMADADOS))

# Asignación al comando de Tabla de

frecuencias relativas el nombre: "frel" > frel

# Tabla de frecuencias relativas

SUMADADOS 2

3

4

5

6

7

8

0.02777778 0.05555556 0.08333333 0.11111111 0.13888889 0.16666667 0.13888889 9

10

11

12

0.11111111 0.08333333 0.05555556 0.02777778 > # Podemos decir entonces que la probabilidad que la suma de las dos caras sea igual a 2 es del 0.027 o 2.7% en términos porcentuales. > # Las probabilidades se multiplican por 100 para expresarlas en porcentaje. > > frelacum frelacum 2

3

4

5

6

7

8

0.02777778 0.08333333 0.16666667 0.27777778 0.41666667 0.58333333 0.72222222 9

10

11

12

0.83333333 0.91666667 0.97222222 1.00000000 > # En este caso, la probabilidad de obtener un valor mayor o igual a 2 pero menor de 4 es de 0.083 o 8.3% > # es lo mismo que sumar la probabilidad de obtener un valor de 2 (0.027) y de 3 (0.055) = 0.083 >

> # GRAFICOS DE FRECUENCIAS: > > barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 - Gráfico de barras SUMA DE CARAS")

# Gráfico de Frecuencias absolutas

> Codigo Modelos

R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out" Copyright (C) 2020 The R Foundation for Statistical Computing Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA. Usted puede redistribuirlo bajo ciertas circunstancias. Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes. Escriba 'contributors()' para obtener más información y 'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda, o 'help.start()' para abrir el sistema de ayuda HTML con su navegador. Escriba 'q()' para salir de R.

> >

# MODELOS DE DISTRIBUCIONES - PERIODO 764

> # DISTRIBUCION NORMAL > # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría de Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 91 > # La producción de leche diaria de las vacas de un tambo se distribuye como el modelo normal, con esperanza 25 litros (que es la misma media) y varianza de 9 litros al cuadrado: > MEDIA=25 > VARIANZA=9 > # A las vacas se les da una nueva ración que aumenta su producción en 5 litros, pero no cambia la varianza, ya que son los mismos animales: > MEDIA2=30 > SIGMA=sqrt(VARIANZA) > x=seq(15,40,by=0.5)

#secuencia de valores en un un rango de producción de leche de

15 a 40 litros > dnorm(x,MEDIA,SIGMA) [1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03 [6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02 [11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02 [16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01 [21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01 [26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02 [31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03 [36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04 [41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05 [46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06

[51] 4.955732e-07 > > # Gráfico de distribución normal con media = 25 y varianza = 9 > # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente gráfico (continúe ejecutando el código) > # Cuando aparezca el gráfico, seleccione nuevamente el código de ejecución (Editor R) ubicando el cursor en el MARCO AZUL, donde aparece el nombre del código > # De esta forma, mantendrá el orden de ejecución dentro del código: > > curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2, +

xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -

Producción de leche Función de Distribución N (misma varianza, distinta media") > # se puede observar que cambia la ubicación de la media (esperanza), pero la forma de ambas gráficas es la misma porque no cambió la varianza > > # Ahora se realiza el mismo procedimiento pero en este caso no cambia la media (esperanza) sino las varianzas: > > MEDIA=25 > VARIANZA=9 > VARIANZA1=2 > SIGMA=sqrt(VARIANZA) > SIGMA1=sqrt(VARIANZA1) > x=seq(15,40,by=0.5) > dnorm(x,MEDIA,SIGMA)

[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03 [6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02 [11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02 [16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01 [21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01 [26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02 [31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03 [36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04 [41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05 [46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06 [51] 4.955732e-07 > > # Gráfico de distribución normal con media = 25 y varianza = 9 > # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente gráfico (continúe ejecutando el código) > > curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=2, +

xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -

Producción de leche Función de Distribución N (misma media, distinta varianza") > > # Gráfico de distribución normal con media = 25 y varianza = 2 > # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color azul, en la misma gráfica: > > curve(dnorm(x,MEDIA,SIGMA1),xlim=c(10,40), add=TRUE, col="red", lwd=2)

> > # En este caso ambas gráficas tienen la misma media (o esperanza) pero sus formas cambiaron porque tienen distinta varianza > # A mayor varianza, la gráfica tendrá mayor amplitud > > # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 93 > > # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con una distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha: > media= 60 > varianza= 49 > sigma=sqrt(varianza) > sigma [1] 7 > X=seq(35,85,by=0.5)

# Secuencia de valores en un un rango de 35 a 85 qq/Ha

> dnorm(X,media,sigma) [1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-04 [6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-04 [11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-03 [16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-03 [21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-02 [26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-02 [31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-02 [36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-02

[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-02 [46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-02 [51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-02 [56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-02 [61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-02 [66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-02 [71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-02 [76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-03 [81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-03 [86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-03 [91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-04 [96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-04 [101] 9.684491e-05 > > # Gráfico de distribución normal con media = 60 y varianza = 49 > > curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2, +

xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de

maíz - Función de Distribución N(media.sigma)") > > # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50: > valor=50 > pnorm(valor,media,sigma) [1] 0.07656373 >

> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha es de 0.0765 o del 7.65 por ciento > > #PROBABILIDAD DE UN VALOR MAYOR > valor=50 > # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la probabilidad de hallar un valor igual o menor: > > 1-pnorm(valor,media,sigma) [1] 0.9234363 > # En este caso, la probabilidad de que el rendimiento esté por encima de 50 qq/Ha, es de 0.923 o 92.3 por ciento. > > # PROBABILIDAD EN UN RANGO DE VALORES > > # Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el intervalo de 50 a 65 qq/Ha: > # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor: > valor1=50 > valor2=65 > VALOR1=pnorm(valor1,media,sigma) > VALOR1 [1] 0.07656373 > VALOR2=pnorm(valor2,media,sigma) > VALOR2

[1] 0.7624747 > > # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha: > VALOR2-VALOR1 [1] 0.685911 > > # Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha (p=0.762), menos la probabilidad de que esté por debajo de 50 qq/Ha (0.0765) > > regionX=seq(valor1,valor2,0.01)

# Intervalo a sombrear

> > # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha > > xP yP > # Cuando le abra la gráfica no la cierre y vuelva al Editor R, seleccionando el marco azul del cuadro, donde aparece el nombre del código > curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2, +

xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de

maíz Distribución Normal con área bajo la curva") > polygon(xP,yP,col="orange1") > box() >

# Área bajo la curva entre 50 y 65 qq/Ha

# Crea un marco rodeando el área bajo la curva

>

# DISTRIBUCION BINOMIAL

> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución binomial, página 101: > # Debe presentar estos resultados en su informe: > > # Supóngase que se toman 10 semillas de Panicum sp y se registra el evento "Germinó"o "No germinó",después de 5 días desde su implantación: > k= 7

# Queremos saber la probabilidad que germinen 7 de las 10 semillas

> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el número de semillas evaluadas > p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento > > dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen siete semillas" [1] 0.003089905 > > # Probabilidad que germinen al menos 3 de las 10 semillas: > # En este caso, se interpreta como la probabilidad de que germinen tres o más semillas > # Es equivalente a la probabilidad que germinen 3 semillas, más la probabilidad que germinen 4, más la prob. que germinen 5; y así sucesivamente hasta 10. > # Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen menos de 3 y restándole a la probabilidad total: > > k1=2

# Hay que calcular la probabilidad de un valor que sea una unidad menor que

el que queremos hallar

> > pbinom(k1,n,p) # esta es la probabilidad de que germinen menos de 3 semillas [1] 0.5255928 > > #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el anterior resultado: > 1-pbinom(k1,n,p)

# La probabilidad de que germinen 3 o más semillas es de 0.4744 o

del 47.44 por ciento [1] 0.4744072 > > # Probabilidad de que germinen a lo sumo 5 semillas: > # A lo sumo se interpreta que germinen máximo 5 semillas > k2=5 > pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98 o del 98 por ciento [1] 0.9802723 > > # La esperanza de esta variable aleatoria: > E=n*p >E [1] 2.5 > # La esperanza es de 2.5 > > # La varianza de esta variable aleatoria > V=n*p*(1-p)

>V [1] 1.875 > # La varianza es de 1.875 > > # Gráfico de distribución Binomial para el ejercicio de germinación de semillas: > > x prob barplot(prob,col = "red",names.arg=x, +

xlab="Evento (germinación de x semillas)",ylab="Probabilidad del

evento",main="PERIODO 764 - Distribución Binomial - Germinación de semillas\n(n=10,p=0.25)") > #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos posibles, es decir que germinen 0 semillas, 1.., hasta 10. > # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada positivamente hacia la izquierda > >

# DISTRIBUCION DE POISSON

> > # La distribución de Poisson se usa para distribuciones de variables discretas (conteos) > > # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y Biometría de Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución Poisson, página 105:

> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2 (es decir, que cada 100 semillas 20 tienen picaduras). > # PROBABILIDAD DE UN VALOR EXACTO > x1= 1

# Valor de conteo que se quiere calcular la probabilidad

> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o a la varianza, son el mismo valor > dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es de 0.1637 o de 16.37 por ciento [1] 0.1637462 > > ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES DE CERO MAS LA DE UNO > x0=0

# El valor de conteo que se quiere calcular la probabilidad, en este caso que

ninguna semilla tenga picaduras > x2=1 > lamda=0.2 #media o varianza como es igual > dpois(x0,lamda)

# La probabilidad de que ninguna semilla tenga picaduras es de

0.8187 o del 81.87 por ciento [1] 0.8187308 > 1-(dpois(x0,lamda)+dpois(x2,lamda))

# 1 menos la SUMA de la probabilidad de

tener cero picaduras mas una picdura (x0+x2) [1] 0.0175231 > # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8 por ciento