Trabajando Con Statgraphics

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA PROYECTO DE CARRERA DE INGENIERÍA EN INFORMÁTICA ASIGNATURA: ESTADÍSTICA I

Views 135 Downloads 5 File size 443KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA PROYECTO DE CARRERA DE INGENIERÍA EN INFORMÁTICA

ASIGNATURA: ESTADÍSTICA II PROFESOR: HERNAN RIVAS

PRÁCTICA 4: Trabajando con STATGRAPHIS

INTRODUCCIÓN es una herramienta con la que será posible estudiar y analizar al máximo todo lo que se relacione con las estadísticas. Este programa contiene un conjunto de herramientas que permiten crear diferentes datos variables, los cuales luego se podrán analizar bajo varios métodos de trabajo y seleccionar cual de todos es el mejor para poder trabajarlos y por ultimo agregarle gráficos específicos a cada campo, si se desea. Statgraphics Plus trabaja de una manera muy sencilla, pero a la vez profesional. El programa “Statgraphics Plus 5.1 para Windows”

Para poder hacer un correcto uso del mismo, solo será necesario un poco de práctica y perseverancia. Por último, cada uno de los resultados obtenidos, podrán ser impresos, con el fin de poder adaptarse a proyectos y trabajos reales. En la siguiente práctica se asumirá que la variable X tiene una distribución Normal con media de 500 y desviación estándar igual a 10, N (500, 102). Se pide realizar los siguientes procedimientos: a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar y la mediana para cada muestra y guárdelas en un vector. b) Construir el histograma y la gráfica de cajas de y bigotes para el ventor de medias muéstrales. Obtenga la media y la varianza para este vector. Estime el error cuadrático medio de la media de la muestra. c) Repetir el numeral anterior para el vector de medianas. d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren a µ? Desarrollar este numeral asumiendo primero que σ2 es conocido y después que no lo es. e) Para el vector de varianzas muestrales calcule su media y su varianza. Estime el error cuadrático medio n

para el vector de varianzas muéstrales. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n . Compare los i =1

errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional

Observación: Generar 200 muestras de tamaño 25, es equivalente a generar una sola muestra de tamaño 5000. Las primeras 25 observaciones son la primera muestra, las siguientes 25 son la segunda muestra y así sucesivamente hasta que las últimas 25 observaciones son la muestra número 200.

ALGUNAS GENERALIDADES

El Asesor Estadístico (StatAdvisor) Es una herramienta incorporada en STATGRAPHICS que produce de manera automática una interpretación corta y fácilmente comprensible de los resultados de los análisis estadísticos realizados.

Figura 1

StatAdvisor interpreta una tabla de Análisis de la Varianza y aconseja sobre posteriores análisis. Podemos acceder a esta herramienta desde los iconos correspondientes en la Barra de Herramientas o en la de Tareas. Veremos así la interpretación correspondiente al último análisis realizado. Si queremos guardar la información generada para cada análisis junto con el resultado de los mismos activaremos la opción VER…STATADVISOR de la barra de menú.

La Galería de Resultados (StatGallery) Esta herramienta permite el almacenamiento de los resultados de uno o varios análisis estadísticos, generando así una presentación organizada y personalizada de los mismos. La ventana de StatGallery se compone de páginas cada una de las cuales contiene 9 paneles organizados con estructura matricial (3x3). En ellas se pueden almacenar hasta 100 salidas gráficas y un número ilimitado de salidas de texto provenientes de los análisis ejecutados. Explicaremos ahora brevemente el uso de StatGallery. Cuando se haya generado un archivo de datos y ejecutado un análisis estadístico sobre él (ya veremos cómo realizar estas operaciones en capítulos posteriores), el sistema generará una ventana con los resultados de dicho análisis. Esa ventana estará dividida en paneles que contendrán resultados gráficos y textuales según las opciones que hayamos decidido aplicar. Pulsando el botón derecho del ratón en uno de estos paneles aparecerá un menú emergente en el que seleccionaremos la opción Copiar Ventana a Galería. Posteriormente abrimos la ventana de StatGallery y pulsamos el mismo botón en el panel en el que queremos cargar la información. Elegimos esta vez la opción Pegar y la copia queda realizada. Si elegimos la opción Pegar link se lleva a cabo una copia dinámica o vínculo, de manera que si realizamos cualquier modificación sobre el panel original en la ventana de análisis correspondiente, dicha modificación se cargará automáticamente en StatGallery sin tener que repetir el proceso de copia.

La configuración de paneles dentro de una página de StatGallery puede personalizarse sencillamente desplazando con el ratón las barras horizontales y verticales que los delimitan. En la Figura anterior podemos ver un ejemplo de una página personalizada cargada con distinta información gráfica y textual.

PROCEDIMIENTOS DE LA PRÁCTICA a) Generar k = 200 muestras aleatorias de tamaño n = 25. Obtenga la media, varianza, desviación estándar y la mediana para cada muestra y guárdelas en un vector. Para generar datos aleatorios procedemos de la siguiente manera, el la línea principal de comandos seleccionamos Describe o PLOT → PROBABILITY DISTRIBUTION y a continuación seleccionamos la distribución normal y OK.

Línea principal de comandos

Ventana de edición

Submenú del comando PLOT

Comandos directos

Después de lo anterior aparece la ventana

Guardar resultados

Comandos directos para distribuciones de probabilidad

Caja de dialogo

Opciones Tabulares

Opciones gráficas

Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANALYSIS OPTIONS para cambiar la media por 500 y la desviación estándar por 10 y obtenemos

A continuación por TABULAR OPTIONS (icono amarillo del menú propio de PROBABILITY DISTRIBUTIONS) seleccionamos la opción RAMDON NUMBERS. Después de lo anterior se obtiene la ventana siguiente:

Ventana RANDOM NUMBERS: Permite generar números aleatorios para varias distribuciones de probabilidad

Entonces, nos ubicamos en la ventana números aleatorios y con clic derecho seleccionamos la opción PANE OPTIONS y modificamos el tamaño muestral por 5000 en nuestro caso y OK. Esto es,

Guardar resultados de los 5000 números aleatorios.

Después de la instrucción anterior se han generado 5000 números aleatorios de una normal con media 500 y desviación estándar 10. Para salvar estos resultados procedemos así, en el icono SAVE RESULTS indicamos guardar los números aleatorios y especificamos el nombre de la variable, X en nuestro caso, y OK y cerramos la ventana de PROBABILITY DISTRIBUTIONS; después de lo anterior aparece una columna llamada X con 5000 datos en la ventana de edición.

Cerrar la ventana de PROBABILITY DISTRIBUTIONS

OK

Observación: Antes de cerrar la ventana de PROBABILITY DISTRIBUTONS podemos generar la muestra aleatoria de la distribución UNIFORME [0, θ = 400]. Para ello procedemos así: • • •

En la CAJA DE DIALOGO (icono rojo) de los comandos para PROBABILITY DISTRIBUTONS con clic izquierdo cambiamos la distribución normal por la uniforme. Luego en la ventana de PROBABILITY DISTRIBUTIONS clic derecho y ANÁLISIS OPTIONS para cambiar el límite superior por 400 y el limite inferior por cero. A continuación en la ventana RAMDON NUMBERS con clic derecho y PANE OPTIONS cambiamos el tamaño de la muestra por 9000 para generar las 300 muestras de tamaño n = 30.

Después de lo anterior, la ventana de edición queda como

Muestra de la uniforme

Muestra de la normal Para continuar el proceso generemos unas variables de códigos para identifica las 200 muestras de tamaño 25 de la normal y las 300 muestras de tamaño 30 de la uniforme continua; esto lo hacemos de la siguiente manera: •

En la ventana de edición seleccionamos la tercera columna (Col_3) con clic izquierdo sobre Col_3.



A continuación con clic derecho se activan las opciones sobre la columna, seleccionamos la opción MODIFY COLUMN para cambiar el nombre de la columna. Esta columna la llamaremos Cod1.

Después de lo anterior se obtiene la siguiente ventana

Opciones sobre la columna. •

Entonces, nuevamente sobre la tercera columna (Cod1) con clic derecho seleccionamos la opción GENERATE DATA y se obtiene la ventana

Operadores para generar datos en la ventana de edición •



Algunas funciones

A continuación, generamos los códigos para identificar las 200 muestras de tamaño 25 de la normal utilizando los operadores Rep(?;?) y Count(?;?;?). Esto lo hacemos así, en la línea para expresiones de la ventana anterior escribimos Rep(Count(1;k;1);n) y de esta forma se genera una columna que contiene 25 veces uno, 25 veces dos, y así sucesivamente hasta 25 veces 200. Para generar los códigos para identificar las 300 muestras de la uniforme, procedemos de la misma forma y creamos la variable Cod2 en la columna Col_4.

Nota: Rep(Count(1;200;1);25) Rep(Count(1;300;1);30)

Después de lo anterior se obtiene la ventana siguiente

Observe que en Cod1 hay 25 veces uno, luego sigue el dos y así sucesivamente. Además, en Cod2 hay 30 veces uno, luego le sigue el dos y así sucesivamente hasta que aparece 30 veces trescientos. Ahora, para obtener los vectores de medias, varianzas, desviaciones estándar y medianas para cada una de las 200 muestras aleatorias de la normal procedemos como sigue: •

Seleccionamos el comando DESCRIBE; luego, el comando NUMERIC DATA de las opciones de DESCRIBE y a continuación la opción SUBSET ANÁLISIS como se observa a continuación,

Menú de opciones para el comando NUMERIC DATA

Opciones del comando DESCRIBE



A continuación indicamos que los datos están en la columna X y los códigos están la columna Cod1. Esto es,



Después de lo anterior indicamos OK y se obtiene la siguiente salida

Nombre de la ventana •

Entonces nos ubicamos en la ventana Summary Statistics y con clic derecho en Panel OPTIONS seleccionamos los estadísticos deseados como se observa a continuación:

Guardar resultados



Finalmente, guardamos los resultados usando el icono SAVE RESULTS e indicamos los estadísticos a guardar y el nombre de cada columna e indicamos OK. LO anterior se muestra a continuación:



Para finalizar cerramos la ventana SUBSET ANÁLISIS y en la ventana de edición aparecen las columnas que contienen los 200 valores de los estadísticos requeridos como se observa a continuación,

b) Construir el histograma y la gráfica de cajas y bigotes para el ventor de medias de las muestras. Obtenga la media y la varianza para este vector. Estime el error cuadrático medio de la media de la muestra.

Solución: Para resolver lo anterior procedemos de la siguiente forma. •

Por el comando DESCRIBE del menú principal seleccionamos NUMERIC DATA y a continuación la opción ONE-VARIABLE-ANALYSIS como se observa a continuación. Luego, indicamos que los datos para el análisis están en la variable MediaX.



Después de lo anterior se obtiene un análisis descriptivo de la variable. Para construir el histograma y la gráfica de cajas y bigotes entramos por el comando por Graphical Options y seleccionamos las opciones histograma de frecuencias Box-and-Whisker Plot como se muestra a continuación:



Después de lo anterior obtenemos



En las opciones gráficas están los gráficos pedidos y en Summary Statistics están las estadísticas descriptivas para el vector de medias de las muestras. Los resultados anteriores se copian y se llevan a un procesador de texto para su análisis posterior, a continuación cerramos la ventana OneVariable-Analysis.

Finalmente, para estimar el error cuadrático medio para la media de la muestra generamos la columna ECM1 con la instrucción ( mediaX − 500 ) ; esto es, 2

c) Repetir el numeral anterior para el vector de medianas. Solución: Se procede igual que en el numeral (b) anterior pero usando los datos que están en la columna MedianasX.

d) Construir los k = 200 intervalos de confianza del 95% para µ = 500. ¿Cuántos de estos intervalos cubren a µ?. Desarrollar este numeral asumiendo primero que σ 2 es conocido y después que no lo es. Solución: Sabemos que el intervalo de confianza para la media de una población normal con varianza conocida es x − zα 2 ×

σ

< µ < x + zα 2 ×

σ

. Por lo tanto, para construir los intervalos generamos dos n 1.96*10 1.96*10 , y LS1 = mediaX + , como se observa a columnas que llamaremos LI1 = mediaX 25 25 continuación n

Después de lo anterior aparecen las columnas LI1 y LS1 en la ventana de edición. Para contar cuantos de estos intervalos contienen a la media poblacional, generamos una nueva columna que llamaremos CONTAR1 con la siguiente instrucción: (LI1500). De esta forma, se obtiene una variable cuyo valor es 1 cuando la condición se cumple y toma el valor de cero en otro caso. Lo anterior lo hacemos así:

s s < µ < x + tα 2, n −1 . n n Entonces, para obtener los 200 intervalos generamos dos variables que llamaremos LI2 y LS2 de la INVSTUDENT(0.975;24)*SX siguiente forma: LI2 = mediaX y 25 INVSTUDENT(0.975;24)*SX LS2 = mediaX + . Para determinar cuantos de estos intervalos cubren a la 25 media poblacional, procedemos de la misma forma que en le caso de varianza conocida.

Ahora, cuando la varianza poblacional es desconocida el intervalo es

x − tα 2,n −1

e) Para el vector de varianzas de las muestras calcule su media y su varianza. Estime el error cuadrático n

medio para el vector de varianzas de las muestras. Realice el mismo ejercicio para S*2 = ∑ ( X i − X )2 / n . i =1

Compare los errores cuadráticos medios estimados de estos dos estimadores de la varianza poblacional Solución: Procedemos de la siguiente forma: •

Para encontrar la media y la varianza del vector de varianzas de las muestras ingresamos por el comando DESCRIBE, luego la opción NUMERIC DATA y a continuación ONE-VARIABLE ANÁLISIS e indicando que los datos están en la variable S 2 .



Nos ubicamos en resúmenes estadísticos para S X 2 , damos clic derecho y en opciones de ventanas

• •

marcamos los cuadros de la media y la varianza y aceptar (OK). Vamos a opciones graficas y seleccionamos los gráficos que deseamos realizar; aceptar. Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos

(

)

2

ECM_ S X 2 = S X 2 − 100 , aceptar. •

Para hallar el ECM_ S X 2 , activamos la columna, le damos clic derecho, Generar Datos ECM_ S X 2 =

( n − 1) S X 2 , aceptar. n