SPSS

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero MANUAL DE SPSS APLICADA A LA ESTADISTICA

Views 167 Downloads 6 File size 1018KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

MANUAL DE SPSS APLICADA A LA ESTADISTICA Doc. Juan Roberto Morales Romero

Doc. Juan Roberto Morales Romero

1

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero SPSS Y EXCEL APLICADA A LA ESTADISTICA 1.1 Ventanas del SPSS Existen diversos tipos de ventanas en SPSS: 1. Editor de datos: Muestra el contenido del archivo de datos y se abre automáticamente cuando se inicia una sesión de SPSS. No se puede tener más de un archivo de datos abierto al mismo tiempo.

Figure 0-1 2. Visor: Muestra todas las tablas, los gráficos y los resultados estadísticos. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del visor se abre automáticamente la primera vez que se ejecuta un procedimiento que genera resultados.

Doc. Juan Roberto Morales Romero

2

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 3. Visor de borrador: Los resultados pueden mostrarse como texto normal (en lugar de como tablas pivote interactivas) en el Visor de borrador. 4. Editor de gráficos: Permite modificar y guardar los gráficos y diagramas con extensión .sct. Para ello se selecciona el gráfico en el visor y se hace doble-click con el ratón.

Figure 0-3 5. Editor de tablas pivote: Permite modificar los resultados mostrados en este tipo de tablas, como editar el texto, intercambiar los datos de las filas y las columnas, añadir colores… Para ello se selecciona la tabla en el visor y se hace doble-click con el ratón.

Doc. Juan Roberto Morales Romero

3

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

6. Editor de resultados de texto: Permite modificar los resultados de texto que no aparecen en las tablas, esto es, editar los resultados y cambiar las características de las fuentes (tipo, estilo, color y tamaño).

Figure 0-4 7. Editor de sintaxis. Permite grabar y editar la sintaxis de los comandos seleccionados. Para ello hay que clicar sobre la opción Pegar de los cuadros de diálogo, y la ventana de sintaxis muestra el código correspondiente.

Figure 0-5 8. Editor de procesos: Permite crear y modificar los procesos básicos.

Doc. Juan Roberto Morales Romero

4

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero 1.2 Barra de Menús El menú principal tiene 10 opciones: 1. Archivo: Crea un nuevo fichero, abre uno existente, graba, lee datos de otras aplicaciones, guarda, imprime… 2. Edición: Contiene las opciones típicas de Windows (copia, pega, busca…). 3. Ver: Contiene opciones como “Fuentes” para modificar, tipo, tamaño de letra… Desde aquí también se pueden eliminar las líneas (cuadrícula) de la pantalla, asignar etiquetas de valores, ver barra de estado (situada en la base de la pantalla, indica el estado actual del proceso), modificar la barra de herramientas.... 4. Datos: Contiene opciones para hacer cambios que afectan a todo el archivo de datos como definir variables (nombre, tipo, etiquetas…), insertar variables, trasponer variables y casos, unir archivos... Los cambios serán temporales mientras no se salve el archivo. 5. Transformar: Permite hacer cambios sobre variables seleccionadas del archivo de datos. Por ejemplo, calcula nuevas variables a partir de transformaciones numéricas de variables existentes, asigna rangos… 6. Analizar: Desde aquí se ejecutan todos los procedimientos estadísticos (tablas, regresión, pruebas paramétricas…) . 7. Gráficos: Permite la salida gráfica de los datos o resultados (barras, líneas, áreas, gráficos de pareto, cartas de control, histogramas, diagramas de cajas…). 8. Utilidades: Sirve para obtener información completa del archivo de datos... 9. Ventanas: Minimiza la ventana SPSS y muestra las ventanas abiertas. 10. Ayudas: Contiene distintos archivos de ayuda: por temas, tutorial, asesor estadístico…

1.3 Procedimiento Básico para un Análisis Estadístico Para llevar a cabo cualquier tipo de análisis con SPSS hay que realizar tres operaciones básicas: 1. Seleccionar un archivo de datos. 2. Seleccionar el procedimiento estadístico adecuado.

Doc. Juan Roberto Morales Romero

5

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

3. Seleccionar las variables a incluir en el análisis y los parámetros adicionales.

1.4 ¿Cómo introducir los datos? El SPSS reconoce archivos de datos creados por otros sistemas o aplicaciones. Así, pueden importarse datos desde Excel o Lotus 1-2-3. Al igual que pueden tratarse con datos grabados en DBase. SPSS permite: 1. Leer los nombres de las variable de la primera fila en las hojas de cálculo y en los archivos delimitados por tabuladores. 2. Especificar el rango de casillas que desee leer en los archivos de hojas de cálculo. Si los datos sin formato se hallan en un archivo de sólo texto (formato ASCII normal) ha de seleccionarse Leer datos de texto en el menú Archivo. De cualquier manera, se puede utilizar el editor de datos de SPSS para introducir datos y crear lo que llamaremos un archivo de datos. (Archivo/Nuevo). Se pueden introducir o editar datos. Por defecto, SPSS crea y/o graba archivos s. av . Cualquier modificación que se haga en el archivo de datos se mantendrá sólo durante el tiempo que dure la sesión, a no ser de que se salve explícitamente mediante Archivo/Guardar. Sólo puede abrirse una archivo de datos cada vez, por eso SPSS cierra automáticamente el archivo de datos de trabajo antes de abrir otro.

1.5 Definición de variables Las variables pueden ser definidas desde el Editor de datos. Esta ventana es la que se abre automáticamente cuando se inicializa el SPSS. Los datos se representan en un formato de filas y columnas, donde cada fila es un único caso u observación (por ejemplo, cada persona en una encuesta) y cada columna es una única variable (por ejemplo, una pregunta en una encuesta). Haciendo ‘doble clic’ en la cabecera de la primera columna o en Datos/Definir variable, aparece el cuadro de diálogo de definición de las variables.

Doc. Juan Roberto Morales Romero

6

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-1 En el cuadro se distingue: 1. Nombre de la variable: Por defecto asigna “Var” seguido de 5 dígitos. Puede introducirse un texto de hasta 8 caracteres que debe comenzar con letra y no debe acabar con punto. Tampoco puede tener blancos ni otros caracteres especiales. Dos variables no pueden llamarse de la misma manera. 2. Tipo: Por defecto SPSS asume que las variables son numéricas, pero puede cambiarse el tipo por: Numérico (ancho máximo de 40 caracteres y 16 decimales); Coma (permite poner coma para separar los miles); Punto (cambia las comas por puntos); Notación Científica, Fecha (se pueden utilizar barras, comas y puntos para separar días, meses y años); Moneda y Cadena. 3. Etiquetas: Se pueden definir etiquetas de valor descriptivas para valores de datos. Por ejemplo, para el caso de la figura 7 se asigna a las etiquetas “Administrativo”, “Seguridad” y “Directivo” los valores 1, 2 y 3, respectivamente.

Figure 0-2

Doc. Juan Roberto Morales Romero

7

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero 4. Valores perdidos: SPSS lo considera cualquier casilla en blanco como valor perdido, aunque también pueden definirse estos valores. Muchos análisis estadísticos consideran la opción de valores perdidos de dos formas: para excluir casos según lista y para excluir casos según pareja. En el primer caso, se eliminan los casos que tengan valores perdidos en cualquiera de las variables que están indicadas en el análisis. En el segundo, se eliminan los casos con valores perdidos de las dos variables que intervienen en el cálculo del dato específico que se está buscando. 5. Formato de columnas: Se puede cambiar el ancho de las columnas y la alineación del texto que viene por defecto en el archivo de texto.

1.6 Edición de datos Los datos se introducen en el Editor de Datos. Para ello se selecciona la casilla o celda activa (que aparecerá remarcada), se teclea el valor y se pulsa Enter. En el caso de introducir valores no numéricos, previamente se habrá elegido el tipo adecuado en la definición de la variable (fecha, cadena…) Con las opciones Datos/Insertar Variable y Datos/Insertar Casos se pueden añadir nuevas variables y nuevos casos al archivo. El programa sitúa la nueva variable o el caso en la posición inmediatamente anterior a la celda activa. Puede modificarse cualquier dato introducido, así como elegir las opciones del menú Editar: cortar, copiar, pegar, eliminar… El menú Ver ofrece la opción “Ver etiquetas de valor”, que muestra las etiquetas de las categorías en vez de lo datos numéricos.

1.7 Transformaciones sobre los datos Transformar/Calcular: Asigna valores a una variable a partir de transformaciones numéricas de variables existentes. Se puede escribir directamente la expresión aritmética que generará la nueva variable o construirla con las funciones numéricas que aparecen en la lista Funciones. También puede establecerse una expresión condicional. Transformar/Recodificar: Permite modificar los valores de las variables, bien recodificándolos en la misma o en una nueva variable. Esto suele ser útil para combinar o añadir categorías a una variable.

Doc. Juan Roberto Morales Romero

8

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Transformar/Recodificación automática: Realiza la misma función que Recodificar, pero en este caso no especificamos nosotros los antiguos y nuevos valores, sino que el programa identifica los distintos valores de una variable y asigna un 1 para el primer valor, un 2 para el segundo… Es muy útil para recodificar variables texto en categorías numéricas. Transformar/Semilla de aleatorización: Establece la semilla con la que el SPSS empieza a generar números aleatorios.

1.8 Manipulación de archivos Datos/Ordenar Casos: El archivo de datos se ordena de forma ascendente o descendente. Datos/Transponer: Intercambia filas y columnas. Datos/Agregar: Permite agrupar casos basándose en los valores de una variable de agrupación y crear un nuevo archivo donde habrá un caso por cada grupo. Añadiendo además “Guardar el número de casos en cada grupo en la variable” se añade además una nueva variable que contiene el número de casos encontrados en cada grupo. Datos/Segmentar Archivos: Permite definir una variable de agrupación de casos. Para utilizar esta opción el archivo debe estar ordenado por la variable de agrupación. Datos/Seleccionar casos: A veces es interesante limitar los análisis a submuestras. El SPSS permite seleccionar casos al azar, o siguiendo un determinado criterio…Una vez seleccionados los casos puede elegirse qué hacer con los no seleccionados: filtrarlos o eliminarlos (estos casos no podrán volver a recuperarse). Datos/Fundir archivos: Permite unir archivos, combinando archivos con las mismas variables y distintos casos, o con distintas variables. Data/Ponderar Casos: Puede especificarse un factor de ponderación para cada caso.

1.9 Gráficos Existen dos maneras de crear gráficos, cada uno con su Editor de Gráficos.

Doc. Juan Roberto Morales Romero

9

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

La primera de las dos formas consiste en seleccionar el tipo de gráfico deseado en el menú Gráficos (barras, línes, áreas, sectores…). Seleccionando Gráficos/Galería se obtiene información sobre los tipos de gráficos existentes. Una vez elegido el tipo de gráfico y la manera de organizar los datos se pulsa en el botón Definir, de manera que aparece un nuevo cuadro de diálogo, en donde se introduce, entre otras opciones, la variable del eje de categorías. La gráfica resultante aparece en el Visor. Clicando dos veces sobre ésta se abre el Editor de Gráficos, de manera que pueden realizarse modificaciones sobre la gráfica. Por defecto el Editor muestra las barras de herramientas de gráficos, aunque puedan añadirse más o personalizar las barras. Para ello no hay más que colocar el cursor sobre las barras y clicar con el botón derecho, de forma que aparece el menú contextual. También pueden realizarse modificaciones haciendo doble-click sobre cualquiera de los elementos de la gráfica, apareciendo el cuadro de diálogo correspondiente.

Figure 0-1 SPSS también ofrece la posibilidad de crear Gráficos Interactivos. Para ello se elige Gráficos/Interactivos y se elige el tipo de gráfico, apareciendo el correspondiente cuadro de diálogo.

Doc. Juan Roberto Morales Romero

10

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 El cuadro de diálogo se compone de cuatro pestañas. Para crear un gráfico basta con asignar las variables en Asignar Variables, pero se pueden utilizar las demás pestañas para personalizarlo. Las variables de los ejes se asignan arrastrándolas desde la lista de origen hasta los ejes de destino. También se pueden arrastrar variables de un destino a otro. Si se coloca una variable en un destino con otra variable asignada, las variables intercambian su posición. Se pueden asignar múltiples variables a los ejes pulsando la tecla Ctrl al mismo tiempo que el botón del ratón. El resultado del gráfico aparece en el Visor. Pueden realizarse modificaciones sobre el gráfico, activándolo clicando dos veces sobre él. Los gráficos interactivos ofrecen funciones de edición especiales que no aparecen en otros gráficos, por ejemplo, la posibilidad de añadir variables y dimensiones adicionales a un gráfico existente.

Doc. Juan Roberto Morales Romero

11

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero 1.10 Tablas Pivote Los resultados de este tipo de tablas pueden ser modificados en Editor de tablas pivote, al que se accede clicando dos veces sobre la tabla. Tabla de contingencia Sexo * Clasificación étnica * Categoría laboral Recuento Categoría laboral Administrativo

Sexo

Hombre Mujer

Seguridad

Total Sexo Total

Directivo

Sexo

Hombre Hombre Mujer

Total

Clasificación étnica No Sí 110 47

Total 157

166 276 14 14

40 87 13 13

206 363 27 27

70 10 80

4

74 10 84

4

Figure 0-1

Tomemos como base la tabla de la figura 10. Al pulsar dos veces en la tabla se activa el Editor que permite: 1. Obtener información sobre los resultados de la tabla Para ello hay que clicar con el botón derecho sobre el elemento deseado y elegir la opción ¿Qué es esto? del menú contextual emergente.

2. Pivotar una tabla Tras clicar dos veces sobre la tabla se elige Pivotar/Paneles de pivotado. Aparece un cuadro de diálogo con iconos de pivotado sobre los paneles Capa, Fila y Columna. Al clicar sobre cada uno de estos iconos aparece un mensaje señalando qué representa cada uno de los iconos.

Doc. Juan Roberto Morales Romero

12

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-2 Puede modificarse la posición y orden de los iconos, arrastrándolos de un panel a otro, de forma que la tabla varía. Tabla de contingencia Sexo * Clasificación étnica * Categoría laboral Recuento

Clasificación étnica

No Sí

Total

Administrativo Sexo Hombre Mujer 110 166 47 40 157 206

Total 276 87 363

Seguridad Sexo Hombre Total 14 14 13 13 27 27

Directivo Sexo Hombre Mujer 70 10 4 74 10

Total 80 4 84

Figure 0-3 En la figura 12 se ha traspuesto el orden de las filas y columnas con respecto a la tabla inicial de la figura 10. 3. Crear capas Los resultados de la tabla pueden mostrarse por capa. Esto es, puede mostrarse una tabla bidimensional en capas tridimensionales. Para ello se elige, como en el caso anterior, Pivotar/Paneles de pivotado y se arrastra los iconos de pivotado deseados de los paneles Fila o Columna al panel Capa. Por ejemplo, en la siguiente figura se ha trasladado Categoría Laboral a la dimensión de Capa. Así, los resultados son mostrados por categoría, eligiendo ésta según el menú desplegable emergente.

Doc. Juan Roberto Morales Romero

13

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-4 4. Editar elementos de la tabla Clicando sobre la celda o la etiqueta de la tabla que se quiere modificar, puede cambiarse el formato utilizando la barra de herramientas (Ver/Barra de herramientas). También puede utilizarse Formato/Fuente para elegir opciones adicionales sobre la fuente y alineación de la celda. Puede editarse cualquier valor de la tabla, teniendo en cuenta que si se cambia el valor de un elemento, los valores totales no se volverán a calcular. 5. Cambiar el formato de presentación de la tabla Una vez abierto el Editor, se seleccionan las filas y columnas cuyo formato de presentación quiere modificarse. Una vez seleccionadas, clicando con el botón derecho se elige la opción Propiedades de casilla.

Doc. Juan Roberto Morales Romero

14

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Figure 0-5 Aparece un nuevo cuadro de diálogo, donde pueden elegirse diferentes opciones entre las cuatro pestañas existentes. 6. Ocultar filas/columnas El Editor permite ocultar filas o columnas determinadas de la tabla. Para ello hay que teclear Ctrl+Alt sobre la etiqueta de la fila o columna a ocultar y, clicando el botón derecho, seleccionar Ocultar Categoría del menú contextual emergente. Por ejemplo, podrían ocultarse los totales de las filas y columnas de la tabla inicial. Tabla de contingencia Sexo * Clasificación étnica * Categoría laboral Recuento Categoría laboral Administrativo Seguridad Directivo

Sexo

Hombre

Sexo Sexo

Mujer Hombre Hombre Mujer

Clasificación étnica No Sí 110 47 166 14 70 10

40 13 4

Figure 0-6

Doc. Juan Roberto Morales Romero

15

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

7. Personalizar el aspecto de la tabla

Al elegir Formato/Aspectos de tabla aparece un cuadro de diálogo con los estilos de tabla disponibles. Tomando cualquiera de estos estilos como base, se realizan las modificaciones deseadas para crear estilos personalizados y se guardan con nombres nuevos, de forma que puedan ser utilizados en sesiones posteriores. Puede elegirse el aspecto de tabla por defecto en Edición/Opciones, estableciendo en la pestaña Tablas pivote el nuevo aspecto a utilizar por defecto.

1.11 Procesos Los procesos permiten automatizar muchas tareas para personalizar los resultados. Además de procesos, pueden crearse autoprocesos, que son ejecutados automáticamente cuando se crean tipos específicos de elementos a los cuales hacen referencia. Para ejecutar un proceso hay que seleccionar el elemento sobre el cual se quiere aplicar el proceso, elegir Utilidades/Ejecutar proceso y escoger uno de los procesos disponibles dentro de la carpeta Scripts. Asimismo, desde el Editor de Datos pueden crearse nuevos procesos en Archivo/Nuevo/Proceso, o editar los ya existentes en Archivo/Abrir, eligiendo archivos tipo Proceso de SPSS ( .sbs ). Para crear un autoproceso, primeramente hay que ejecutar el procedimiento que crea el tipo de elemento similar a los elementos que queremos que sean personalizados automáticamente. En el Visor, hay que clicar con el botón derecho sobre el resultado y seleccionar Crear/Editar autoproceso en el menú contextual desplegable. El lenguaje para editar los procesos es Sax Basic , compatible con Visual Basic. Sin embargo, no es objeto de este manual profundizar en temas de programación. Puedes acudir a la propia ayuda del programa, consultando el Lenguaje de Procesos en el menú Ayuda del Editor de Sintaxis.

Doc. Juan Roberto Morales Romero

16

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero 2 ESTADÍSTICA DESCRIPTIVA 2.1 Frecuencias. Histogramas El procedimiento Analizar/Estadísticos Descriptivos/Frecuencias permite obtener una descripción de la distribución de una variable a partir de las tablas de frecuencias, histogramas y diagramas de barras y cálculos de índices de posición y dispersión. Las tablas de frecuencias muestran: Frecuencia: Frecuencia absoluta de cada categoría. Porcentaje: Frecuencia relativa, incluyendo los perdidos. Porcentaje Válido: Frecuencia relativa, eliminando los perdidos. Porcentaje Acumulado: Frecuencia relativa acumulada, eliminando los perdidos. En Frecuencias:Gráficos se puede seleccionar entre gráficos de barras, gráficos de sectores, histogramas con o sin curva normal y el tipo de datos que se quiere aparezca en el eje Y (Frecuencias absolutas o relativas). Las tablas de frecuencias y los gráficos de barras de todos los valores de una variable son una forma adecuada de resumir una variable que tiene un número relativamente pequeño de valores. Para variables que pueden tomar muchos valores diferentes, como ingresos, precios…una tabla de frecuencias para cada valor de la variable no tiene utilidad. La forma más adecuada de representar esta distribución en este caso es un histograma, agrupando los valores en intervalos. Los números que aparecen debajo de cada barra indican el punto medio de cada intervalo. Los intervalos que no tienen ninguna observación también están incluidos en el gráfico (a diferencia del gráfico de barras, que no dejan espacio para categorías vacías). Si se quiere representar una tabla de frecuencias para estos intervalos, se debe previamente reconvertir la variable original en intervalos.

2.2 Índices de tendencia central y de posición En Analizar/Estadísticos Descriptivos/Frecuencias:Estadísticos aparecen los siguientes: 1. Índices de posición ( valores percentiles)

Doc. Juan Roberto Morales Romero

17

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Cuartiles: Calcula el valor que deja a la izquierda el 25% de los valores (Q 1), el que deja el 50% (Q 2 o mediana) y el que deja el 75% (Q 3). Puntos de corte para n grupos iguales: Muestra los valores de la variable que dividen la muestra en grupos de casos de igual tamaño. Por defecto, divide la distribución en 10 grupos iguales (halla los deciles). Los cuartiles se obtienen cuando se divide en 4 partes iguales. Percentiles: Calcular algún centil específico. 2. Índices de tendencia central Media: Media aritmética. Mediana: Valor por debajo del cual está el 50% de los casos. Moda: Valor que más se repite Suma: Suma de todos los valores 3. Índices de dispersión (Dispersión) Desviación Típica: Variabilidad de los valores con respecto a la media, expresada en las mismas unidades que los datos. Varianza: Variabilidad de los valores con respecto a la media, expresada en unidades al cuadrado. Amplitud: Diferencia entre los valores máximo y mínimo. Mínimo: Valor más pequeño. Máximo: Valor más grande. E.T. media: Error tipo de la media. Estimación de la variabilidad muestral de la media. 4. Índices de distribución Asimetría: Coeficiente de asimetría. Curtosis: Coeficiente de curtosis. Algunas de estas medidas también se hallan en Analizar/Estadísticos Descriptivos/Descriptivos. En el cuadro de diálogo se seleccionan las variables, y en Opciones puede elegirse calcular la media, suma, desviación típica, amplitud, mínimo, máximo, coeficientes de curtosis y asimetría.

2.3 Representación en tablas Sirve para representar los datos de variables en forma tabulada. Así, en Analizar/Tablas personalizadas/Tablas básicas aparece un cuadro de diálogo en el que debe introducirse:

Doc. Juan Roberto Morales Romero

18

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Hacia abajo: La variable o variables que aparecerán por filas. A través: Variable o variables que irán en columnas.

Tablas distintas: La variable de separación de tablas, si se desea (p.e.,. Sexo). Se puede elegir, además, dos opciones: Todas las combinaciones (anidadas) o Cada una por separado (apiladas). En el primero de los casos, en las dos o más variables que se tienen por filas o columnas, se combinan o juntan las categorías, mientras que en el caso de las apiladas se diferencias las categorías, esto es, cada categoría aparece por separado. Por ejemplo, suponga que tiene una tabla con dos variables en las columnas: sexo (hombre y mujer) y estado (soltero, casado...) y una variable en las filas: aspecto que más le preocupa (su vida afectiva, el dinero…). Al utilizar la opción de todas las combinaciones anidadas obtiene la primera tabla y al utilizar la opción de apiladas obtiene la segunda tabla.

Figure 2-1

Figure 2-2

Doc. Juan Roberto Morales Romero

19

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

También se puede elegir qué estadísticos quieren observarse en las celdas de la tabla, desde la frecuencia o número de observaciones en valores absolutos, valores relativos, porcentajes, medias, desviaciones... Asimismo puede elegirse el formato de salida. Es aconsejable usar la opción de tablas de frecuencias cuando lo que se quiere analizar son los resultados de una serie de variables que tienen las mismas categorías de respuesta. En Analizar/Tablas personalizadas/Tablas de frecuencias, en el campo Frecuencias para…se detalla la variable sobre la cual se quiere visualizar las frecuencias. En En cada tabla…se introducen las variables que crean los subgrupos dentro de la tabla. Al igual que en las tablas básicas, los resultados pueden mostrarse anidados o apilados.

3 REGRESIÓN Y CORRELACIÓN Estas técnicas estadísticas sirven para estudiar la existencia o no de relación entre dos variables y, en el supuesto de que exista, ver si es lineal positiva o negativa, exponencial… Para cuantificar el grado de relación lineal entre dos variables se utilizará el coeficiente de correlación de Pearson, coeficiente que oscila entre -1 y 1, indicando con 0 la relación nula y con 1 o -1 la relación perfecta positiva o negativa, respectivamente.

3.1 Correlación En Analizar/Correlaciones/Bivariadas aparece un cuadro de diálogo donde pueden elegirse las variables que queremos relacionar, el coeficiente de correlación y el test de significación (unilateral o bilateral, este último por defecto). Para el coeficiente de correlación, el programa da tres opciones: el de Pearson, por defecto, la correlación de Spearman, que se suele utilizar para datos ordinales o de intervalos, y el de Kendall, muy parecido al anterior. Aparecerán tres valores: 1. el primer valor es el coeficiente de correlación, según el elegido. 2. el segundo valor es el grado de significación de cada coeficiente, que da un grado de confianza del resultado obtenido. Usualmente se trabaja con niveles que van desde 0,05 a 0,01, es decir, se trabaja con un grado de confianza del 95% al 99%. 3. el tercer valor hace referencia a las observaciones que han intervenido en el cálculo de la relación.

Doc. Juan Roberto Morales Romero

20

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

En el cuadro de diálogo aparece la opción Marcar las correlaciones significativas. Si esta opción se selecciona aparecen con un * los valores que tienen un nivel de significación inferior a un 0,05, y con dos ** los de nivel inferior a 0,01. Lógicamente si el coeficiente se calculara no con una muestra de valores sino con toda la población el grado de significación sería 0. En Opciones se pueden seleccionar estadísticos adicionales como medias, varianzas, covarianzas... Existe otro coeficiente de correlación en Analizar/Correlaciones /Parciales que da una idea de la relación lineal existente entre dos variables, pero ajustada a los efectos lineales que sobre la misma puedan tener una o más variables intervinientes. Gráficos/Dispersión da la opción de graficar los datos para ver gráficamente la posible relación entre las variables.

Figure 3-1 Existen 4 opciones: 1. Simple: Cada punto del gráfico representa un sujeto de la base de datos con sus valores representativos en dos variables. 2. Matricial: Una matriz cuadrada de diagramas de dispersión simple que muestra todos los pares posibles entre las variables seleccionadas. 3. Superpuesto: Representa dos o más parejas de variables Y-X dentro del mismo marco. 4. 3-D: Es la representación de la relación de tres variables. Se puede rotar el gráfico. En “Definir” se debe decir qué variable aparece en el eje Y (actúa como dependiente) y cuál o cuáles en la X (independiente). Existen las opciones Establecer marcas por una variable que clasifique los individuos por grupos y Etiquetar los casos mediante, una variable que con sus valores o categorías identifique a cada sujeto en el gráfico. Presionando el botón de Opciones …aparece: Mostrar los grupos definidos por los valores perdidos: Muestra o no los puntos del gráfico separado por los distintos subgrupos de la variable introducida en Establecer marcas por .

Doc. Juan Roberto Morales Romero

21

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Mostrar el gráfico con las etiquetas del caso: Aparecen las etiquetas por cada punto del gráfico de acuerdo a la variable de Etiquetar los casos mediante.

3.2 Regresión Lineal Simple El procedimiento que se desarrolla en Estadísticos/Regresión/Lineal pretende ajustar los datos a un modelo de regresión simple:

Yi = β 0 + β 1 X i + e i donde βo y β1 son desconocidos y deben ser estimados con los datos y e i es el término del error, es decir, la diferencia entre los valores predichos por la regresión y los reales. Este ajuste se realiza a través de una análisis de varianza que requiere los siguientes supuestos: 1. La normalidad e igualdad de varianzas tanto de la variable dependiente como la independiente. 2. La independencia de la variable Y. 3. La linealidad en la relación entre las variables. En el cuadro de diálogo de Estadísticos de Regresión Lineal, aparece la opción Ajuste del modelo, que muestra la R múltiple, la R cuadrado, la R cuadrado corregida y el error típico. Una tabla ANOVA muestra los grados de libertad, las sumas de cuadrados, el valor de F y el nivel crítico de F. Los resultados en los que nos fijaremos son: 3.2.1

Coeficientes de correlación R Múltiple : Es el coeficiente de correlación de Pearson. R Cuadrado: Es el cuadrado del anterior y una buena medida del ajuste del modelo a los datos. Se podría traducir como la proporción de la variación de la variable dependiente que es explicada por el modelo. R Cuadrado corregido: Varía un poco del anterior, porque está calculado ajustado al número de variables independientes del modelo.

3.2.2

Análisis de la varianza (ANOVA) El nivel de significación es la forma de probar la no existencia de relación lineal significativa entre las

variables X e Y. Si este valor es mayor que 0,05, se debe rechazar la hipótesis de linealidad entre ambas

Doc. Juan Roberto Morales Romero

22

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

variables. Si es menor a este valor, se aceptará como válida esta relación con un nivel de significación del 95%. En este caso, los valores de β0 y β1 aparecen al final del resultado bajo la letra B. El método de ajuste a la recta es el de mínimos cuadrados. Una vez aceptada la hipótesis de linealidad y obtenida la recta que relaciona estas variables se debe validar el modelo y, una vez validado, utilizarlo para poder hacer predicciones. Para eso, en el mismo cuadro de diálogo donde hemos introducido las variables a estudiar, existe un botón Guardar a partir del cual sale una pantalla donde se deben seleccionar las opciones Valores pronosticados /Tipificados y Valores pronosticados/ No tipificados y, Residuos Tipificados Al final de los resultados el programa advierte que ha generado tres nuevas variables cuyos nombres y contenidos son: PRE_1: Valores pronosticados. Da la predicción puntual para un xi concreto a partir de la ecuación de la recta de regresión obtenida ZPR_1: Valores pronosticados tipificados. Aparecen los valores predichos estandarizados ZRE_1: Residuos tipificados. son los residuales de la regresión, es decir, la diferencia entre los valores de Y y los predicho a través de la recta también tipificados. Para validar el modelo analizado, ha de comprobarse si se cumplen las hipótesis que el procedimiento exige y que se han expuesto al principio: 1. La linealidad en la relación entre las variables: para ver si se cumple se puede generar un Diagrama de dispersión entre los ZPR_1 como variable independiente y los ZRE_1 como dependiente. Para verificar esta relación, los residuales deben fluctuar alrededor de la recta que corresponde a la media de los mismos y que debe de ser 0. 2. En cuanto a la igualdad de varianzas, este mismo gráfico puede servir para contrastar hasta qué punto esta hipótesis se viola. Si la variabilidad de los residuales se mantiene más o menos constante, se puede concluir que se cumple la hipótesis. 3. La normalidad puede estudiarse a través de los residuos. Los residuos deben ajustarse a una normal y para comprobarlo basta con construir un histograma con los mismos. Si a través de estas comprobaciones descubrimos que alguno de estos supuestos ha sido violado, no debemos utilizar la recta obtenida como ajuste a los datos porque el modelo no ha sido utilizado de manera correcta. Usualmente la transformación de variables, ya sea logarítmica, raíz cuadrada, recíproca…suele

Doc. Juan Roberto Morales Romero

23

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

ayudar a estabilizar la varianza, aumentar la aproximación de los datos a una normal o ajustar la relación a una función lineal.

3.3 Estimación de la curva Además del modelo lineal que acabamos de ver, dos variables pueden estar relacionadas a través de otras curvas: exponencial, logarítmica, polinómica,… Entrando en Analizar/Regresión/Estimación Curvilínea aparece un cuadro de diálogo donde hay que elegir la variable dependiente y la independiente y donde se puede seleccionar distintos modelos de curvas a las que ajustar los datos de las variables seleccionadas. Como resultado se obtendrá el R2 para cada modelo, el grado de significación del ajuste y los coeficientes b 0 , b 1 …entre otros. Para la selección del modelo más adecuado conviene fijarse en el nivel de significación y en el R 2 de cada modelo. A igualdad de condiciones, los modelos cuadráticos y cúbicos darán un R 2 superior al lineal por el simple hecho de estimar con más coeficientes. En cambio, si este incremento no es sustancial, no compensa trabajar con un modelo más complejo. Al igual que en la regresión lineal es interesante llevar a cabo un análisis detallado de los residuales y comprobar su aleatoriedad, normalidad…

4 TABLAS DE CONTINGENCIA Las tablas de contingencia sirven para contrastar la hipótesis de independencia entre dos características en las que se divide una población. Es decir, es una manera de ver si podemos admitir la existencia de relación o no entre esas dos características. Es de gran utilidad para establecer relaciones entre características cualitativas, donde no puede realizarse un análisis de regresión y correlación.

4.1 Formato de las tablas Entrando en Analizar/Resumir/Tablas de contingencia, aparece el cuadro de diálogo correspondiente al procedimiento de tablas de contingencia. En él hay que elegir la variable que formará las filas de la tabla y la que formará las columnas. En el botón Casillas…aparece otro cuadro donde se puede elegir:

Doc. Juan Roberto Morales Romero

24

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Frecuencias observadas y esperadas: Es decir, frecuencia observada o esperada de cada celda de la tabla. Porcentajes: Por fila, columna o sobre el total de la tabla. Residuos: No tipificados (diferencias entre las frecuencias observadas y las teóricas), Tipificados (esta diferencia entre la raíz cuadrada de la teórica) y Tipificados corregidos (la diferencia entre una estimación del error) En el botón Formato… podemos seleccionar: Orden de las filas: Ascendente o descendente. En el botón Estadísticos… obtenemos otro cuadro donde sólo nos fijaremos en: Chi-cuadrado: Valor de la chi cuadrado con sus grados de libertad y el nivel de significación obtenido.

4.2 Representaciones gráficas Entrado en Gráficos/Barras aparece un cuadro de diálogo donde vemos tres tipos de gráficos de barras, simples, agrupadas o apiladas. Además los datos pueden hacer referencia a resúmenes para grupos de casos, resúmenes para variables separadas y valores individuales. Clicando sobre el botón Definir se abre un cuadro de diálogo, donde se puede elegir lo que deben representar las barras: número de casos, número acumulado de casos, porcentaje, porcentaje acumulado… y también se elige la variable del eje de categorías. Esta representación gráfica, siempre da una idea de lo que observamos en el análisis de una tabla de contingencia.

Relación entre dos Variables

En muchas situaciones que se presentan a menudo en el campo de la ciencia, la ingeniería o las ciencias económicas nos encontramos con el problema de la relación entre dos variables numéricas. Por ejemplo, la relación entre la temperatura de un paciente y el número de pulsaciones por minuto o la relación

Doc. Juan Roberto Morales Romero

25

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

entre el costo de un producto y el costo de la mano de obra para fabricarlo. Muchas veces existen ecuaciones matemáticas que nos permiten calcular una variable conociendo el valor de otra de la cual depende. En general, cuando se nos presentan dos variables numéricas X e Y, podemos encontrar distintos tipos de relación entre ellas. Puede ocurrir que entre ellas no exista ningún tipo de relación. En tal caso, la variación de una de ellas no genera una variación correlativa en la otra. Variación correlativa significa que cada vez que X aumenta, Y debe aumentar si hay correlación positiva o cada vez que X aumenta, Y debe disminuir en caso de correlación negativa. Pero si cada vez que X varía, Y puede aumentar o disminuir al azar en cualquier grado y proporción, entonces significa que no hay ninguna correlación entre ambas:

Variable Y

Ninguna correlación 50 45 40 35 30 25 20 15 10 5 0 0

2

4

6

8

10

12

Variable X

Cuando hay una relación funcional entre X e Y, es decir Y=F(X), la correlación entre ambas es perfecta. Supongamos que medimos el valor de Y para un determinado valor de X, y que dicho valor de X lo podemos fijar con exactitud (En general, esto no va a ser cierto). La ecuación de la función nos da un valor de Y para ese valor de X. El valor de Y medido y el valor de Y calculado con la ecuación, en general, no van a coincidir. Si repitiéramos la medición de Y muchas veces para el mismo valor de X, tendríamos una serie de valores que son diferentes del valor calculado. Pero si seguimos este proceso, obtendremos una población de valores de Y cuyo promedio sí va a coincidir con el valor calculado. Es decir, la relación funcional expresada

Doc. Juan Roberto Morales Romero

26

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

por la ecuación matemática se cumple para los promedios de los X e Y medidos, porque la mediciones individuales están sujetas al error experimental o error de medición. Veámoslo con un ejemplo. Si dejamos caer una pelotita desde el borde de una mesa, la distancia que recorre desde el borde hasta tocar el suelo se puede calcular por medio de la ecuación siguiente:

Y = f (t) =

1 ⋅ g ⋅t2 2

g Aceleracion Gravitatoria

Hay una relación funcional no lineal entre la altura Y desde la cual cae la pelotita y el tiempo t que tarda en caer, expresada por la ecuación anterior. Si dejamos caer la pelotita midiendo con un cronómetro el tiempo que tarda en llegar al suelo y medimos también la distancia recorrida (la altura de la mesa), los valores resultantes de la medición seguramente no cumplen con esa relación. Esto lo podemos verificar reemplazando t en la ecuación por el tiempo obtenido con el cronómetro. El valor resultante Y seguramente no va a coincidir con nuestra medición de la altura de la mesa. Si repetimos esto muchas veces, las mediciones de tiempo y distancia realizadas en cada ocasión, en general, no van a cumplir la relación. Pero si promediamos todas la mediciones de tiempo y luego reemplazamos t en la ecuación por este promedio, la distancia calculada con la ecuación sí va a coincidir con el promedio de todas las mediciones de altura de la mesa. Entre las dos posibilidades extremas, la de no tener ninguna relación entre las variables y la de tener una relación funcional, hay infinitas situaciones intermedias, en las cuales hay un cierto grado de correlación entre ambas:

Doc. Juan Roberto Morales Romero

27

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Variable Y

Hay alguna correlación 50 45 40 35 30 25 20 15 10 5 0 0

2

4

6

8

10

12

Variable X

En muchos problemas prácticos de la industria y de la economía se trata de conocer en forma empírica la relación entre dos variables, de tal manera que si se tiene un valor de la variable X se pueda obtener por cálculo o en forma gráfica el valor de la variable Y, sin importar si existe una verdadera relación funcional entre ambas variables. Por ejemplo, supongamos que tenemos una grupo muy grande de personas de sexo masculino, de edad entre 30 y 40 años. Se nos presenta el problema de relacionar las variables peso y estatura, de tal manera que, conociendo la estatura en metros de un individuo del grupo, podamos calcular su peso en Kg. Entre ambas variables no existe una relación funcional. Esto lo vemos fácilmente si tomamos algunos individuos cuya estatura sea la misma, por ejemplo, 1,75 mts. y medimos el peso de cada una. Resulta claro que las mediciones van a ser diferentes, una pesará 73 Kg., otra 79 Kg., etc. y estas diferencias no se deben al error de medición, sino a diferencias reales en el peso de las personas:

Doc. Juan Roberto Morales Romero

28

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero Gráfico de peso vs. altura 130

Peso de personas de 1,75 mts.

120 Peso (Kg.)

110 100 90 80 70 60 50 40 1,60

1,70

1,80

1,90

2,00

2,10

Altura (mts.)

Quiere decir que para un determinado valor de la variable estatura podemos encontrar múltiples valores de la variable peso, lo cual niega la existencia de relación funcional. No obstante, existe un importante grado de correlación entre ambas variables, porque sabemos que a medida que aumenta la estatura de las personas dentro del grupo, el peso tiende a aumentar. ¿Cómo podemos hacer, entonces, para estimar el peso de una persona conociendo su estatura? Para ello, vamos a suponer un procedimiento hipotético: Tomamos del grupo un número muy grande de personas que miden exactamente 1,65 mts., las pesamos y promediamos los resultados. Repetimos el procedimiento para grupos que miden 1,70 mts., 1,75 mts., etc. y luego representamos gráficamente los promedios de peso en función de dichas alturas:

Doc. Juan Roberto Morales Romero

29

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero Regresión del peso sobre la altura 130 120 Peso (Kg.)

110 100 90 80 70 60 50 40 1,60

1,70

1,80

1,90

2,00

2,10

Altura (mts.)

La representación resultante se denomina Regresión del peso sobre la altura, y a la ecuación correspondiente Ecuación de Regresión. Una vez hecho esto, disponemos de una forma sencilla de estimar el peso de una persona del grupo conociendo la altura: con la misma entramos al gráfico y obtenemos el valor de Y correspondiente. Este valor Y es el promedio de los pesos de las personas del grupo que miden una altura X, y sólo nos sirve como una estimación (aproximación) del peso real de la persona cuyo peso deseamos conocer. También podemos utilizar la ecuación de regresión para calcular el peso. La forma de la representación gráfica puede ser una recta u otro tipo de curva. Cuando es una recta decimos que es una regresión lineal, y de ahora en mas nos referiremos a este tipo de regresiones. El procedimiento real para obtener la regresión utiliza un método que se conoce como Método de los Cuadrados Mínimos. Se toma una muestra aleatoria de personas del grupo que cubran todo el rango de alturas y a cada una se le mide el peso y la altura. Si representamos estos puntos en un gráfico, veremos que se agrupan aproximadamente alrededor de una recta imaginaria, que representa los puntos de la regresión. Parece lógico pensar que la recta de la regresión debe pasar muy cerca de los puntos experimentales (las mediciones que realizamos). Si hacemos pasar esta recta imaginaria por el punto correspondiente a uno de los individuos la estamos alejando, probablemente, de los otros puntos. Es decir que, la recta de regresión debe pasar a una distancia óptima de los puntos experimentales, de tal manera que esté lo mas cerca posible

Doc. Juan Roberto Morales Romero

30

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

de todos ellos. Esto es lo que se trata de hacer con el método de los cuadrados mínimos. Entonces, tenemos una serie de valores de la variable X, para cada uno de los cuales se mide la variable Y:

X

Y

X1

Y1

X2

Y2

X3

Y3

X4

Y4

X5

Y5

X6

Y6

etc.

La ecuación de la recta de regresión será de la forma:

Y R = a + bX Si ingresáramos en esta ecuación los valores X 1 , X 2 , X 3 , etc. obtendríamos los valores de Y de la regresión:

Y1 R , Y2R , Y3R , etc. Las diferencias entre estos valores calculados y los valores Y medidos se denominan residuos :

(Y (Y (Y

R

1 R 2 R 3

) −Y ) −Y ) − Y1 2

3

............... etc.

Doc. Juan Roberto Morales Romero

31

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Si elevamos las diferencias o residuos al cuadrado y sumamos estos cuadrados, obtenemos una cantidad denominada suma de cuadrados alrededor de la regresión:

∑ (Y

R

i

)

[

− Yi = ∑ (a + b ⋅ X i ) − Yi

]

De todas las rectas posibles que pasan por los puntos representados en el gráfico, la recta de regresión debe ser la que haga mínima esa suma de cuadrados. Observemos que en dicha suma de cuadrados conocemos los valores X i , Y i (Son la mediciones que realizamos) y deseamos conocer a y b, que son los coeficientes de la ecuación de regresión. Para obtenerlos se calcula el mínimo de la suma de cuadrados y de las ecuaciones resultantes se despejan las fórmulas de ambos coeficientes, que son como sigue:

b=

n∑ X i ⋅ Yi − ∑ X i ⋅ ∑ Yi n∑ X 2 −

(∑ X )

2

i

a = Y −b ⋅ X

donde

X=

∑X

i

n

Y=

∑Y

i

n

son los promedios de Xi e Y i respectivamente y n es el número de pares de observaciones X i , Y i . Ahora bien ¿Cómo podemos conocer cual es el grado de vinculación entre ambas variables? Para ello, calculamos el Coeficiente de Correlación, que es un número real entre 0 y 1 que nos da el grado de correlación entre dos variables X e Y. Cuando este coeficiente es 0, la correlación entre ambas variables no existe; cuando es 1, hay una correlación perfecta, es decir, tenemos una relación funcional entre ambas. El coeficiente de correlación es el cociente entre la Covarianza y las desviaciones standard de X e Y:

Doc. Juan Roberto Morales Romero

32

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

R=

Cov( X , Y ) = s X ⋅ sY

∑( X

∑( X

i

i

)(

− X ⋅ Yi − Y

−X

)

) ⋅ ∑ (Y − Y ) 2

2

i

Funciones Estadísticas del EXCEL La función ESTIMACION.LINEAL permite calcular los coeficientes de la recta de regresión lineal de un conjunto de datos X, Y. Veamos el siguiente ejemplo:

Los datos X, Y están en el rango A2:B13 de la planilla. Seleccionamos el rango D2:E2 para colocar los coeficientes de la recta de regresión. Luego tipeamos el signo igual, el nombre de la función

Doc. Juan Roberto Morales Romero

33

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Estimacion.Lineal y dentro de los paréntesis los parámetros. Los dos primeros parámetros son los rangos B2:B13 y A2:A13 donde se encuentran los valores de Y y X respectivamente. El tercer parámetro debe tomar el valor Verdadero si se desea que calcule la ordenada al origen (Falso en caso contrario). Y el cuarto parámetro debe tomar el valor Verdadero si se desean estadísticas adicionales como el coeficiente de correlación, sumas de cuadrados, etc. (Falso en caso contrario). Una vez ingresados los parámetros, se debe mantener oprimidas simultáneamente las teclas SHIFT y CTRL, y luego oprimir ENTER para ingresar la función. En la celda D2 aparecerá la pendiente y en E2 la ordenada al origen de la recta de regresión. Otra función relacionada es TENDENCIA, la cual es una función matricial que calcula la regresión lineal para una serie de puntos X, Y, pero en lugar de devolver los coeficientes de la regresión retorna los valores de Y calculados para una serie de valores de X que se le pasan como parámetros. Las funciones INTERSECCIÓN y PENDIENTE retornan la ordenada al origen y la pendiente para una serie de puntos X, Y. La función PRONOSTICO retorna el valor Y correspondiente a un valor X que se le da como parámetro, junto con una serie de puntos X, Y. La función COEF.DE.CORREL retorna el coeficiente de correlación entre dos conjuntos de valores X, Y. La función PEARSON retorna el mismo valor que COEF.DE.CORREL. PROMEDIO El EXCEL dispone de un conjunto muy completo de funciones que permiten realizar cálculos estadísticos. Estas funciones pueden utilizarse a través de 2 caminos. El primero consiste en ingresar la función en la barra de fórmulas, junto con los parámetros apropiados para el caso. El segundo camino es utilizar el asistente para funciones , el cual presenta una ventana para guiar al usuario en el ingreso de los parámetros necesarios. Vamos a ejemplificar ambos métodos con la función PROMEDIO. Supongamos que tenemos 5 números en el rango de celdas A1:A5 cuyo promedio deseamos obtener:

Doc. Juan Roberto Morales Romero

34

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

En primer término, nos situamos en la celda en la cual queremos colocar el promedio, en este caso, la celda A7. A continuación, tipeamos en la Barra de Fórmulas el signo igual, el nombre de la función, y entre paréntesis los parámetros necesarios, en este caso el rango A1:A5. Luego, con el mouse hacemos clic en el Cuadro de Introducción o presionamos ENTRAR. El promedio de los valores numéricos que se encuentran en

el rango A1:A5 aparecerá en la celda A7:

Doc. Juan Roberto Morales Romero

35

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero Si queremos utilizar el asistente para funciones, hacemos clic en el botón correspondiente al mismo y aparecerá una ventana para elegir la función que deseamos:

Con el mouse hacemos clic en Estadísticas y luego doble clic en PROMEDIO. En el paso siguiente aparecerá una ventana para ingresar los parámetros de la función:

Doc. Juan Roberto Morales Romero

36

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Ingresamos el rango donde están los valores, A1:A5 y hacemos clic en el botón Aceptar, con lo cual aparece el promedio calculado en la celda A7. Vamos a ver ahora como hacer para calcular una distribución de frecuencias a partir de un conjunto de observaciones. El Excel posee una función, que se llama FRECUENCIA, la cual genera una tabla con la distribución de frecuencias. Se trata de un función matricial, por lo que su forma de trabajar es diferente de las funciones comunes del Excel. Para ilustrar su uso, vamos a recurrir nuevamente a un ejemplo. Supongamos que tenemos un conjunto de datos en el rango A2:C11:

Doc. Juan Roberto Morales Romero

37

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

En una columna adicional construímos una serie de intervalos que cubran aproximadamente desde el valor mínimo hasta el valor máximo de nuestra población de datos. En nuestro caso, construímos intervalos de 5 unidades, desde 65 hasta 90 y los colocamos en el rango E2:E8. Luego seleccionamos con el Mouse un rango de celdas en la columna de la derecha, junto a los intervalos, pero con una celda más (F2:F9). A continuación, tipeamos en la barra de fórmulas el signo igual, el nombre de la función FRECUENCIA y dentro de paréntesis el rango donde están los datos de la población (A2:C11) y el rango de los intervalos (E2:E8), separados por punto y coma.

Doc. Juan Roberto Morales Romero

38

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

Una vez hecho esto, se mantienen oprimidas simultáneamente las teclas SHIFT y CTRL, y luego se oprime ENTER. En el rango de celdas seleccionadas aparecerá la distribución de frecuencias de la población. En la barra de fórmulas, la función aparece encerrada entre 2 llaves, debido a que se trata de una función matricial. Si se desea borrar la distribución de frecuencias, se deben seleccionar todas las celdas (F2:F9) y oprimir la tecla DELETE.

Doc. Juan Roberto Morales Romero

39

SPSS APLICADA A LA ESTADISTICA MANUAL AUTOINSTRUCTIVO Doc Juan Morales Romero

La función Frecuencia cuenta el número de observaciones menores o iguales que 65, mayores que 65 y menores o iguales que 70, etc. La celda adicional es para registrar el número de observaciones mayores que 95, que en este caso es 0. Las funciones VAR y VARP permiten calcular la varianza de una muestra y la varianza de una población respectivamente (Recordar la diferencia entre ambas fórmulas). Las funciones DESVEST y DESVESTP calculan la desviación standard de una muestra y la desviación standard de una población. La función DESVIA2 sirve para calcular una suma de diferencias entre el promedio de un conjunto de observaciones y las observaciones individuales, elevadas al cuadrado. Esta suma de cuadrados dividida por el número de grados de libertad nos da la varianza.

Doc. Juan Roberto Morales Romero

40

Doc. Juan Roberto Morales Romero

1