ANALISIS DESCRIPTIVO

UNIVERSIDAD MAYOR DE SAN ANDRÉS FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS CARRERA DE ADMINISTRACIÓN DE EMPRESAS TR

Views 188 Downloads 4 File size 909KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

ANALISIS DESCRIPTIVO

28 2 133KB Read more

ANALISIS DESCRIPTIVO CUANTITATIVO LLENADO.docx

87 1 579KB Read more

ANALISIS CUANTITATIVO DESCRIPTIVO

ANALISIS DESCRIPTIVO CUANTITATIVO (QDA) VICTOR ALFONSO COGOLLO BERROCAL YELENIS KARINA URANGO HOYOS CLAUDIA DENISE DI

58 0 146KB Read more

Ejemplo Analisis Descriptivo

54 0 395KB Read more

Segunda Entrega-Analisis Descriptivo

97 9 264KB Read more

analisis-estadistico-descriptivo

36 0 438KB Read more

Trabajo Analisis Descriptivo

75 0 944KB Read more

actividad analisis descriptivo

45 25 85KB Read more

Resumen Descriptivo

24 2 2MB Read more

Texto descriptivo

29 2 328KB Read more

Author / Uploaded
Pablo Mendoza

Citation preview

UNIVERSIDAD MAYOR DE SAN ANDRÉS FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS

CARRERA DE ADMINISTRACIÓN DE EMPRESAS

TRABAJO DE INVESTIGACIÓN

“SPSS”

“ANALISIS DESCRIPTIVO” ASIGNATURA: Tecnología de la Información y Comunicación DOCENTE:

Mg.Sc.Carlos Mullisaca Choque

UNIVERSITARIO: Mendoza Cardenas Pablo Emmanuel

FECHA:

1

04 / 0 1 / 16

Contenido ANALISIS DESCRIPTIVO ........................................................................................................................ 3 1. Media .......................................................................................................................................... 3 2. Mediana ...................................................................................................................................... 4 3. Moda ........................................................................................................................................... 4 Medidas de Dispersión - Varianza y Desviación .............................................................................. 4 1. Varianza ....................................................................................................................................... 5 2. Desviación Estándar o Típica ....................................................................................................... 5 MEDIDAS DE DISTIBUCIÓN - ASIMETRÍA Y CURTOSIS ......................................................................... 5 1. Asimetría ..................................................................................................................................... 6 ESCALAS DE MEDIDA ........................................................................................................................... 7 1. Nominal ....................................................................................................................................... 7 2. Ordinal ......................................................................................................................................... 7 3. Intervalo ...................................................................................................................................... 7 4. Razón ........................................................................................................................................... 7 b. Análisis Descriptivo de Acuerdo al Nivel de Medida ................................................................... 7 B.1. Variables Categóricas ............................................................................................................... 7 B.2. Variables de Escala ................................................................................................................... 8 GENERANDO ANÁLISIS DESCRIPTIVOS CON SPSS ............................................................................... 8 1. Frecuencias.................................................................................................................................. 9 OPCIONES DEL PROCEDIMIENTO FRECUENCIAS ................................................................................. 9 GRÁFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS..................................................................... 10 1. Gráfico de Barras ....................................................................................................................... 10 2. Gráfico de Sectores ................................................................................................................... 10 FORMATO DEL PROCEDIMIENTO FRECUENCIAS SPSS ...................................................................... 10 FRECUENCIAS PARA VARIABLES CATEGORICAS ................................................................................ 11 RESULTADOS - FRECUENCIAS CON VARIABLES CATEGÓRICAS ......................................................... 12 FRECUENCIAS PARA VARIABLES DE ESCALA...................................................................................... 13 RESULTADOS PROCEDIMIENTO DESCRIPTIVOS DE SPSS ................................................................... 15 BIBLIOGRAFÍA .................................................................................................................................... 16 Enlaces externos ............................................................................................................................ 16

2

ANALISIS DESCRIPTIVO Una de las principales funciones de la estadística consiste en la descripción de los datos; ya sea por medio de medidas (estimadores), gráficos o tablas en las que se puedan apreciar claramente el comportamiento y las tendencias de la información recopilada. SPSS cuenta con una serie de procedimientos para realizar esta labor, cada uno de los cuales nos ofrece diversas posibilidades y su aplicación depende de las características de la información que contenga cada variable. Antes de iniciar con el análisis descriptivo de datos a través de SPSS, es necesario aclarar algunos conceptos fundamentales de la estadística, los cuales son de vital importancia para la correcta interpretación de los resultados que ofrecen los diferentes procedimientos del paquete. Debemos recordar que la estadística es un sistema o método empleado en la recolección, organización, análisis e interpretación de los datos. Esta ciencia se divide en dos fases; la primera corresponde a la Estadística descriptiva, cuya finalidad es agrupar y representar la información de forma ordenada, de tal manera que nos permita identificar rápidamente aspectos característicos delcomportamiento de los datos. La segunda fase corresponde a la Estadística de Inferencia, la cual busca dar explicación al comportamiento o hallar conclusiones de un amplio grupo de individuos, objetos o sucesos a través del análisis de una pequeña fracción de sus componentes (Muestra). En este capítulo nos concentraremos exclusivamente en la Estadística Descriptiva y los procedimientos que la componen, como las medidas de tendencia central, medidas de distribución y las medidas de dispersión. Antes de conocer cada una de estas medidas es necesario resaltar la diferencia entre Población y Muestra. Se denomina Población al total de los elementos que componen un conjunto, el cual es el objeto de interés de un estudio. Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el total de los elementos que la componen o no. Generalmente es bastante difícil realizar un estudio con el total de la población, ya sea por que es demasiado grande, requiere demasiado tiempo para su análisis, los costos son muy elevados, se desconoce el total de elementos, etc. Por estas razones se suele sustraer una pequeña fracción de la población para realizar los análisis; de tal manera que las conclusiones que se extraigan sobre la fracción sean aplicables a la población. A esta fracción se le denomina Muestra y cada uno de los procedimientos estadísticos presentan algunas variaciones en sus ecuaciones de acuerdo si los datos representan muestras o poblaciones. Medidas tendencia central: Media Mediana y Moda Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir los datos (“Punto central”). Estas medidas aplicadas a las características de las unidades de una muestra se les denomina estimadores o estadígrafos; mientras queaplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población. Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda.

1. Media Ecuación 5-1 Cuando los valores representan una población la ecuación se define como:

Ecuación 5- 2 Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de lapoblación todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como

Ecuación 5-3 Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi) representa cada uno de los valores observados. Esta fórmula únicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicación de los diferentes valores por la frecuencia con que se encuentren dentro de la información; es decir,

Ecuación 5-4 Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual a la suma de las frecuencias de cada clase. Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretación se han generado tres rangos de edad los cuales se han establecido de 21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos

3

notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organización de estos datos se representan en la tabla [5-1].

Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si ha estos mismos resultados le aplicamos la ecuación para datos desagrupados (Ecuación 5-3), tomando como referencia cada uno de los valores individuales, obtendríamos que la media es igual a

Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34 años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los cálculos, principalmente al aumentar el número de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados. Es importante resaltar que existe una gran variedad de medias como la Media geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se recomienda a los lectores profundizar en estos temas.

2. Mediana Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula Ecuación 5-5 Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posición de la mediana sería:

Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería,

Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y medio, esnecesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusión la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará como resultado una de las posiciones de la serie ordenada;mientras que para las muestras con un número par de observaciones se debe promediar los valores de las dos posiciones centrales.

3. Moda La medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la modade los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce comomultimodal. En conclusión las Medidas de tendencia central, nos permiten identificar los valores másrepresentativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Moda nos indica el valor que más se repite dentro de los datos.

Medidas de Dispersión - Varianza y Desviación Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir,

4

nos indican cuanto se desvían las observaciones alrededor de su promedio aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. Las medidas de dispersión más importantes y las másutilizadas son la Varianza y la Desviación estándar (o Típica).

1. Varianza Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valoresrespecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:

Ecuación 5-6 Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:

Ecuación 5-7 Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviación, pero este valor se encuentra elevado al cuadrado.

2. Desviación Estándar o Típica Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería: Ecuación 5-8 Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es:

La varianza sería:

Por lo tanto la desviación estándar sería: Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.

MEDIDAS DE DISTIBUCIÓN - ASIMETRÍA Y CURTOSIS Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.

5

1. Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

El Coeficiente de asimetría, se representa mediante la ecuación matemática, Ecuación 5-9 Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan: (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5). (g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media. Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media. 2. CURTOSIS Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuación: Ecuacion 5-10 Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se interpretan: (g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). (g2 > 0) la distribución es Leptocúrtica (g2 < 0) la distribución es Platicúrtica Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente. La principal ventaja de la distribución normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estándar de la media aritmética (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviación y después le restamos a la media dos desviaciones, el 95% de los casos se encontraría dentro del rango que compongan estos valores. Desde luego, los conceptos vistos hasta aquí, son sólo una pequeña introducción a las principales medidas de Estadística Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadísticos. Las definiciones plasmadas en este capítulo han sido extraídas de los libros Estadística para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadística y Muestreo escrito por Ciro Martínez editorial Ecoe editores (Octava edición). No necesariamente tienes que guiarte por estos libros ya que en las librerías encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introducción a esta ciencia.

6

ESCALAS DE MEDIDA Para realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes estadísticos. La clasificación más convencional de las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervaloy Razón.

1. Nominal Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarle un valor a los hombres y otro diferente a las mujeres y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro.

2. Ordinal Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible.

3. Intervalo Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

4. Razón Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo deescala de medida. Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.

b. Análisis Descriptivo de Acuerdo al Nivel de Medida No todos los procedimientos estadísticos son realmente útiles para la totalidad de los niveles de medida. Cada uno de los tipos de medida posee ciertas características, las cuales debemos tener en cuenta en el momento de realizar un análisis descriptivo. encontrarás algunos de los procedimientos que resultan ventajosos en los análisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta tabla es sólo una muestra de las medidas que se pueden emplear; en algunos textos de estadística aparecen tablas más amplias y detalladas de los procedimientos.

Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los mismos procedimientos de análisis, por lo que se agrupan como variables categóricas. A partir de este punto cuando nos refiramos a las variables categóricas debemos recordar que se alude a las variables de tipo Nominal y Ordinal. Es importante resaltar que para los análisis descriptivos no hay una gran diferencia entre estos dostipos de variables, pero si existe diferencia en los análisis de Inferencia. Antes de conocer como se efectúan estos procedimientos en SPSS, es necesario exponer las razones por las que ciertos procedimientos no son de utilidad en algunos de los niveles de medida.

B.1. Variables Categóricas Para las variables que representan categorías o grupos de pertenencia, los principales procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son las frecuencias(Recuento), el Porcentaje, la Moda, en algunos casos la mediana y los gráficos más favorables son el de Sectores y el de Barras.

7

Para comprender mejor la razón de estos procedimientos vamos a realizar el análisis de la variable Género, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor uno (1) representa al género Femenino y el valor Dos (2) al género Masculino. Las frecuencias y sus respectivos porcentajes para esta variable serían los expuestos en la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central, obtenemos los resultados expuestos en la tabla [5-4]. Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos indica que en promedio los encuestados cuenta con un género de (1.2). Este resultado no posee una interpretación aplicable a la información de la variable, por lo que esta medida no es de utilidad en el análisis descriptivo. Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al género Femenino, pero si en vez de 10 valores tuviéramos únicamente dos (1 y 2), la mediana sería de (1.5), cuya interpretación no es aplicable a la información de la variable. La mediana se puede utilizar cuando estamos trabajando con variables que contienen un elevado número de categorías y su interpretación se debe manejar como un factor informativo para el investigador y no como una medida representativa en el reporte. Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la categoríacon mayor frecuencia dentro de la variable es la correspondiente al género Femenino. Las medidas de dispersión y distribución no son aplicables a este tipo de variables ya que sus ecuaciones nos permiten determinar como se comportan los datos respecto a un punto central o media. Si hallamos la desviación estándar para los datos del ejemplo, obtendríamos un valor de 0.42164, que nos indicaría que el promedio del género presenta una variación de ±0.42, cuyo resultado no sería aplicable a la interpretación de la variable.

B.2. Variables de Escala Este tipo de variables nos permite realizar análisis más profundos de los datos, aplicando una gran variedad de medidas. Al contrario de las variables categóricas en este tipo de variables las frecuencias no son de utilidad en los análisis descriptivos, debido a la gran cantidad de valores que suele tomar. Supongamos que realizamos un sondeo de edad con una muestra de 500 personas, si generamos una tabla de frecuencias obtendríamos fácilmente unos 60 o 70 rangos diferentes haciéndola muy extensa y poco informativa. Para las variables de escala son más informativas la medidas como la media, la mediana, la desviación estándar, la asimetría y otras más, a las cuales se les suele denominar Medidas de Resumen.

GENERANDO ANÁLISIS DESCRIPTIVOS CON SPSS SPSS nos ofrece varios procedimientos estadísticos para el análisis descriptivo de la información, algunos de los cuales, son de mayor utilidad de acuerdo al nivel de medida de cada variable (Categórica ó Escala). Paraconocer estos procedimientos vamos a utilizar el archivoAnálisis.sav incluido en la carpeta Capítulo5 del CD adjunto. Es importante resaltar que para poder ejecutar cualquier procedimiento de análisis es necesario tener el programa activo y contar con un archivo abierto; si no tienes el programa activo es necesario abrirlo mediante la ruta Inicio..Programas. SPSS For Windows…SPSS 12.0 para Windows. Una vez abierto, debemos cargar el archivo por lo que nos dirigimos al menú Archivo seleccionamos la opción Abrir... Datos, al aparecer la ventana de navegación ubicamos el archivo Análisis.sav en la unidad de CD-ROM y finalmente hacemos clic en Abrir. Debemos recordar que antes de generar un análisis, es importante hacer una depuración de los datos para evitar posibles errores de captura o digitación; en este caso el archivo se encuentra depurado, por lo que omitiremos este procedimiento. Todos los procedimientos estadísticos con que cuenta SPSS se encuentran ubicados en el menúAnalizar. Al hacer clic en él aparece una lista desplegable , en la cual se pueden observar los diferentes procedimientos con que cuenta el programa, como Informes, Estadísticos descriptivos, Tablas, Comparar medias, Modelo lineal general, Modelos mixtos, Correlación, Regresión, Loglineal, Clasificar, Reducción de datos, Escalas, Pruebas no paramétricas, Series temporales, Supervivencia,Respuestas múltiples, Análisis de valores perdidos y Muestras complejas. Esta última opción es exclusiva para la versión 12.0 y por lo tanto no aparece en las versiones anteriores del programa. El número de procedimientos que aparecen en este menú variará de acuerdo al número de módulos que se hayan licenciado; es necesario recordar que SPSS es un paquete modular y que es posible adquirir la licencia parcial de los módulos. Si nos fijamos, notaremos que la mayoría de los enunciados cuenta con una flecha ( ) al lado derecho, lo que nos indica que estas opciones son Submenús que contienen los estadísticos relacionados con el tema al que hace relación el nombre. Por el momento nos concentraremos en el submenúEstadísticos descriptivos. Dentro del submenú Estadísticos descriptivos, encontramos los procedimientos Frecuencias,Descriptivos, Explorar, Tablas de contingencia y Razón. Cada uno de ellos cuenta con un propósito específico

8

y su utilización depende del criterio del investigador y las necesidades del análisis. A continuación haremos un recorrido por los procedimientos principales del submenú Estadísticos descriptivos, tratando de explorar la mayoría de sus componentes.

1. Frecuencias Este procedimiento nos permite analizar de forma descriptiva las variables Categóricas o de Escala, mediante la generación de tablas de frecuencia, Gráficos y una amplia gama de estadísticos como las medidas de tendencia central, de Dispersión y de Distribución. Además nos permite organizar losresultados de forma ascendente o descendente ya sea por sus valores o sus frecuencias. Para emplear este procedimiento es necesario ir al menú Analizar, seleccionar el submenúEstadísticos descriptivos y escoger dentro de él la opción Frecuencias, con lo que aparecerá el cuadro de diálogo correspondiente. Este cuadro de diálogo se divide en cuatro secciones correspondientes a la lista de variables, la casilla de selección, las opciones de análisis y mostrar tablas de frecuencias. Como podemos apreciar las dos primeras secciones son comunes para la mayoría de los cuadros de diálogo de SPSS por lo que no haremos una explicación de ellos, en cambio nos enfocaremos en las dos secciones restantes. Dentro de las opciones de análisis encontraremos todos los estadísticos, los gráficos y las posibilidades de orden con que cuenta el procedimiento Frecuencias. Para escoger alguna de las opciones basta con hacer clic sobre ella, con lo que aparecerá el cuadro de diálogo correspondiente a la opción seleccionada. En la siguiente lección veremos detalladamente cada una de las partes del procedimiento Frecuencias.

OPCIONES DEL PROCEDIMIENTO FRECUENCIAS Para activar alguna de las opciones basta con hacer clicsobre ella, con lo que aparecerá el cuadro de diálogocorrespondiente a la opción seleccionada. Por el momento escogeremos la opción Estadísticos, por lo que hacemos clic en el botón Estadísticos de manera que aparezca el cuadro de diálogo correspondiente aFrecuencia En este cuadro encontramos las diferentes medidas estadísticas del procedimiento, como las medidas de tendencia central (Media, Mediana, Moda y Suma), medidas de posición no central (Cuartiles, puntos de corte y percentiles), medidas de dispersión (Desviación estándar, Varianza, Amplitud o rango, Mínimo, Máximo y el Error típico de la media) y medidas de distribución (Asimetría y Curtosis). Además encontramos una casilla en la cual podemos informarle al programa que los valores representan puntos medios de grupos; es decir, que los valores de la variable representan el punto medio de los datos agrupados. Dado que la mayoría de los estadísticos que comprende este cuadro de diálogo han sido explicados en los apartados anteriores, sólo haremos referencia a las medidas de posición no central. Estas medidas nos permiten conocer el valor que se encuentra o representa una posición específica dentro de los datos. Supongamos que contamos con 100 datos, cuyos valores varían entre 1 y 100; si le pedimos al paquete que nos indique el valor de los cuartiles, el programa nos enseñará los valores que se encuentren en las posiciones equivalentes al 25%, 50% y 75% de los datos, que para el caso serían los valores (25, 50 y 75) respectivamente. Por el contrario, los Percentiles nos permiten conocer los valores que se encuentran en un porcentaje específico de los datos; es decir, nos permite saber que valor se encuentra en la posición que nosotros deseemos conocer, sin importar si se trata de un porcentaje entero o fraccional (Ej:18.75, 19.25, 20, etc). Desde luego estas posiciones no deben superar la cifra de cien, ya que para su cálculo se toma la totalidad de los datos validos como el global del porcentaje; es decir, el 100%. Por último, encontramos la opción Puntos de corte para [XX] grupos iguales, en donde podemos pedirle al paquete que divida la información en un determinado número de grupos con igual porcentaje de casos. Esta opción nos ofrece como resultado los percentiles de corte (Porcentajes) de cada uno de los grupos y nos indica a su vez el valor que se encuentra en cada punto. La única restricción que presenta esta opción, corresponde a que el número máximo de grupos que podemos obtener es de 100. En conclusión las medidas de posición no central nos permiten identificar los valores que se encuentran en las posiciones o porcentajes que deseemos conocer, siendo las más empleadas losCuartiles (25%, 50% y 75%). La última elección que nos ofrece este nuevo cuadro corresponde a Los valores son puntos medios de grupos, con la cual le podemos especificarle al paquete que los datos recolectados en la variable han sido previamente agrupados y sus valores representan el punto medio de cada uno de los rangos agrupados. Debemos recordar que las ecuaciones de cada una de las medidas estadísticas difieren sí los valores son agrupados con anterioridad. Para emplear cualquiera de los estadísticos del procedimiento Frecuencias, sólo basta con activarlo haciendo clic sobre la casilla que se encuentra a la izquierda de cada medida, de manera que aparezca en ella un visto bueno ( ). Podemos seleccionar todos los estadísticos que deseemos, teniendo como única limitante el nivel de medida de cada variable. Por el momento, continuaremos con el recorrido de los diferentes elementos del procedimiento, por lo que no seleccionaremos ninguno de los estadísticos y en cambio hacemos clic en el botón Cancelar, con lo que volvemos al cuadro de diálogo Frecuencias.

9

La segunda opción del procedimiento frecuencias corresponde a Gráficos. Al hacer clic sobre el botón gráficos, aparece el cuadro de diálogo correspondiente a Frecuencias: Gráficos. En este cuadro encontramos los tres diferentes tipos de gráficos con que cuenta el procedimiento, como los son el gráfico de barras, el gráfico de sectores y el histograma. Además, a través de este cuadro podemos escoger si las porciones de los gráficos representan un recuento de los casos (Frecuencias) ó el porcentaje al que equivale. Por defecto el programa tiene activada la opción Ninguno. La sección valores del gráfico sólo se activa cuando se selecciona uno de los gráficos de barras o de sectores y a su vez la casilla decurva normal sólo se activa cuando se selecciona el Histograma [Fig.5-8]. Para comprender, la esencia de cada uno de estos métodos de representación gráfica, en la siguiente lección vamos a realizar una pequeña explicación de sus elementos y usos.

GRÁFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS 1. Gráfico de Barras Este tipo de gráfico nos permite identificar y comparar de forma visual el comportamiento de las categorías de una variable. Por medio de las barras podemos conoceraspectos de forma sencilla de una o varias variables, como lo pueden ser sus categorías, las frecuencias y las diferencias entre ellas. La estructura básica de un gráfico de barras, está basado en un eje de categorías generalmente el eje horizontal y un eje de frecuencias que en algunos casos puede ser remplazado por el porcentaje. Además se suelen utilizar diferentes colores para cada una de las categorías facilitando el reconocimiento por parte del usuario. Los gráficos de barras también son útiles para comparar varias variables a la vez [Fig.5-10]. Este tipo de opciones implica una serie de técnicas como la anidación y la agrupación las cuales serán expuestas en el capítulo siete.

2. Gráfico de Sectores Los gráficos de sectores o de torta nos permiten observar la variable de forma global haciendo una comparación inmediata del porcentaje o la frecuencia del total de las categorías de una variable. Su utilidad radica en la facilidad para interpretar la información contenida en una variable mediante la representación grafica de los resúmenes (Porcentajes o Frecuencias). La estructura básica de los gráficos de sectores [Fig.5-11], esta definida por un círculo en el cual se representan cada una de las categorías por la porción o fracción correspondiente al porcentaje o la frecuencia. En algunas ocasiones suelen separarse las fracciones, con el fin de hacer más clara la información. 3. Histograma Los histogramas nos permiten identificar diversos parámetros como la dispersión, la distribución y la concentración de los datos en una variable de Escala. Este tipo de gráficos generan una representación visual del comportamiento de los datos, permitiendo observar rasgos característicos como la zona o rango de mayor concentración, la amplitud, los valores extremos, etc. La estructura básica de un histograma , esta basada en rangos, los cuales suelen ser representados por barras cuya altura es determinada por la cantidad de valores que se encuentren dentro de los límites de cada rango (Frecuencia). Generalmente se utiliza el Eje vertical para representar las frecuencias y el Eje horizontal para los rangos; adicionalmente se puede sobreponer una Curva Normal con el fin de comparar si los datos tienden a distribuirse de forma uniforme. En resumen cuando se trabaja con variables categóricas (Nominal u Ordinal), los gráficos másindicados y representativos en su análisis descriptivo corresponden a los gráficos de Barras y los deSectores; por el contrario si se trata de una variable de Escala el gráfico más apropiado es elHistograma. Dado que por el momento sólo estamos haciendo un recorrido por las opciones del procedimientoFrecuencias, no seleccionaremos ninguno de los gráficos y en cambio hacemos clic en el botónCancelar, con lo cual volvemos al cuadro de diálogo principal del procedimiento. En la siguienteleccion conoceremos la ultima opcion del procedimiento Frecuencias denominada Formato.

FORMATO DEL PROCEDIMIENTO FRECUENCIAS SPSS La última opción que encontramos en la ventana del Procedimiento Frecuencias de SPSS corresponde aFormato; al hacer clic sobre el botón aparece el cuadro de diálogo correspondiente a Frecuencias: En este cuadro encontramos las seccionesOrdenar por, Múltiples variables y Suprimir tablas.

10

A través de la sección Ordenar por, podemos organizar los resultados del procedimiento (Tablas y Gráficos) por los valores ó por las frecuencias, ya sea de forma ascendente o descendente. Cuando seleccionamos la opción Valores, los resultados se organizaran de acuerdo al número que se le hayaasignado a cada categoría dentro de las propiedades de variable; si por el contrario escogemos laopción frecuencias los resultados se ordenaran de acuerdo al número de apariciones de cada una de las categorías de las variables seleccionadas. La segunda sección del cuadro corresponde a Múltiples variables; en donde encontramos las opciones Compara variables y Organizar resultados según variables. Si seleccionamos la primeraopción, los resultados se agruparán de acuerdo con las variables; es decir, primero nos enseñaran las tablas de frecuencia de todas las variables (Una tabla por cada variable), después organiza los estadísticos de cada variable y por último nos enseña los gráficos. En resumen esta opción nos permite agrupar los resultados de todas las variables por cada uno de los procedimientos (Frecuencias, Estadísticos y Gráficos). Si por el contrario seleccionamos laopción Organizar resultados según variables, el programa nos enseña todos los resultados de cada variable antes de mostrar los resultados de la siguiente; es decir, nos enseña la tabla de frecuencias, los estadísticos y el gráfico de la primera variable, a continuación nos enseña los resultados de la segunda y así sucesivamente hasta terminar con cada una de las variables seleccionadas. La última sección que encontramos en el cuadro, pertenece a la opción Suprimir tablas con más de n categorías, con la cual podemos pedirle al paquete que no realice las tablas de frecuencia a las variables qué cuenten con cierto número de categorías, dándonos la oportunidad de especificar el limite de categorías que deseamos introduciendo el valor en la casilla Número máximo de categorías. Para continuar con el recorrido no seleccionaremos ninguna de las opciones y en su lugar hacemosclic en el botón Cancelar con lo que volveremos al cuadro de diálogo principal del procedimientoFrecuencias. Por último, aparece la sección corresponde a la opción Mostrar tablas de frecuencias , la cual nos permite escoger si deseamos que las tablas de frecuencia se incluyan en los resultados o por el contrario sean omitidas. Esta opción se desactiva cuando queremos realizar análisis descriptivos a las variables de escala, ya que por lo general sus tablas de frecuencia suelen contener un gran número de valores haciéndolas extensas y poco útiles. Desde luego es apenas logico que una tabla que nos informa que dentro de los encuestados aparecen 20 con 18 años de edad, 32 con 19 años de edad y así sucesivamente hasta llegar al valor máximo, no es de gran utilidad. Para facilitar la interpretación de este tipo de información es mejor crear una nueva variable y codificar estas edades dentro de rangos y sucesivamente realizar la tablade frecuencias a esta nueva variable de edad categorizada. Para comprender todos los conceptos y elementos que componen el procedimiento frecuencias, en las siguientes lecciones vamos a realizar a manera de ejemplo el análisis de las variables categóricas estado civil (estciv variable Nominal) y Nivel de educación (niveduc variable Ordinal) y posteriormente realizaremos el análisis de las variables de escala Edad del encuestado (Edad) y Años de educación (educ).

FRECUENCIAS PARA VARIABLES CATEGORICAS Dado que el procedimiento frecuencias genera los mismos resultados (Estadísticos, Tablas y Gráficos), para la totalidad de las variables seleccionadas, sin importar sí son Categóricas o de Escala y que a su vez, estos dos tipos de medida emplean parámetros distintos en el análisis descriptivo; es indispensable realizar losanálisis de las variables categóricas antes que el de las variables de escala, con el fin de optimizar losresultados, seleccionando exclusivamente los elementos más apropiados para cada tipo de medida. Una vez seleccionado el procedimiento Frecuencias y estando activo el cuadro de diálogo principal, podemos empezar con el análisis descriptivo. Lo primero que debemos realizar es seleccionar las variables de interés (para el caso ESTCIV yNIVEDUC), por lo que nos dirigimos al listado de variables, las ubicamos y sucesivamente las llevamos hasta la casilla de selección , ya sea haciendo doble clic sobre ellas o a través delbotón flecha ( ). Después de haber seleccionado las variables debemos especificarle al programa los procedimientos que deseamos realizar en el análisis para lo que hacemos clic en el botónEstadísticos... de manera que aparezca el cuadro de diálogo correspondiente , en donde seleccionamos las medidas Mediana y Moda. Después de seleccionar las medidas estadísticas hacemos clic en el botón Continuar con lo que volvemos al cuadro principal del procedimiento Frecuencias. Para continuar seleccionamos el botónGráficos con lo que aparece el cuadro de diálogo respectivo; a través de este cuadro seleccionaremos la opción Grafico de barras, teniendo en cuenta definir en la sección valores del gráfico la opción frecuencias y posteriormente hacemos clic en el botón Continuar, con lo que volvemos al cuadro de diálogo Por último activamos el botón Formato con lo que aparece el cuadro de dialogo correspondiente [Fig.5-18], en donde seleccionamos las opciones Valores ascendentes y Comparar variables. Una vez activadas estas opciones, hacemos clic en el botón Continuar con lo que volvemos al cuadro

11

de diálogo principal del procedimiento Frecuencias. Hasta este momento todo lo que hemos hecho es pedirle al programa que nos realice las tablas de frecuencia de las variables ESTCIV y NIVEDUC, así como las medidas de tendencia central Medianay Moda, un gráfico de barras para cada una de ellas y que organice los resultados de acuerdo a los valores que se establecieron en las propiedades de las variables, asi como que exponga losresultados de forma comparativa; es decir, nos enseñe las tablas de frecuencia de las dos variables y sucesivamente los gráficos. Para finalizar y observar los resultados debemos hacer clic en el botónAceptar con lo que los efectos del procedimiento aparecen en el visor de resultados. En la siguiente leccion detallaremos los resultados que genera SPSS al procedimiento Frecuencias con variables Categoricas.

RESULTADOS - FRECUENCIAS CON VARIABLES CATEGÓRICAS Por defecto SPSS nos enseña el nombre del procedimiento (en este caso Frecuencias) y losresultados del mismo, en donde encontraremos las tablasde estadísticos, las tablas de frecuencia y por último los gráficos. Dentro de las tablas de estadísticos [Fig.5-20] se incluye un resumen de los valores validos que se encontraron dentro de los datos de cada una de las variables (ESTCIV y NIEVEDUC), así como los valores de cada uno de los estadísticos que se le hayan solicitado al procedimiento, que para el caso corresponden a la Mediana y la Moda. Después de la tabla de estadísticos e información, aparecen las tablas de frecuencia. Por defecto SPSS incluye dentro de los resultados de una tabla de frecuencia cada una de las categorías de la variable con sus respectivos estimadores como Frecuencias, Porcentajes, Porcentajes validos(el porcentaje valido representa el resultado de dividir la frecuencia de la categoría sobre el número total de valores validos) y el Porcentaje acumulado (es el resultado de la suma del porcentaje valido de las diferentes categorías de la variable). Si nos fijamos en la tabla de frecuencias correspondiente a la variable Nivel de educación (Niveduc), notaremos que aparece una ligera diferencia entre los valores del Porcentaje y el Porcentaje valido, esta variación se ocasionada debido a que dentro de los datos de la variable se encuentran cuatro (4) valores que han sido declarados como perdidos en las propiedades de la variable. En este ocasión los valores identifican a los casos en los que no fue posible obtener una respuesta coherente por parte de los entrevistados (NR). La diferencia en los valores se presenta debido a que el porcentaje es calculado mediante la división de la frecuencia sobre el número total de casos (para el ejemplo n= 300), mientras que el porcentaje valido se calcula a través de la división de la frecuencia sobre el número total de casos validos (para el ejemplo n= 296). Por ejemplo, si calculamos el porcentaje y el porcentaje valido para la categoríaPrimaria obtenemos:

Ahora, si observamos en la parte inferior de la tabla de frecuencias de la variable Niveduc, notaremos la existencia de dos totales; el primero de ellos (enmarcado en azul) corresponde a los valores validos, mientras que el segundo (enmarcado en café) pertenece al colectivo de los valores encontrados dentro de la variable. La utilidad de los totales radica en la información que nos brinda acerca del número de casos de la variable y el número de casos con respuestas validas. Por último, aparecen en el visor de resultados los gráficos de cada una de las variables. Por defecto SPSS genera los gráficos de cada una de las variables ubicando en el eje Vertical (eje Y) el recuento o frecuencia y ubicando en el eje Horizontal (eje X) las categorías; así como el nombre de la variable a la que corresponde el gráfico. Si nos fijamos en los gráficos, notaremos que las categorías más sobre salientes son Soltero y Secundaria respectivamente. SPSS nos permite modificar algunos de los parámetros de cada uno de los gráficos como lo puede ser la forma de las barras, el color, la trama de relleno, la organización, etc. Por el momento no profundizaremos en estos temas ya que serán explorados con mayor profundidad en él capítulo 7. En conclusión el procedimiento Frecuencias al ser utilizado en el análisis de variables categóricas(Nominal u Ordinal), nos permite identificar los parámetros más representativos como lo son el numero de categorías, las

12

frecuencias de cada categoría y la representación gráfica de los datos, la cual puede ser expresada ya sea mediante un gráfico de barras o de sectores. Además es necesario aclarar que los procedimientos que se especifiquen, se realizarán con todas las variables que se hallan seleccionado, sin importar el tipo al que corresponda, por lo que es recomendable realizar primero los análisis a las variables categóricas y posteriormente a las deescala. En la siguiente leccion haremos un ejemplo del procedimiento Frecuencias con Variables deEscala.

FRECUENCIAS PARA VARIABLES DE ESCALA Al contrario del análisis descriptivo de las variables categóricas, cuando trabajamos con variables de escalalas tablas de frecuencia o recuento no son información práctica debido a la gran cantidad de valores o rangos que se pueden encontrar en las variables de este tipo. Para comprender el procedimiento que se debe realizar con las variables de Escala, vamos a realizar el análisisdescriptivo de las variables Edad del encuestado (Edad) y Años estudiados (Educaño). Si aun te encuentras en el visor de resultados, puedes volver al cuadro de dialogo de Frecuencias haciendo clicen el botón Recuperar cuadro de diálogo y seleccionando el procedimiento frecuencias como se muestra. De lo contrarios es necesario volver al menú Analizar.. Estadísticos descriptivos.. Frecuencias. Una vez que hemos abierto nuevamente el cuadro de diálogo del procedimiento Frecuencias, hacemos clic en el botón Restablecer con lo que todas las opciones seleccionadas anteriormente se desactivarán. Al igual que con las variables categóricas, lo primero que debemos efectuar es definir las variables a las que le realizaremos el análisis, que en nuestro caso son Edad y Educaños, por lo que debemos ubicarlas en la lista de variables y llevarlas a la casilla de selección, ya sea haciendo doble clic sobre ellas o a través del botón flecha ( ); posteriormente debemos desactivar la opciónMostrar tablas de frecuencias, con lo que aparecerá el mensaje. Ha desactivado todos losresultados. A menos que solicite Mostrar tablas de frecuencias, Estadísticos o Gráficos, FRECUENCIAS no generará ningún resultado. Este mensaje se debe a que por defecto el procedimiento Frecuencias sólo realiza las tablas de frecuencia y a menos que se le especifique opciones como los estadísticos o los gráficos, no producirá ningún resultado. Al hacer clic en Aceptar se desactivará la opción Mostrar tablas de frecuencia con lo que garantizamos que sean excluidas de los. Para comprobar que han sido desactivadas las tablas de frecuencia, debemos fijarnos en la casilla de selección que aparece al costado izquierdo de la opción y notar que haya desaparecido el visto bueno ( ). Ahora que desactivamos las tablas de frecuencias, le pediremos al procedimiento que nos genere los estadísticos correspondientes a las medidas de dispersión, medidas de posición central y las medidas de distribución, para lo cual hacemos clic en el botón Estadísticos. Al aparecer el cuadro de diálogo seleccionaremos los diferentes parámetros. De las medidas de posición no central escogemos únicamente los Cuartiles (Porcentajes 25, 50 y 75); adicionalmente, en las medidas de posición central seleccionamos la Media, la Mediana y laModa; a su vez, en las medidas de distribución seleccionamos la Asimetría y la Curtosis y por último en las medidas de dispersión activamos la Desviación típica, la Varianza, la Amplitud, el Máximo, elMínimo y el error típico de la media. Debemos recordar que para poder establecer si una medida ha sido activada, debe aparecer en la casilla de selección ubicada al costado izquierdo de la medida un visto bueno ( ). Después deseleccionar correctamente cada una de las opciones hacemos clic en el botón Continuar con lo que volvemos al cuadro de diálogo principal. Una vez especificados los estadísticos debemos definir el tipo de gráfico que deseamos obtener, para lo que hacemos clic en el botón Gráficos, de tal manera que aparece el cuadro de diálogo correspondiente a Frecuencia: Gráficos En este cuadro seleccionaremos la opción Histogramas y seguido activamos la opción Con curva normal, para que le sea sobrepuesta una curva normal a la representación gráfica de los datos. Una vez seleccionadas las opciones hacemos clic en Continuar con lo que volveremos al cuadro de diálogo principal del procedimiento Frecuencias. En la siguiente leccion continuaremos definiendo las opciones del procedimiento y veremos losresultados del procedimiento Frecuencias en variables de Escala. Resultados - Frecuencias con variables de Escala Por último activamos el botón Formato con lo que aparece el cuadro de diálogo correspondiente Note como las opciones de la sección Ordenar por no se encuentran activas, esto se debe a que estas opciones sólo son aplicables a las tablas de frecuencia. Si nos fijamos en la sección Múltiples variables, notaremos que sus dos

13

opciones se encuentran disponibles; si eligiéramos la opción Organizar resultados según variables, el programa generaría una tabla de estadísticos y un histograma para cada una de las variables. Por el momento reuniremos todos los estadísticos en una sola tabla por lo que mantendremos laopción por defecto del programa (Compara variables). Para proseguir hacemos clic en Continuar,volviendo al cuadro de diálogo principal. Después de definir todas las propiedades del procedimiento, hacemos clic en Aceptar con lo que se realizarán los cálculos y los efectos son expuestos en el visor de resultados de SPSS. Si nos fijamos en los resultados, notaremos que las tablas de frecuencias no fueron incluidas, además los estadísticos de las dos variables son expuestos en la misma tabla y se realiza un histograma por cada una de las variables e incluyen una curva de normalidad sobre puesta. Si nos fijamos en la tabla de estadísticos [Fig.5-29], notaremos que aparece en la parte superior de la tabla una pequeña descripción de los valores validos y perdidos de cada una de las variables seleccionadas (Edad del encuestado y Años estudiados). Al observar el valor correspondiente a la variable Años estudiados, notamos que aparecen 296 valores validos y 4 perdidos. Después de la información de las variables, aparecen todos los estadísticos que le pedimos al procedimiento. Para facilitar la interpretación, hemos resaltado en la tabla las diferentes medidas tratando de agruparlas de acuerdo a sus características. Por defecto el programa ubica a continuación del resumen de los datos, las medidas de tendencia central (Media, Mediana y Moda); además, incluye el Error típico de la media. Si nos fijamos en las medidas de distribución (Asimetría y Curtosis), notaremos que el programa por defecto adiciona los Errores típicos de estas medidas. El Error típico es una disposición de ajuste, la cual nos informa que estas medidas pueden variar entre el rango de más o menos el error típico ((Asimetría = -.179 ± .141); es decir, la asimetría va desde -.320 hasta -.038). Entre mayor sea elvalor de error, mayor será la variación de los datos. De igual manera, se puede emplear el valor del error típico con la Curtosis y la Media. Si ahora nos fijamos en los gráficos [Fig.5-30], notaremos que cada uno de ellos cuentan con las mismas características de los gráficos de barras utilizados en las variables categóricas; es decir, las frecuencias se ubican en el eje vertical (Eje Y) y los rangos en el eje horizontal (Eje X). Además, este tipo de gráficos incluye otros datos como la Media, la Desviación típica y el número de respuestasvalidas quien es representado por la letra ene (N); así mismo se incluye una curva normal para identificar la distribución de los datos. Estas gráficas son particularmente útiles ya que con ellas podemos saber si los datos se agrupan en un punto específico o si por el contrario su agrupación no es constante, por lo cual se suelen presentar una elevado número de rangos. Debemos recordar que los histogramas son un apoyo visual a los resultados matemáticos y que su función es generar una idea visual del comportamiento de los datos. A pesar que los resultados obtenidos mediante el procedimiento Frecuencias son bastante claros y útiles, SPSS cuenta con otro procedimiento mucho más eficiente para el análisis descriptivo de los datos en las variables de escala, cuyos resultados son más precisos. Este procedimiento es definido bajo el nombre de Descriptivos y su aplicación esta restringida al uso exclusivo de las variables deEscala. Procedimiento Descriptivos de SPSS El procedimiento Descriptivos muestra estadísticos de resumen univariados para varias variables en una únicatabla y a su vez, cálcula valores tipificados (puntuaciones z). Las variables se pueden ordenar por el tamaño de sus medias (en orden ascendente o descendente), alfabéticamente o por el orden en el que se seleccionen las variables (el valor por defecto). Cuando se guardan las puntuaciones z, éstas se añaden a los datos del Editor de datos y quedan disponibles para los gráficos, el listado de los datos y los procedimientos análisis. Cuando las variables se registran en unidadesdiferentes (por ejemplo, producto interior bruto per cápita y porcentaje de alfabetización), una transformación de puntuación z pondrá las variables en una escala común para poder compararlas visualmente con más facilidad. Desde luego, estos parámetros (Puntuaciones z), son útiles únicamente en el análisis de inferencia de la información. Para comprender los alcances del procedimiento Descriptivos, vamos a generar un ejemplo con las variables Edad del encuestado (Edad) y Años estudiados (Educaños). Para activar el procedimientodebemos ir al menú Analizar.. Estadísticos descriptivos y seleccionar la opción Descriptivos, al hacer clic sobre ella aparece el cuadro de diálogo Este cuadro tiene una gran semejanza con el empleado en el procedimiento frecuencias, con la diferencia que solo cuenta con un botón de opción y además nos ofrece la posibilidad de guardar los valores tipificados como variables para lo cual crea y guarda una variable de puntuaciones-z para cada variable seleccionada. Se crean nuevos nombres de variable anteponiendo la letra z a los primeros

14

siete caracteres del nombre original de la variable, por el momento no profundizaremos en este tema ya que su aplicación esta definida para el análisis inferencial de los datos. Al igual que en la mayoría de los cuadros de diálogo de los diferentes procedimientos del paquete, lo primero que debemos hacer es ubicar las variables de interés en el listado de variables y posteriormente llevarlas hasta la casilla de selección. Una vez definidas las variables hacemos clic en el botón Opciones con lo que aparecerá el cuadro de diálogo correspondiente En este cuadro encontraremos todas las medidas del procedimiento, así como también las opciones de orden. Por defecto el programa mantiene seleccionadas las opciones Media, Desviación típica, Mínimo y Máximo, así como el orden de visualización de acuerdo a la lista de variables. Para el ejemplo utilizaremos estas medidas pero además le solicitaremos la varianza, la amplitud, el error típico de la media, la Curtosis y la asimetría, de manera que el cuadro se vea como la Una vez seleccionadas las opciones hacemos clic en el botón Continuar con lo que volveremos al cuadro de diálogo principal. Para finalizar hacemos clic en el botón Aceptar con lo que se realizan los cálculos de las medidas y las conclusiones son expuestas en el visor de resultados de SPSS .Por defecto, el programa genera una sola tabla en la que incluye los resultados de todas las variables seleccionadas. Si nos fijamos en los resultados notaremos que la tabla se extiende en forma horizontal debido a que ahora las variables se ubican en las filas y los estadísticos en las columnas, lo cual nos impide observarla en su totalidad, para poder tener una mejor comprensión de los resultados, en la siguiente leccion vamos a cambiar el eje en el que se encuentran cada uno de los factores, es decir vamos a ubicar las variables en el eje vertical y los estadísticos en el eje horizontal, con lo que podremos mejorar la percepción de los resultados.

RESULTADOS PROCEDIMIENTO DESCRIPTIVOS DE SPSS Dado que los resultados de la tabla no se pueden apreciar fácilmente, vamos a emplear las propiedades interactivas de los resultados de SPSS para modificar su forma, con el fin de aclarar su interpretación. Para realizarlo, debemos activar primero la tabla haciendo doble clic sobre ella, de modo que aparezca a su alrededor un marco de líneas entrecortadas y a su vez, se presente la barra de herramientas de formato [Fig.536]. Una vez surge la barra de herramientas, hacemosclic en el botón Controles de pivote ( ), ubicado al costado izquierdo de barra.

Si por algún motivo no aparece la barra de herramienta, SPSS nos ofrece la posibilidad de abrir los controles de pivoteado a través del menú desplegable. Para realizarlo, basta con hacer clic derecho sobre la tabla, con lo que surgirá el menú Una vez se activa el menú, ubicamos en él laopción Paneles de pivoteado y sucesivamente hacemos clic sobre ella, de modo que emerja el cuadro de pivoteado. Por defecto el programa ubica las variables en la dimensión de las Filas, mientras que los Estadísticos y el Tipo de estadístico lo ubica en la dimensión de las Columnas. El parámetro tipo de estadístico hace referencia si se trata del estadístico o por el contrario se trata de su corrección (Error típico). Si ubicamos el puntero del ratón sobre cualquiera de los iconos, aparecerá una pequeña leyenda informativa sobre el parámetro al que representa. Continuando con el ejemplo, intercambiaremos en el panel de pivotado los parámetros que se encuentran en las Filas con los que se encuentran en las Columnas. Para lograrlo, debemos hacer clic sobre los iconos representativos de cada parámetro ( ) y manteniéndolo oprimido lo arrastramos hasta ubicarlo en el eje deseado, en donde soltamos el clicde manera que el icono se incrusta de forma fija en la nueva coordenada. Este proceso se debe realizar con cada uno de los parámetros de la tabla, que para este ejemplo corresponden en las columnas (Estadísticos y tipo estadístico) y en fila (Variables) Es de gran importancia mantener el orden estricto de las variables ya que de lo contrario obtendremos un formato de tabla distinto; para evitar este inconveniente es necesario ubicar el parámetro Estadístico antes que el parámetro Tipo de estadístico. Estos temas serán explorados a profundidad en el capítulo 8, por lo que no haremos una explicación más amplia de los elementos. Una vez realizado el cambio de coordenadas para cada uno de los parámetros, obtendremos como resultado la tabla ordenada en forma vertical, con las variables en las Columnas y los estadísticos en las Filas. Para finalizar el pivotado basta con hacer clic en la parte externa de la tabla.

15

Si nos fijamos en la tabla observaremos que los resultados son muy similares a los obtenidos con el procedimiento Frecuencias, con la diferencia que a través del procedimiento Descriptivos se incluyen de forma automática para todas las medidas los errores típicos (sí existen). Si observamos las etiquetas de las columnas, notaremos que aparece cada una de las variables (Edad del encuestado y Años estudiados), pero además se anexa la columna N válido (según lista), la cual identifica los valores validos para las dos variables. Para calcular este valor, el programa exime los valores perdidos de las dos variables, dado que en este caso los Años estudiados es la única variable que cuenta con valores perdidos, el programa sólo exime los cuatro valores perdidos de esta variable. Por otro lado, si observamos las filas notaremos que cada una de las medidas define una fila y a su vez cada medida incluye el valor del estadístico y el valor del error típico. Por último notaremos que este procedimiento no realiza ningún tipo de gráfico de forma automática, lo que nos implica que si deseamos obtenerlo, es necesario realizarlo mediante los procedimientos gráficos con que cuenta SPSS. Si por algún motivo llegamos a encontrarnos con un termino estadístico dentro de los resultados que desconozcamos o sencillamente no recordemos, SPSS nos permite obtener información referente a ellos simplemente haciendo doble clic sobre la tabla de forma que se active el recuadro; una vez activo hacemos clic derecho sobre el termino que deseamos conocer, de modo que aparezca el menú desplegable y posteriormente seleccionar dentro de el menú la opción Asesor deresultados con lo cual aparecerá una nueva ventana del Tutorial, en donde encontraremos una leyenda que nos informa su significado Debemos recordar que este sistema de ayuda esta basado en ventanas múltiples lo cual nos garantiza que obtendremos diversa información acerca del elemento deseado. Para poder explorar la mayoría de las ventanas de esta ayuda, debemos emplear los botones que aparecen al costado inferior derecho; para avanzar de página debemos hacer clic en el botón Siguiente (

); si

por el contrario deseamos devolvernos una página, entonces debemos oprimir el botón Anterior (

). A

través del botón Índice (

) regresaremos a la tabla de contenido del sistema de ayuda y a su vez con el

botón Buscar ( ), podemos ubicar una palabra en los diferentes contenidos de la ayuda. En conclusión el procedimiento Descriptivos nos permite obtener los estadísticos de resumen para varias variables de escala, agrupando los resultados en una sola tabla, con la ventaja que nos permite obtener y guardar los valores tipificados (puntuaciones z), lo cual es de gran utilidad para los análisis de inferencia. Su principal desventaja radica en el reducido número de estadísticos que podemosseleccionar, así como en la imposibilidad de generar un gráfico con el procedimiento.

BIBLIOGRAFÍA Pardo, A. y Ruiz, M. A. (2002). SPSS 11. Guía para el análisis de datos. Madrid: McGrawHill. ISBN 9788448137502. Enlaces externos Página Principal SPSS - Página de soporte que incluye una base de datos de soluciones Raynald Levesque's SPSS Tools - Biblioteca de archivos para programadores de SPSS (FAQ, command syntax; macros; scripts; python) Archives of SPSSX-L Discussion - SPSS Listserv activa desde 1996. Discusses programming, statistics and analysis UCLA ATS Resources to help you learn SPSS - Recursos para aprender SPSS UCLA ATS Techical Reports - El Reporte 1 compara Stata, SAS y SPSS con R (R es un lenguaje y ambiente de trabajo para cálculo estadístico y graficación). Using SPSS For Data Analysis - Tutorial del SPSS elaborado en Harvard SPSS Developer Central - Soporte para desarrolladores de aplicaciones usando SPSS, incluye materiales y ejemplos de Pythonprogrammability feature SPSS Wiki - Un wiki con estadísticos del SPSS SPSS Log - Un blog donde se responden preguntas del SPSS SPSS Experts - Perfil de seis expertos en el uso del SPSS en el mundo comp.soft-sys.stat.spss - SPSS Usenet newsgroup via Google Groups SPSS Forum - Foro de usuarios del SPSS (Inglés) GNU PSPP - PSPP es un software libre que se puede utilizar en lugar del SPSS

16