SPSS Ejemplos Paso a Paso

EJERCICIOS DE SPSS PASO A PASO. ELABORADO POR: DR. ELEAZAR PUENTE R. I. RELACIÓN DE UNA VARIABLE CUALITATIVA CON UNA CU

Views 185 Downloads 3 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

EJERCICIOS DE SPSS PASO A PASO. ELABORADO POR: DR. ELEAZAR PUENTE R. I.

RELACIÓN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA. VARIABLE INDEPENDIENTE: GÉNERO (CUALITATIVA) VARIABLE DEPENDIENTE: TV (CUANTITATIVA) OBJETIVO: Probar estadísticamente si el tiempo dedicado a ver la TV depende del sexo de la persona. HIPÓTESIS NULA: “El sexo de la persona no influye en el tiempo dedicado a ver TV”, o “El tiempo dedicado a ver TV es independiente del sexo de la persona”. PROCEDIMIENTO. 1. Seleccionar el procedimiento de prueba “t” para diferencia entre medias de dos muestras independientes.

2. Seleccionar las variables, variable dependiente es “tv” la variable independiente es la variable de agrupación “genero” en este caso.

3. Identificar los grupos. NOTA: EN ESTE PROCEDIMIENTO LA MUESTRA SE PUEDE DIVIDIR SOLAMENTE EN 2 GRUPOS, YA SEA CON 2 CLAVES ESPECÍFICAS, O LOS QUE QUEDEN ARRIBA Y DEBAJO DE UN CIERTO LÍMITE.

En este caso los valores que toma la variable son solamente 1 o 2, por eso los grupos se definen de acuerdo a esos valores. La opción de “Punto de corte” se selecciona cuando los grupos se definen dividiendo la muestra a partir de un valor (punto de corte) y se separa entre los que son menores o iguales que ese valor y los que son mayores, de manera que este procedimiento siempre separa solamente en 2 grupos. Si se tienen más de 2 grupos se utilizará otro procedimiento (ANOVA). 4. Realizar el procedimiento. (Aceptar)

5. RESULTADOS. Estadísticos de grupo genero

N

Media

Desviación típ.

Error típ. de la media

Hombre

342

11.24

7.118

.385

Mujer

367

10.87

6.886

.359

tv

INTERPRETACIÓN Hay 342 respuestas de hombres y 367 de mujeres. El promedio de horas de TV de los hombres es de 11.24 y de las mujeres 10.87. En primera instancia parece ser que los hombres ven más TV que las mujeres, así lo indican los resultados de la muestra. En los resultados de la siguiente tabla veremos si la diferencia es estadísticamente significativa.

En esta tabla se muestran dos renglones diferentes, uno suponiendo que los grupos tienen varianzas iguales en esa variable (TV) y el otro suponiendo varianzas diferentes. En este caso podemos suponer que las varianzas son iguales, porque la prueba de igualdad de varianzas no rechaza la hipótesis nula (varianzas iguales), el valor de significancia es 0.835 (NO es menor que el 0.05 necesario para rechazar la hipótesis nula). Por lo tanto observaremos el primer renglón. Ahí se puede leer el valor de la significancia estadística de la diferencia, es donde dice “Sig. (bilateral)” que ese en este caso 0.481, este valor NO es menor que 0.05, por lo tanto se deduce que la diferencia entre las medias de las horas de TV no es significativa. A pesar de que las medias son 11.24 y 10.87 la diferencia no es estadísticamente significativa. También se muestra un intervalo de confianza para la diferencia entre las medias. En este ejemplo el intervalo para la diferencia va de -0.662 a 1.403, esto quiere decir que con un 95% de confianza podríamos decir que la diferencia se encuentra en ese rango. Podemos observar que el intervalo de confianza incluye al cero, o sea, no se puede descartar que la diferencia puede ser cero, esto confirma la conclusión de que no hay diferencia significativa entre las medias.

II.

RELACIÓN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA. VARIABLE INDEPENDIENTE: RELIGIÓN (CUALITATIVA) VARIABLE DEPENDIENTE: HIJOS2 (CUANTITATIVA) OBJETIVO: Probar estadísticamente si el número de hijos que una persona desearía tener depende de sus creencias religiosas. HIPÓTESIS NULA: “Las creencias religiosas de las personas no influyen en el número de hijos que desearían tener”, o “El número de hijos que desea tener una persona es independiente de sus creencias religiosas”. Se utilizará el procedimiento ANOVA porque en este caso la variable “religión” tienen más de 2 valores por lo tanto se forman más de 2 grupos. El procedimiento ANOVA solamente es válido cuando las varianzas son estadísticamente iguales. Si las varianzas no son homogéneas se tendría que dividir la muestra en solo 2 grupos (por ejemplo católicos y no-católicos) y hacer la prueba “t” para diferencia de medias de 2 muestras independientes. PROCEDIMIENTO. 1. Seleccionar el procedimiento ANOVA de un factor (ANOVA = Analysis Of Variance = Análisis de Varianza). Este procedimiento es útil para probar diferencias entre medias cuando la población (y por lo tanto la muestra) se divide en más de 2 grupos.

2. Seleccionar las variables. La variable dependiente es “hijos2” que tiene la descripción “Le gustaría tener (hijos)”. La variable independiente es “religión”.

3. En “Opciones” seleccionar estadísticos “Descriptivos” y “Prueba de homogeneidad de las varianzas”. Continuar.

4. Ejecutar el procedimiento. Aceptar.

5. Resultados.

INTERPRETACIÓN. En esta tabla se observa que la media en el número de hijos que les gustaría tener va desde 2.19 para quienes son indiferentes a la religión, 2.20 para los no creyentes hasta 2.56 para los católicos. También se muestra la desviación estándar típica de cada grupo, y los intervalos de 95% de confianza para la media del número deseado de hijos para cada grupo. También en los intervalos de confianza observamos que el grupo que le gustaría tener mayor número de hijos son los católicos, y los que desean menos hijos son los no creyentes o indiferentes. En las tablas posteriores tendremos elementos para probar estadísticamente si esas diferencias observadas en las muestras son estadísticamente significativas y se pueden extrapolar a la población.

En la tabla de arriba se está probando si las varianzas de los diferentes grupos son iguales. Concluimos que SÍ son iguales, porque la hipótesis nula es que las varianzas son iguales, y con la significancia de 0.096 no se alcanza a rechazar la hipótesis nula. Para rechazar la hipótesis de varianzas iguales, la significancia tendría que ser menor que 0.05. Con esta conclusión de varianzas iguales llegamos a la conclusión de que sí es válido interpretar los resultados de ANOVA (analysis of variance).

De la tabla de ANOVA se concluye que las diferencias en las medias del número de hijos deseados SÍ son estadísticamente significativas. Esto lo sabemos porque el valor de la significancia es 0.025, valor que es menor que 0.05. La hipótesis nula es que no existe diferencia en las medias, como 0.025 < 0.05 se rechaza la hipótesis nula y concluimos que el número de hijos que desea tener SÍ depende de las creencias religiosas de la persona. NOTA. Este procedimiento también se puede hacer como:

pero no sale la prueba de igualdad de varianzas.

III.

INTERVALO DE CONFIANZA PARA UNA MEDIA.

VARIABLE: “Ingreso 3” (Aportaciones familiares). Para hacer esta prueba es necesario que la variable sea cuantitativa y métrica. OBJETIVO. Estimar un intervalo de confianza del 95% para la media poblacional de una variable a partir de los datos de una muestra. PROCEDIMIENTO. 1. Seleccionar el procedimiento (prueba “t” para una muestra).

2. Seleccionar las variables:

3. Ejecutar el procedimiento (Aceptar). 4. Analizar resultados.

INTERPRETACIÓN. Las tablas muestran que se analizaron 652 casos válidos, obteniendo una media de aportaciones de 19.02 en la muestra. Con un 95% de confianza podríamos afirmar que la media poblacional se encuentra entre 17.11 y 20.93. NOTA. El procedimiento utilizado se aplica también para hacer la prueba de hipótesis de que la media tenga un cierto valor, en este ejercicio como solamente nos interesa el intervalo de confianza para la media poblacional dejamos el valor hipotético como cero.

IV.

RELACIÓN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA. VARIABLE INDEPENDIENTE: GÉNERO (CUALITATIVA) VARIABLE DEPENDIENTE: AMOR (CUALITATIVA) OBJETIVO: Probar estadísticamente si la situación afectiva actual depende del sexo de la persona. HIPÓTESIS NULA: “El sexo de la persona no influye en su situación afectiva actual”, o “La situación afectiva es independiente del sexo de la persona”. PROCEDIMIENTO. Para probar la relación entre 2 variables cualitativas se utilizará el mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadística Chicuadrada. 1. Seleccionar el procedimiento (tablas de contingencia).

(NOTA: En SPSS hay distintos caminos para llegar a una prueba Chi-cuadrada, este es uno de ellos solamente)

2. Seleccionar las variables. Variable independiente “genero”, variable dependiente “amor”.

3. En Estadísticos seleccionar Chi-cuadrada (continuar):

4. En “Casillas” seleccionar “Esperado” y “Observado”. Esto nos mostrará en cada celda de la tabla las frecuencias esperadas y las observadas en la muestra. Las frecuencias esperadas son las que cabría esperar si la hipótesis nula es válida, es decir si no hay dependencia entre las variables. Continuar.

5. Ejecutar el procedimiento con “Aceptar”. Ver los resultados.

Hay 649 casos en los que se tiene información válida en ambas variables género y amor.

En la tabla se muestran las frecuencias esperadas (asumiendo que una variable NO influye en la otra) y las frecuencias observadas. Por ejemplo hay en la muestra 126 hombres que tienen novia formal, y se esperarían 141 si las variables fueran independientes. También hay 37 mujeres en la muestra que nunca han tenido una relación afectiva especial, y se esperaban 35 en el caso de independencia. Observamos diferencias entre las frecuencias esperadas y las observadas, con la información de la siguiente tabla podremos ver si estas diferencias son estadísticamente significativas.

En esta tabla nos interesa el valor de significancia de la Chi-cuadrada de Pearson. El valor de la significancia es de 0.072, este valor NO es menor que 0.05 por lo que concluimos que NO podemos rechazar la hipótesis nula (independencia de las variables), de esta manera nuestra conclusión es que las variables “genero” y “amor” son independientes, lo que significa que el sexo de la persona no está influyendo en lo que declaran con respecto a su situación afectiva. Hombres y mujeres se están comportando igual en ese aspecto. NOTA: Aunque el valor de 0.072 es muy cercano al valor de 0.05, la muestra es bastante grande y es suficiente evidencia para NO rechazar la hipótesis de independencia.

V.

RELACIÓN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA. OTRO EJEMPLO. VARIABLE INDEPENDIENTE: GÉNERO (CUALITATIVA) VARIABLE DEPENDIENTE: OCIO (CUALITATIVA) OBJETIVO: Probar estadísticamente si las actividades recreativas que llevan a cabo las personas dependen del sexo de la persona. HIPÓTESIS NULA: “El sexo de la persona no influye en el tipo de actividades que realiza en su tiempo de ocio”, o “El tipo de actividades recreativas que realiza es independiente del sexo de la persona”. PROCEDIMIENTO. Para probar la relación entre 2 variables cualitativas se utilizará el mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadística Chicuadrada.

RESULTADOS.

CONCLUSIÓN. El valor de significancia estadística que se muestra para el estadístico Chi-cuadrada de Pearson es 0.000 y aunque no se muestran más decimales es claro que el valor es mucho menor que 0.05, por lo tanto sin duda rechazamos la hipótesis de independencia de las variables y llegamos a la conclusión de que el sexo de la persona SÍ influye en el tipo de actividades que realiza en su tiempo de ocio, o sea, hombres y mujeres difieren en el tipo de actividades recreativas que llevan a cabo.

VI.

RELACIÓN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA. VARIABLE INDEPENDIENTE: SUMAINGR “SUMA DE INGRESOS” (CUANTITATIVA) VARIABLE DEPENDIENTE: TV “HORAS DE TV” (CUANTITATIVA) OBJETIVO: Probar estadísticamente si el nivel de ingreso familiar (suma de todos los ingresos) influye significativamente en el número de horas dedicadas a la TV. HIPÓTESIS NULA: “El ingreso familiar no influye en el número de horas que se dedican a ver TV”, o “El tiempo dedicado a ver TV es independiente del nivel de ingresos familiares”. PROCEDIMIENTO. Para probar la relación entre 2 variables cuantitativas se utilizará el procedimiento de correlación lineal. 1. Seleccionar el procedimiento (correlaciones bivariadas).

2. Seleccionar las variables.

3. En Opciones seleccionar Medias y Desviaciones Típicas (continuar).

4. Correr el procedimiento y ver los resultados.

5. CONCLUSIONES. El coeficiente de correlación es muy bajo -0.09. Recordemos que los valores cercanos al 1 indican una muy fuerte correlación positiva entre las variables, un valor cercano al -1 indica una correlación negativa muy fuerte, y los valores cercanos al cero, como en este caso, indican una ausencia de correlación entre las variables. Para ver si estadísticamente la correlación es significativa o no, analizamos el valor de Significancia, en este caso el valor es 0.023, que es menor que 0.05 por lo que concluimos que SÍ se puede rechazar la hipótesis nula, y tenemos que decir que el nivel de ingreso familiar SÍ influye de manera significativa en el tiempo que le dedican a ver la TV. A pesar de que el valor aparente de la correlación es bajo, vemos que estadísticamente es significativo. El signo negativo del coeficiente de correlación nos indica que hay una relación negativa entre las variables, mientras más elevado es el nivel de ingresos, menos tiempo se le dedica a ver la TV.

VII.

RELACIÓN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA. OTRO EJEMPLO. VARIABLE INDEPENDIENTE: HORAS “HORAS DE OCIO” (CUANTITATIVA) VARIABLE DEPENDIENTE: TV “HORAS DE TV” (CUANTITATIVA) OBJETIVO: Probar estadísticamente si el número de horas libres de que dispone una persona influye significativamente en el número de horas dedicadas a la TV. HIPÓTESIS NULA: “El número de horas de ocio de una persona no influye en el número de horas que se dedican a ver TV”, o “El tiempo dedicado a ver TV es independiente del número de horas libres que tenga la persona”. PROCEDIMIENTO. Para probar la relación entre 2 variables cuantitativas se utilizará el procedimiento de correlación lineal. Analizar  Correlaciones  Bivariadas. RESULTADOS.

El promedio de horas de TV es de 11.05 y el promedio de horas de tiempo libre es de 21.05, esto significa que en promedio la mitad del tiempo libre se dedica a ver TV.

En la tabla se observa que existe una correlación moderada 0.228 entre las variables. El valor de Sig. (bilateral) nos indica que la correlación es estadísticamente significativa y rechazamos la hipótesis nula. El valor de la significancia es 0.000 y aunque no muestra más decimales es claramente menor que 0.05, de manera que tenemos que rechazar la hipótesis nula, y concluir que el número de horas libres que tiene una persona SÍ influye de manera significativa en el número de horas que dedica a ver TV.

VIII.

RELACIÓN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA. CON PUNTO DE CORTE PARA AGRUPAR. VARIABLE INDEPENDIENTE: ESCALA “POSICIÓN POLÍTICA IZQ – DER “ (CUALITATIVA) VARIABLE DEPENDIENTE: INGRESOS1 “INGRESO PERSONAL” (CUANTITATIVA) OBJETIVO: Probar estadísticamente si el nivel de ingresos de una persona depende de su auto-clasificación como “de izquierda” o “de derecha” en el ámbito político. HIPÓTESIS NULA: “La posición política de izquierda o derecha no contribuye a predecir el nivel de ingreso de la persona”, o “El ingreso personal de un individuo es independiente de su posición política de izquierda o de derecha”. PROCEDIMIENTO.

1. Seleccionar el procedimiento de prueba “t” para diferencia entre medias de dos muestras independientes. En este caso como se va a utilizar la prueba “t” (no ANOVA) la muestra debe separarse en solamente 2 grupos. Vamos a utilizar la prueba “t” con los grupos definidos con respecto a un punto de corte de los valores de la variable de agrupación.

2. Seleccionar las variables (ingresos personales, escala “posición política”).

3. En la variable escala hay que definir los grupos. Como los valores de escala (posición política) pueden ir desde 1 (extrema izquierda) hasta 10 (extrema derecha), vamos a poner el punto de corte en 6, así los que hayan contestado 6 o más se irán a un grupo que consideraremos “de derecha”, los de 5 o menos se irán al otro que consideraremos “de izquierda”. Esto se hace en el botón “Definir Grupos”. Continuar.

4. Correr el procedimiento. Aceptar. Ver resultados.

Se observa que hay muchas más personas (411) que se auto clasifican como de izquierda que como de derecha (156). Contrario a lo que nos indicaría el sentido común, las personas con tendencia de derecha tienen en promedio menores ingresos personales (25.63) que quienes se clasifican como de izquierda (31.02).

La prueba de igualdad de varianzas pasa marginalmente, ya que el valor de Significancia 0.053 está apenas por encima del valor de 0.05, se pueden asumir varianzas iguales. La significancia de la diferencia entre las medias es 0.282, que NO es menor que 0.05, por lo que no se puede rechazar la hipótesis nula. Por lo tanto se concluye que la diferencia entre las medias no es significativa. Aunque en la muestra existe una diferencia notable en el ingreso promedio, en favor de las personas “de izquierda”, la diferencia no alcanza a ser significativa, y no podemos generalizar el

resultado de la muestra. Por eso concluimos que el ingreso promedio es estadísticamente igual para los de derecha que para los de izquierda en la población.