Guia SPSS - 25

UNIVERSIDAD COOPERATIVA DE COLOMBIA SEDE BOGOTA FACULTAD DE CONTADURIA PÚBLICA FORMATO PARA EL DISEÑO DE GUÍAS DE TRABAJ

Views 230 Downloads 3 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD COOPERATIVA DE COLOMBIA SEDE BOGOTA FACULTAD DE CONTADURIA PÚBLICA FORMATO PARA EL DISEÑO DE GUÍAS DE TRABAJO ASIGNATURA: Estadística Descriptiva, Estadística Inferencial y Econometría. ELABORADO POR: Emiro Alberto Pertuz De Oro. FECHA: JUNIO de 2020. 1. TEMA: Guía para la aplicación del paquete estadístico SPSS-25. 2. OBJETIVO: Dar una herramienta operativa a los estudiantes en el manejo del SPSS-25 para las aplicaciones en Estadística Descriptiva, Estadística Inferencial y para Econometría. 3. COMPETENCIAS A DESARROLLAR: 3.1. Manejo de conceptos.  El estudiante debe conocer los diferentes tipos de archivos que puede utilizar del SPSS.  Identifica los tipos de ventanas del SPSS: de salida, de edición, de gráficos y de sintaxis.  Aprende a utilizar los principales comandos del paquete estadístico SPSS. 3.2.

Conocimiento de procesos.

 Importa bases de datos y crea bases de datos en el paquete estadístico SPSS que incluyen diferentes tipos de variables, tanto cualitativas como cuantitativas. También incorpora al SPSS base de datos guardada en archivos de Excel.  Codifica las variables cualitativas en el paquete estadístico SPSS 25 y otras versiones.  Asigna las escalas de medición de acuerdo al tipo de variable incorporada en la base de datos. 3.3. Nivel actitudinal.  Desarrolla ejercicios en grupo utilizando el SPSS 25.  Trabaja adecuadamente de manera individual y grupal, en el análisis de resultados.

 Participa activamente en las actividades propuestas en el laboratorio con SPSS 25. Tabla de contenidos 1. 2. 3. 4. 5. 6.

Marco conceptual Operatividad Tipos de ventanas en el SPSS Contenido de Vista de variable Contenido de vista de datos. Creación de base de datos nueva o existente.

Introducción El paquete estadístico SPSS (Statistical Presentation Software Systems) es un paquete estadístico útil para el proceso del manejo de la información Estadística, que utilizan los diferentes profesionales, especialmente académicos e investigadores. El paquete SPSS fue creado en ambiente Windows, lo que permite abrir varios tipos de ventanas y además varios tipos de archivos, con un fichero para la vista de variables y vista de datos similar a la hoja del Excel. Los tipos de archivos que se manejan en el paquete SPSS son: 1. Datos con extensión. sav 2. Los resultados: con extensión .sps 3. Los gráficos: con extensión. cht Propósito del curso y competencias Aplicación de TICs en el aula, para motivar al estudiante a desarrollar estudios de casos como forma práctica en el desarrollo de los contenidos, para medir la competencia que se busca.

Contenidos temáticos 1. Conceptos generales de la terminología a utilizar 2. Definición de archivos 3. Vista de variables y vista de datos. 4. Como crear una base de datos en SPSS o como importarla. 5. Como transformar variables. 6. Comandos de operaciones estadísticas y gráficos.

Recomendaciones prácticas sobre las notas de clase Aplicar paso a paso los conceptos y temáticas del SPSS, en casos prácticos para analizar resultados. Unidades La primera Unidad define la conceptualización y bondades del SPSS 25. Se busca motivar al estudiante en el aprendizaje del manejo del paquete estadístico, en versiones más recientes. Contenidos a desarrollar:

1. Las ventanas que se manejan en el SPSS son:  

   

2. 

Hay una Ventana de aplicación (SPSS application Windows). Esta contiene los menús para las aplicaciones del programa SPSS. La ventana de Salida de resultados (Output Windows). En esta ventana aparecen los resultados con los todos los análisis que se realizan en las instrucciones dadas. Se abre a partir del primer análisis, y los demás análisis se van colocando en forma secuencial en la parte inferior, puede ser archivada para ser utilizada posteriormente. La ventana de edición de los datos (Data editor Windows) Esta ventana contiene el archivo de los datos que se están trabajando. Pueden crearse archivos que serán utilizados posteriormente para Hay una ventana conocida como Carrusel de gráficos (Chart Carrusel Windows) En esa ventana se van presentando los diferentes gráficos solicitados. Se activa a partir de la solicitud que se haga de algún gráfico. La ventana de los gráficos (Chart Windows) En esa ventana se podrá modificar los gráficos, títulos, escalas en los ejes y archivar gráficos en archivos extensión. cht. La ventana de la sintaxis (Syntax Windows) Esta ventana nos permite pegar la sintaxis de los comandos seleccionados, puede ser editada y ampliada con opciones del SPSS que no están en la barra del menú. Se puede guardar y utilizarse en futuros análisis. Archivos. Cuando se inicia la sesión del SPSS, en la pantalla aparece una ventana que permite abrir archivos ya existentes o crear uno nuevo. Si se elige crear un archivo nuevo, se abre la ventana de edición, en la cual podemos crear la base de datos a partir de la cual se harán los análisis estadísticos.



Las bases de datos se construyen asignando una columna a cada variable que se quiera analizar, de manera que los sujetos están situados en las filas, en consecuencia, la base tendrá tantas columnas como variables y sujetos para analizar.



El paquete maneja dos sub ventanas, una de datos (Vista de datos) y una de variables (Vista de variables).

3. En la parte inferior de la hoja de cálculo(fichero), al elegir la ventana de vista de variables se presenta una matriz donde en las filas se crean las variables y en las columnas las características de las variables, dentro de la matriz se coloca el nombre de la variable sin utilizar puntos, comas, guiones o símbolos que puedan generar incompatibilidad con las instrucciones del software (Max. 8 caracteres), tipo de variable (si es cuantitativa o cualitativa), etiqueta, etiqueta de valor (codificar variables cualitativas), ancho de columna, decimales y demás características, Una vez se creen las variables, se ubica la ventana de datos y se entran los resultados de los sujetos correspondientes a cada una de las variables. Contenido de la ventana Vista de variables: 4. Nombre: Si no es posible colocar el nombre completo, se puede resumir (abreviatura), pero no se debe utilizar puntos, signos, dejar espacios, etc. Se puede utilizar barra al piso entre palabras (_). No tiene en cuenta las mayúsculas.

En esta parte la unidad debe desarrollarse claramente tema por tema. La explicación de cada tema debe estar acompañada de gráficos, recursos didácticos o de análisis de lecturas complementarias que ayuden al estudiante a profundizar. No se incluirán gráficos que no sean constructivos para la argumentación, es decir, que no aporten datos que justifiquen su presentación en el texto. Los gráficos pueden ser en policromía (a color), pero la imagen debe tener buena resolución. No se aceptarán imágenes que no tengan permiso para su reproducción.

Tipo: existen varios tipos de variables. Los tipos más utilizados son: numérico (cuantitativas) y las de tipo Cadena (cualitativas). Sin embargo, en versiones posteriores a la 15.0 es preferible trabajar todas las variables como numéricas para evitar inconvenientes en los cruces de variables. Anchura: Hace referencia al número máximo de caracteres o de espacios a utilizar en la inclusión de los datos, esto incluyendo el punto decimal. Por lo general se dejan 8 que por defecto utiliza el paquete. La versión 23 del SPSS asigna 12. Decimales: se refiere al número de decimales que tienen los datos de la variable que se va a ingresar. Etiqueta: la etiqueta es opcional. Se refiere al nombre completo de la variable. Es útil cuando se ha hecho un resumen o abreviatura del nombre de la variable. En la etiqueta se puede utilizar el nombre completo de la variable o hacer aclaraciones acerca de ella. Por ejemplo, si en el nombre se colocó como nombre de variable “promedio”, en la etiqueta puede colocarse: Promedio académico de los estudiantes. Por ej. Valores: se utiliza para determinar las etiquetas de los valores de las variables cualitativas que se han creado como numéricas. Por ejemplo, si se ha creado la variable “Sexo”, con valores 1 y 2, al activar valores, aparece el cuadro de diálogo de las etiquetas de valor, dar en valor el número 1 y en etiqueta Femenino, luego añadir, a continuación, escribir 2 en valor y Masculino en etiqueta de valor y añadir. Una vez se termine de dar los valores y etiqueta, accionar continuar. Esto permite asignar a la variable género en la ventana de datos valores de 1 o 2 según el caso, en lugar de escribir femenino o masculino.

Importar base de datos. Al iniciar la sesión del SPSS, aparece en pantalla una ventana que permite abrir archivos ya existentes o crear uno nuevo. Al elegir crear un nuevo archivo, se abre la ventana de edición, en la cual podemos crear la base de datos a partir de la cual se harán los análisis estadísticos.

Las bases de datos se construyen tomando una columna para cada variable que se desee analizar, de manera que los sujetos están situados en las filas, por tanto, la base tendrá tantas columnas como variables y tantas filas como sujetos. PRESENTACION: En la versión 25, el paquete SPSS maneja dos sub ventanas, una de datos (Vista de datos) y una de variables (Vista de variables). Contenido de la ventana Vista de variables: Nombre: Se sugiere un máximo 8 caracteres, no permite comenzar un nombre de variable con números ni colocar espacios. Si no es posible colocar el nombre completo, se puede resumir (abreviatura) o utilizar barra al piso entre palabras. No tiene en cuenta las mayúsculas.

Tipo: existen varios tipos de variables. Los tipos más utilizados son: numérico (cuantitativas) y Tipo de Cadena (cualitativas). Sin embargo, en versiones posteriores a la 15.0 es preferible trabajar todas las variables como numéricas para evitar inconvenientes en los cruces de variables. Anchura: se refiere al número máximo de caracteres o espacios a utilizar en la inclusión de los datos, incluyendo el punto decimal. Puede dejarse el 8 que por defecto utiliza el paquete. La versión 23 del SPSS asigna 12. Decimales: se refiere al número de decimales que tienen los datos de la variable que se va a ingresar. Etiqueta: la etiqueta es opcional. Se refiere al nombre completo de la variable. Es útil cuando se ha hecho un resumen o abreviatura del nombre de la variable. En la etiqueta se puede utilizar el nombre completo de la variable o hacer aclaraciones acerca de ella. Por ejemplo, si en el nombre se colocó como nombre de variable “promedio”, en la etiqueta puede colocarse: Promedio académico de los estudiantes. Por ej. Valores: se utiliza para determinar las etiquetas de los valores de las variables cualitativas que se han creado como numéricas. Por ejemplo, si se ha creado la variable género(Sexo), con valores 1 y 2, al activar valores, aparece el cuadro de diálogo de las etiquetas de valor, dar en valor el número 1 y en etiqueta Hombre, luego añadir, a continuación, escribir 2 en valor y Mujer en etiqueta de valor y añadir. Una vez se termine de dar los valores y etiqueta, accionar continuar. Esto permite asignar a la variable género(sexo) en la ventana de datos valores de 1 o 2 según el caso, en lugar de escribir Hombre o Mujer.

Valores perdidos. Cuando falta algún dato de la variable, el SPSS lo asume como valores perdidos. También se utiliza cuando el encuestado no quiere responder la pregunta, por ejemplo, “Sexo”, entonces se habilita un número para representar esa respuesta en la variable cualitativa, se utiliza generalmente el número 9 como valor perdido discreto.

El siguiente paso es identificar en los “valores” de la etiqueta ese nuevo código, luego añadir y aceptar. Cerrar.

Medida. Se coloca la escala de medición de las variables, si la variable es cuantitativa el SPSS la identifica como “numérica” y en medida se coloca “Escala” que referencia escala de razón e intervalo. Si la variable es cualitativa entonces es “tipo” aparece cadena y en medida, nominal u ordinal.

Vista de variables.

Vista de datos.

Los valores de las variables cualitativas se cargan de la siguiente forma: en valor se le da el numero correspondiente, la etiqueta y añadir, posteriormente aceptar. Este proceso se aplica a todas las variables cualitativas. Ver proceso para la variable sexo: valor 1, etiqueta Hombre cargar con “Añadir”

Continuacion de la etiqueta de la variable sexo. Cargadas todas las etiquetas se le dice “Aceptar” para que el SPSS identifique adecuadamente los valores de la variable cualitativa.

Otro ejemplo para cargar las etiquetas de la variable cualitativa“tipo de consulta”:

Otro ejemplo para una variable tipo LIKERT, variable cualitativa. Con 5 niveles de respuesta a saber: Totalmente en desacuerdo, en desacuerdo, ni de acuerdo ni en desacuerdo, de acuerdo y totalmente de acuerdo. Variable “Opinión del estado de las habitaciones”, se toman para etiquetar la variable valores consecutivos de 1 a 5.

Funciones del SPSS.  Archivo: se crean archivos, se importan datos, se crean base de datos y se ingresa base de dato de otro archivo (ver imagen).

 Editar: se utiliza para rehacer y deshacer informes de variables, buscar casos y variables.

 Ver: con esta instrucción cambiar la presentacion de la base de datos. Se le pueden suprimir las cuadriculas del visor de datos y variables, colocar las etiquetas(nombres) a los codigos de los valores de las variables cualitativas.

 Datos: entre otras funciones con este comando se puede definir las unidades de las series de tiempo, datos mensuales, bimestrales, trimestrales, anuales y diarios. Segmentar casos, comparar datos.

 Transformar: se crean nuevas variables con algunas operaciones aplicadas, se recodifican variables, se agrupan datos de variables con “agrupación visual”, se crean intervalos. También se pueden crear Nuevas variables con algunas restricciones o condiciones.

Un ejemplo de transformación de la variable edad: la variable objetivo es el nombre que se asigna a la nueva variable transformada: EDADMAYOR para representar los valores de las edades de pacientes mayor o igual a 45 años. Se genera una columna de datos en el visor de datos con los valores de las edades solicitadas.

 Analizar: con este comando se realizan las diferentes operaciones estadísticas,

distribución de frecuencias, estadísticos descriptivos, comparaciones de medias, regresiones, correlaciones, series de tiempo, análisis paramétrico y no paramétrico, etc. Es decir, aplicaciones de Estadistica Descriptiva y Estadistica Inferencial.

EJERCICIO DE DISTRIBUCION DE FRECUENCIAS CON SPSS VARIABLE CUANTITATIVA.  Variable: Edad. Ruta: Transformar/Agrupacion visual, y se selecciona la variable edad, desplazandola con la flecha hacia el rectangulo del lado derecho.

 Una vez ubicada la variable se activa la instrucción “Continuar”.

 Posteriormente se nombra a la variable agrupada, para este caso se escogió el nombre: EDADAG y se activa “crear puntos de corte”

 En la primera celda se anota el valor mínimo de la serie de datos, ejemplo el valor 22; se especifica el número de puntos de corte, que corresponde a

los intervalos de clase que se toman, 6 y automáticamente el SPSS asigna la amplitud de cada intervalo.

 Al activar la instrucción “Crear etiquetas” enseguida aparecen los intervalos de clase.

 Al procesar la distribucion de frecuencias aparece el siguiente aviso indicando que fue procesada la instrucción dada. Se cierra este aviso y no guardar

 Lo anterior indica que la variable agrupada aparece en el visor de datos en una nueva columna (ver EDADAG).  Por ultimo se realiza la distribucion de frecuencia asi: Analizar/Estadisticos descriptivos/Frecuencias

 Se carga la variable EDADAG y se da las instrucciones de calculo al SPSS. En el comando “Estadistico” se despliegan todas las operaciones descriptivas, media, mediana, moda, cuartiles, deciles, percentiles, asimetria y curtòsis.

 Al activar “Graficos” se despliegan los tipos de graficos: barras, histogramas, graficos circulares, con la curva normal en el histograma y se escoge “Continuar” y por ultimo “Aceptar”

 RESULTADOS: a continuacion se muestran los resultados obtenidos con aplicación del SPSS – 25.  Aparecen los estadisticos solicitados. En el primer nivel los estadisticos descriptivos solicitados. En el segundo nivel aparece las frecuencias por intervalo, tanto absoluta como relativa y acumuladas.

RESULTADOS:

 Finalmente aparece el histograma de frecuencia con la curva normal incorporada, lo que permite visualizar para efectos de análisis, cual rango de datos de la variable es mas significativo y si la serie de datos tiene distribucion aproximadamente normal.

Distribución de Frecuencias y Grafico Variable cualitativa: Variable sexo. La ruta para elaborar la distribución de frecuencias en SPSS es: Analizar/Estadísticos descriptivos/Frecuencias (ver la siguiente imagen).

1. Cargar variable, Mostrar tabla de frecuencias y seleccionar gráfico. Se selecciona la variable cualitativa correspondiente, en este ejemplo la variable Sexo, y se ubica en el rectángulo marcado con “Variables” se define la instrucción “Gráficos” y se despliega “Tipo de grafico”, se recomienda el grafico circular para variable cualitativa, con pocos valores, en este caso tiene dos valores: “Hombre y Mujer” se activa la instrucción “Mostrar tablas de frecuencias”.

2. Resultados del procesador. La imagen siguiente muestra información de la muestra de datos, dice cuántos son “valido” y cuantos “perdidos”. Distribución de frecuencias: Variable, sexo del paciente. Aparecen los valores de la variable, “Hombre y mujer”, la frecuencia absoluta, 48 y 52 respectivamente, porcentaje de la frecuencia relativa, 48% y 52%, finalmente el porcentaje acumulado o frecuencia relativa acumulada porcentual.

Grafico. El procesador presenta el grafico siguiente. Se puede editar el grafico, por ejemplo, que aparezca el nombre de la etiqueta o valor de la variable “Hombre o mujer” y el porcentaje correspondiente.

Editar gráfico. Ubicando el cursor en el área del gráfico y con doble clic, se superpone otro gráfico, y se activan instrucciones:” Archivo, Editar, Ver, Opciones, Elementos.

 En la instrucción “Elementos” se despliega “Mostrar elementos de datos”

 En la casilla “Etiqueta Mostrado” se ubican los valores de la variable y porcentaje, por ejemplo.

 Presentación del gráfico.

Profundidad y ángulo. Se le da doble clic dentro del área del diagrama circular y aparece profundidad y ángulo, se escoge 3D y se cambia profundidad ejemplo a 15 y aparece el siguiente gráfico.

Gráfico con profundidad.

Correlación de Variables (Tablas de contingencia o tablas cruzadas). Corresponde al análisis estadístico multivariado. Intervienen dos o más variable, una dependiente y la otra independiente(s), de acuerdo a la función matemática. Se puede medir el grado de asociación o de correlación entre dichas variable, lo mismo que el grado de independencia. La correlación puede darse entre variables cuantitativas o entre variables cualitativas en el primer caso la estadistica las ubica en el análisis paramétrico y el segundo en el no paramétrico. Existen diferentes coeficientes de correlación dependiendo que tipo de variables se están asociando, ellos son: Coeficiente de correlación de Pearson, de Spearman, Biserial puntual, Phi, de contingencia, de McNemar entre otros. EJERCICIO. A continuación, se dan imágenes de la ruta para una correlación de Contingencia, porque se utilizan 2 variables cualitativas en forma de frecuencias: Sexo y tipo de consulta médica. También se elabora una tabla de contingencia. Se toma información de una base de datos correspondiente a un estudio de salud, con pacientes de diferentes edades y tipos de consulta médica, medicina interna, oftalmología, ortopedia y urología. Ruta: Analizar/Estadísticos descriptivos/tablas cruzadas.

En Filas se carga la variable con más valores y en columnas la de menos valores.

En el comando “casillas” se dan características para los datos, si son observados, esperados y porcentajes, luego se da clic en “continuar” y “aceptar”.

Resultados.

Tabla cruzada Tipo de consulta*Sexo del paciente Sexo del paciente

Total

Hombre Tipo de consulta

Medicina interna

Recuento % dentro de Tipo de consulta

Ortopedia

Recuento % dentro de Tipo de consulta

Urología

Recuento % dentro de Tipo de consulta

Oftalmología

Recuento % dentro de Tipo de consulta

Total

Recuento % dentro de Tipo de consulta

Mujer

15

12

27

55,6%

44,4%

100,0%

9

19

28

32,1%

67,9%

100,0%

10

12

22

45,5%

54,5%

100,0%

14

9

23

60,9%

39,1%

100,0%

48

52

100

48,0%

52,0%

100,0%

Estimación del coeficiente de contingencia. Ejemplo: Se pretende saber si existe asociación entre el Sexo del paciente y el Tipo de consulta solicitado por el paciente.

Resultado: el coeficiente de correlación (r) es un valor comprendido entre (-1 y 1). Si el coeficiente es un valor cercano a 1 o a -1 se dice que existe alta asociación (positiva o negativa) entre las variables, si está cercano al valor cero (0) se dice que las variables están incorrelacionadas.

El coeficiente del ejercicio es r=0,219, es decir, estadísticamente se observa que hay poca asociación entre el sexo y el tipo de consulta, en la muestra de datos. La significación aproximada (0,17) lo confirma teniendo en cuenta que es mayor que 0,05.

Medidas simétricas Significación Valor Nominal por Nominal

Coeficiente de contingencia

aproximada

,219

N de casos válidos

100

Análisis descriptivos.  Estadísticos de tendencia central.  Media, mediana y moda.  Estadísticos de localización.  Cuartiles, quintiles, deciles y perce3ntiles.  Estadísticos de dispersión.  Varianza, desviación estándar, rango.  Estadísticos de forma.  Asimetría y curtósis.  Correlación.  Coeficiente de correlación de Pearson.  Coeficiente de correlación de Spearman.

,170

 Coeficiente de correlación Phi.  Coeficiente de correlación de contingencia.  Coeficiente de correlación biserial puntual.

Aplicación al SPSS-25. Analizar/ estadísticos descriptivos/ frecuencias. Se escogió por ejemplo la variable “Edad” y en “estadísticos” se seleccionan los estadísticos a calcular: de tendencia central, de localización, dispersión y asimetría.

Resultados descriptivos (univariado).

Estadísticos Edad N

Válido Perdidos

Media

100 0 52,99

Mediana

47,00

Moda

45

Desv. Desviación

16,989

Varianza

288,636

Asimetría

,151

Error estándar de asimetría

,241

Curtosis

-1,268

Error estándar de Curtosis Percentiles

,478

25

40,00

50

47,00

75

69,00

Correlaciones (bivariado). Analizar/estadísticos descriptivos/tablas cruzadas.

Se da clic a “Tablas cruzadas” o de contingencia. Se ubican las variables en filas y en columnas, se pide “Estadísticos” y aparecen diferentes coeficientes de correlación. Se escoge solo un coeficiente de acuerdo al tipo de variable.

Criterios de escogencia del coeficiente de correlación.  Coeficiente de contingencia: dos variables nominales con dos o más niveles de respuesta.  Coeficiente Phi: dos variables cualitativas dicotómicas.  Eta o coeficiente de correlación biserial puntual: una variable cualitativa y otra cuantitativa.

En casillas. Se activan porcentajes por filas y columnas según el caso y se le da “continuar. Resultados:

Tabla cruzada Tipo de consulta*Sexo Sexo Hombre Tipo de consulta

Medina interna

Recuento % del total

Ortopedia

Recuento % del total

Urología

Recuento % del total

Oftalmología

Recuento % del total

Total

Recuento % del total

Mujer

Total

15

12

27

15,0%

12,0%

27,0%

9

19

28

9,0%

19,0%

28,0%

10

12

22

10,0%

12,0%

22,0%

14

9

23

14,0%

9,0%

23,0%

48

52

100

48,0%

52,0%

100,0%

Se aprecia en la tabla de contingencia el total de hombres (48%) y mujeres (52%), también se observa que el tipo de consulta más utilizado es “ortopedia” con el 28%.

Los coeficientes de correlación de Pearson y Spearman, se calculan así: Analizar/Correlacionar/Bivariadas.

Se seleccionan las dos (2) variables a correlacionar y posteriormente se selecciona el coeficiente correspondiente.

Por ejemplo: se selecciona el coeficiente de correlación de Pearson. Resultados:

Correlaciones Edad Edad

Correlación de Pearson

Días de ingreso 1

Sig. (bilateral) N Días de ingreso

Correlación de Pearson

,468** ,000

100

100

,468**

1

Sig. (bilateral)

,000

N

100

100

**. La correlación es significativa en el nivel 0,01 (bilateral).

Se estima el coeficiente de correlación de Pearson con un valor de 0,468. Indicando una buena correlación positiva entre las variables “Edad del paciente y días de ingreso al Hospital”.  ANALISIS INFERENCIAL con aplicación de SPSS-25.  Generalidades La inferencia estadística es una técnica o procedimiento estadístico que permite tomar decisiones de una población basado en la evidencia que aporta una muestra aleatoria de datos, con un nivel de confianza o nivel de significación determinado por el investigador. Estos niveles generalmente utilizados pueden ser del 90%, 95%, 98%, 99%, es decir, el nivel de significación considerado como alfa (α) sería del 10%, 5%, 2% y 1% respectivamente. La utilidad de hacer inferencia estadística radica en que el análisis exhaustivo de los datos de una población, suele suceder dispendioso, costoso en términos monetarios y no arrojaría resultados agiles e inmediatos en el tiempo; por esa razón en las auditorias se utiliza una muestra representativa de la población, la cual daría las evidencias en la toma de decisiones.

 Intervalo de confianza.

Este primer paso de la inferencia estadística para variable cuantitativa (numérica), consiste en estimar un intervalo basado en la información de la muestra, en el que probablemente (nivel de confianza) este contenido el parámetro promedio poblacional (µ) o la varianza poblacional (σ2). Este tipo de análisis se conoce como análisis paramétrico. El intervalo de confianza se define como:

P(X -

≤ µ≤ X +

) = 1-α . Este intervalo de confianza supone

que la muestra de datos es grande (n), es superior a 30 observaciones y la varianza es conocida, por eso se utiliza la distribución normal de probabilidad (Z).

P(X -

≤ µ ≤ X +

) = 1-α

. En esta fórmula general, el

intervalo de confianza supone que la muestra es pequeña (n