Unidad 1: Stata 12

STATA 12 para Economistas UNIDAD 1: STATA Y SUS RECURSOS Pontificia Universidad Católica del Perú 1 Jorge Valdivia

Views 62 Downloads 0 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

STATA 12 para Economistas

UNIDAD 1: STATA Y SUS RECURSOS

Pontificia Universidad Católica del Perú

1

Jorge Valdivia

Contenido UNIDAD 1: STATA Y SUS RECURSOS ................................................................................ 1 Tema 1: STATA 2012 ........................................................................................................ 3 1.1

¿Qué puedo hacer con STATA 12? ......................................................................... 3

1.1.1

Imputación múltiple (MI).................................................................................... 3

1.1.2

Series de tiempo multivariadas ......................................................................... 5

1.1.3

Datos de panel y modelos mixtos ..................................................................... 5

1.1.4

ARFIMA ............................................................................................................ 5

1.1.5

Nueva interfaz .................................................................................................. 5

1.1.6

Filtros para series de tiempo ............................................................................. 6

1.1.7

Método de los momentos generalizado (GMM)................................................. 6

1.1.8

Documentación PDF. ........................................................................................ 6

1.1.9

Análisis marginales ........................................................................................... 7

1.1.10

Fuentes en gráficos .......................................................................................... 7

1.1.11

Regresión para riesgos en competencia ........................................................... 7

1.1.12

Variables factoriales ......................................................................................... 7

1.1.13

Estadísticas exactas ......................................................................................... 8

1.1.14

Otras funciones................................................................................................. 8

1.2

Presentaciones de STATA ....................................................................................... 8

1.3

Entorno de trabajo ................................................................................................... 9

1.4

Recursos del STATA ............................................................................................. 17

1.5

Ayuda en STATA: comandos help, search y findit ................................................. 18

Tema 2: Manejo de datos ............................................................................................... 20 2.1

2

Iniciando una sesión de STATA ............................................................................. 20

2.1.1

Creando un Log file ........................................................................................ 20

2.1.2

Abrir y guardar una base de datos .................................................................. 21

2.1.3

Comandos principales .................................................................................... 21

2.1.4

Estructura de comandos ................................................................................. 25

2.1.5

Ingresando nuevos datos a STATA ................................................................ 26

INFOPUC

STATA 12 para Economistas

Tema 1: STATA 2012

1.1 ¿Qué puedo hacer con STATA 12? STATA es un software de análisis estadístico y econométrico que sirve de herramienta para el análisis de información en diversas disciplinas tales como las ciencias sociales, la medicina y otras. STATA es un paquete de tratamiento de datos de apariencia similar a otros softwares estadísticos, en el sentido de que se ejecutan de manera secuencial comandos digitados por el usuario dentro de una sesión. Inicialmente se creó con la finalidad de analizar los datos de sección cruzada. Sin embargo, en los últimos años ha alcanzado notoriedad y potencialidad, y ha abarcado campos de la micro y macroeconometría. A través de la permanente difusión (como en el foro no oficial Statalist) de nuevos comandos que incorporan complejas técnicas estadísticas y econométricas, ha cautivado a muchos usuarios por su versatilidad y constante actualización. Entre las potencialidades del STATA, destaca la facilidad para manipular y describir con grandes bases de datos, donde la principal restricción es el tamaño de la memoria de la computadora. Posee diversas aplicaciones predefinidas: regresiones por mco, datos de panel, logit, probit, etc. Asimismo, posee una excelente herramienta para realizar gráficos.

En la versión 13 destacan las siguientes funcionalidades:

1.1.1

Imputación múltiple (MI)

Proporciona una serie de métodos que permiten realizar análisis de datos incompletos, datos en los que faltan algunos valores, y brindan funcionalidades para las etapas de imputación y estimación.

Entre dichas funcionalidades están las siguientes:



Imputación univariada



Imputación multivariada

Pontificia Universidad Católica del Perú

3

Jorge Valdivia



Panel de control para MI.- Permite unificar las funcionalidades del comando MI y guía al usuario desde que inicia el análisis hasta el término de este; es decir, desde la etapa de examinación de los valores faltantes hasta la realización de estimaciones e inferencias sobre imputaciones múltiples.

 Examine.- Se utiliza para chequear los patrones de valores incompletos y determinar el método de imputación adecuado.

 Setup.- Se utiliza para establecer las características de los valores que se desean imputar. Si los datos ya han sido imputados, se debe obviar esta etapa.

 Impute.- Se utiliza para crear imputaciones. Se pueden imputar una o más variables simultáneamente mediante la selección o combinación de los métodos regresión, ajuste de medias predictivas, regresiones logística, ordinal logística y multinomial logística y MVN.

 Import.- Se utiliza para poder importar.  Manage.- Se utiliza para realizar el manejo de los datos.  Estimate.- Se utiliza para ajustar el modelo y combinar los resultados.  Test.- Se utiliza para realizar test de hipótesis.  Predict.- Se utiliza para hacer predicciones de los modelos.

4

INFOPUC

STATA 12 para Economistas

1.1.2

Series de tiempo multivariadas

Representa o estima un amplio rango de procesos de series de tiempo multivariable. STATA 12, a diferencia de otros programas, no necesita que el usuario especifique si el modelo es estacional o no, pues es automático.

Entre dichos modelos están los siguientes:



Modelos de espacio de estados



Modelos

de

factor

dinámico



Modelos

GARCH

multivariados donde los usuarios

pueden

analizar

las

interacciones de varias series a la vez

1.1.3

Datos de panel y modelos mixtos



Estructuras de error en covarianzas



Test de raíces unitarias



Errores estándar y BLUP

1.1.4

ARFIMA



Procesos de memoria de largo plazo



Integración fraccional



Predicción estática y dinámica



Estimación de varianza robusta

1.1.5



Nueva interfaz Manejo de memoria automática

Pontificia Universidad Católica del Perú

5

Jorge Valdivia



Hasta 1 terabyte de memoria



Nueva interfaz para el sistema operativo Macintosh



Manejador de variables



Vista activa de los datos



Filtros de datos y de variables



Vista con tabs



Plegado de código



Marcadores



Importación/exportación de bases de datos a Excel®



Exportación a PDF

1.1.6

Filtros para series de tiempo



Tendencia y ciclo



Filtro

Christiano-

Fitzgerald



Filtro Baxter-King



Filtro Hodrick-Prescott



Filtro Butterworth

1.1.7

Método de los momentos generalizado (GMM)



Modelos lineares y no lineares



Estimadores en una etapa, en dos etapas e iterativos



Datos de sección cruzada, series de tiempo y datos de panel



Variables instrumentales para datos de panel

1.1.8

Documentación PDF.- Donde los manuales están integrados con el sistema de ayuda de STATA.



6

Distribuida con cada copia de STATA

INFOPUC

STATA 12 para Economistas



Contiene todos los manuales



Integrada con los archivos de ayuda

1.1.9



Análisis marginales Estimación

de

medias marginales



Márgenes predictivos



Efectos

marginales

promedio

1.1.10 Fuentes en gráficos



Itálica y negrita



Letras griegas



Símbolos matemáticos



Subíndices y superíndices



Fuentes múltiples

1.1.11 Regresión para riesgos en competencia.- Permite manejar modelos de duración o supervivencia cuando los individuos se enfrentan a más de un tipo de riesgo.



Variables que varían en el tiempo



Gráficos de incidencia acumulativa



Razón de subrriesgo

1.1.12 Variables factoriales



Interacciones



Términos polinomiales

Pontificia Universidad Católica del Perú

7

Jorge Valdivia



Creación automática de indicadores

1.1.13 Estadísticas exactas



Regresión logística para variable dependiente binaria



Regresión de Poisson para datos de conteo



Pruebas exactas y pruebas conjuntas



Predicciones con intervalos de confianza exactos

1.1.14 Otras funciones



Diez generadores de números aleatorios



Más funciones de distribución y de densidad



DIFBETA, valores de desplazamiento de verosimilitud y estadísticos LMAX para regresión de Cox



Errores normales, GED y t de Student en ARCH



Tests multivariados



Derivadas numéricas



Arreglos asociativos



Funciones para códigos Soundex



Programación orientada a objetos

1.2 Presentaciones de STATA Las diferentes presentaciones de STATA se caracterizan según el tipo de usuario y recursos del computador. Las versiones Stata/SE, Intercooled Stata y Small Stata varían según el tamaño de la base de datos de análisis. Así tenemos:



Stata/MP - Stata: para computadoras multiprocesador y de núcleo dual.



Stata/SE - Stata: para grandes bases de datos.



Intercooled Stata: versión estándar de Stata.



Small Stata: comúnmente utilizada por estudiantes.

Es indiferente la interfaz para todas las presentaciones de STATA.

8

INFOPUC

STATA 12 para Economistas

1.3 Entorno de trabajo

El despliegue de STATA 12 presenta cuatro ventanas diferentes: Ventanas de STATA Review

Aquí aparecen los comandos que han sido utilizados durante la sesión. Solo los resultados más recientes son visibles en esta pantalla.

Command

Sirve para utilizar STATA de forma interactiva; es decir, se emplea para crear las líneas de comandos y llevar a cabo las aplicaciones disponibles en el software.

Variables

Nos informa sobre las variables que están disponibles en nuestra base de datos para realizar las diversas aplicaciones.

Results

Esta nos permite visualizar los resultados (outputs) de los estadísticos que pedimos calcular o de los modelos que solicitamos estimar.

Properties

Esta ventana nos permite editar las propiedades de las variables y de la base de datos, así como ver las propiedades generales.

Pontificia Universidad Católica del Perú

9

Jorge Valdivia

Entorno/Ventanas de STATA

Review

Variables

Resultados

Comandos

Propiedades

El tamaño y la posición de las ventanas pueden configurarse según las preferencias del usuario. Estas configuraciones se pueden realizar siguiendo los siguientes pasos: 1.

Se selecciona el menú Edit; en la opción Preferences, se elige General Preferences.

2.

10

En la pestaña Windowing se configuran e ingresan los valores que se desean.

INFOPUC

STATA 12 para Economistas

También podemos modificar el color de fondo o las fuentes de la ventana Stata Results siguiendo los siguientes pasos: 1.

En el menú Edit se selecciona la opción Preferences.

2.

Se elige la opción General Preferences.

3.

Se elige la pestaña Result Colors y se personaliza el color que se desea en la casilla de Color Scheme.

Pontificia Universidad Católica del Perú

11

Jorge Valdivia

Otras ventanas importantes son:



Stata Editor permite navegar y modificar los datos como si fuese una hoja de Excel.





12

Stata Editor (Browser) permite visualizar los datos, mas no modificarlos.

Stata Viewer permite acceder a información en línea, así como a la ayuda del programa.

INFOPUC

STATA 12 para Economistas



Stata Graphs presenta el último gráfico realizado.

Pontificia Universidad Católica del Perú

13

Jorge Valdivia



Stata Variables Manager es una ventana que funciona como un editor de las variables y en donde se puede modificar el nombre, la etiqueta, el formato, las notas, etc.



Stata Do-file Editor es una ventana separada en Windows y funciona como un editor de textos que permite ejecutar una lista de comandos.

14

INFOPUC

STATA 12 para Economistas

Desde la versión 8 de STATA, todos los comandos (excepto los de programación) han sido implementados con cuadros de diálogo, y se puede acceder a ellos desde el menú principal, el cual está organizado por tópicos:

Menú de comandos de STATA

Seleccionamos una opción desde los menús Data, Graphics o Statistics y llenamos la caja o cuadro de diálogo correspondiente.

Por ejemplo, para acceder al cuadro de diálogo siguiente, el cual se encuentra en los menús desplegables, seguimos estos pasos: 1.

Seleccionar el menú Statistics y elegir la opción Linear models and related.

2.

Seleccionar la opción Linear regression.

Análisis estadístico a través del menú desplegable:

Pontificia Universidad Católica del Perú

15

Jorge Valdivia

Esta forma de trabajar con el programa de manera interactiva es lo que STATA llama GUI (Graphic User Interface), lo cual es una mejora con respecto a las versiones anteriores (versiones anteriores a STATA 8). STATA permite trabajar de manera interactiva y por medio de comandos (al igual que RATS 6, Eviews, SPSS, etc.) debido a que cada ventana se encuentra asociada a un comando. La barra de herramientas Además, STATA presenta una barra de herramientas que permite realizar operaciones usuales como abrir un archivo, grabarlo, imprimir o ver alguna ventana en particular.

16

INFOPUC

STATA 12 para Economistas

1.4 Recursos del STATA STATA permite la actualización constante de sus comandos a través de programas escritos en un lenguaje llamado “ado-file”. Los propios usuarios realizan dichos comandos y las nuevas técnicas, y estos se presentan a través de StataList, la lista de STATA, de suscripción gratuita.

Desde el siguiente enlace http://www.stata.com/statalist/, se discuten las últimas técnicas y rutinas programadas en STATA. Dicha información mantiene una base de datos desde 1997 con todos los ítems posteados en StataList, los cuales han sido ubicados en el Boston College Statistical Software Components (SSC). Algunos otros recursos en la red: http://www.stata.com/ http://www.stata.com/support/faqs/ Portal del STATALIST

Pontificia Universidad Católica del Perú

17

Jorge Valdivia

1.5 Ayuda en STATA: comandos help, search y findit Comando help Este es uno de los comandos más importantes de STATA, pues presenta la sintaxis de los comandos, así como ejemplos de cómo se usan. Para pedirle ayuda a STATA sobre un comando, se escribe en la ventana de comandos help seguido del nombre del comando que queramos conocer. También se puede acceder directamente a la ayuda. A continuación se muestran los siguientes ejemplos:



help if



help summarize



help regression



help tabulate

La ayuda en STATA se visualiza en el viewer. Sin embargo, todas las copias del producto cuentan con la documentación PDF, a la cual se puede acceder de la siguiente manera: En el menú Help, hacer clic en el botón PDF Documentation.

18

INFOPUC

STATA 12 para Economistas

Dentro de la ayuda del comando, se observa que a veces las primeras letras del nombre del comando están subrayadas; esto indica que en lugar de escribir el comando completo, como summarize, se puede escribir solamente su (o cualquier forma intermedia).

Programando y ejecutando comandos en STATA Para poder trabajar en el entorno de STATA, se va a utilizar la ventana de comandos. En cuanto a la sintaxis, se va a utilizar la siguiente forma de ejecutar los comandos:

Notemos que todo lo que va entre corchetes es opcional, y que en la sintaxis de los comandos primero se ponen los comandos seguidos de una explicación (normalmente las variables que queremos ejecutar o alguna explicación relativa a cómo ejecutar el comando), luego el peso (weigths), los condicionales (if) preceden a los rangos (in) y les siguen las opciones después de un coma:  [varlist] Es la lista de variables.  [if] Debe estar seguida de una expresión lógica para que solo los datos que cumplan con la condición puedan incluirse en dicho análisis.  [in] permite indicar el rango de los datos que se desea analizar.  [weight] Son los pesos o ponderaciones.  [options] Son las opciones de cada comando que se está utilizando. Siempre se antepone una coma antes de las opciones.

Pontificia Universidad Católica del Perú

19

Jorge Valdivia

Tema 2: Manejo de datos

2.1 Iniciando una sesión de STATA 2.1.1

Creando un Log file

STATA permite guardar un registro de los comandos y los resultados que van apareciendo en la ventana de resultados. Para crear un archivo de bitácora se usa el comando log using: log using bitácora. Por defecto, se guarda en el directorio en uso y en formato SMCL (que es el que usa STATA) para presentar los resultados. Para parar momentáneamente el registro de

log off

la bitácora: Para reanudar el registro de la bitácora:

log on

Este comando será registrado:

sysuse auto tab rep78

Para detener la bitácora:

log close

Para reanudar una bitácora:

log using bitácora, append

Para sobrescribir una bitácora:

log using bitacora, replace

Para ver una bitácora:

type bitacora.smcl

Nota: Si se quiere guardar los resultados en un archivo de texto, se debe escribir la siguiente sintaxis: log using bitácora, text

Esta se guardara automáticamente en este formato y se podrá abrir con el bloc de notas.

20

INFOPUC

STATA 12 para Economistas

2.1.2 Abrir y guardar una base de datos La forma como STATA carga los datos a la memoria es similar a la de un procesador de textos o a la de una hoja de cálculo. No se realizan los cambios hasta que el usuario los guarda explícitamente. Cuando se emplea el comando use, los datos se cargan a la memoria del ordenador. Para guardar los datos se debe emplear el comando save. Es recomendable no sobrescribir los datos y trabajar en un directorio diferente de donde se encuentran los datos originales. Los datos pueden cargarse al programa utilizando el comando use seguido por la ruta en donde se encuentra la base de datos. sysuse auto save "auto.dta”

2.1.3 Comandos principales COMANDO

DESCRIPCIÓN

help

Ayuda de programa STATA para comandos

log

Uso de archivos de bitácora

use

Abrir una base de datos en STATA (extensión .dta)

edit

Ingreso de datos por medio de la ventana de Stata Editor

codebook

Muestra variables con estadísticos descriptivos

describe

Describe contenido de datos en memoria o sobre el disco

save

Guarda los datos en disco con extensión *.dta

list

Lista de valores de variable

if

Selecciona observaciones cumpliendo cierta condición para la ejecución del comando

drop

Borra variable o dato en memoria

keep

Borra variables o datos no seleccionados

label variable

Comando de etiqueta de variables

label define

Primer paso para etiquetar valores de una variable

label values

Segundo paso para etiquetar valores de una variable

Pontificia Universidad Católica del Perú

21

Jorge Valdivia

Ejemplo: El ejercicio consiste en abrir una base de datos de nombre auto, la cual se puede abrir con el comando sysuse para luego guardarla en una ruta específica y volver a abrirla. En la ventana de comandos, se debe escribir lo siguiente: sysuse auto

1. En primer lugar, se indica la ruta del directorio de trabajo a través del comando cd:1 cd “C:\Users\jvaldiviar\Desktop\STATA 12” 2. Una vez que se ha definido la carpeta de trabajo, se guardará la base de datos a través del comando save: save auto.dta

3. Finalmente, cuando se tenga el archivo guardado, se invocará a la base de datos utilizando el comando use: use auto.dta

1

Es necesario indicar en el disco una ruta a STATA donde se van a almacenar y ubicar los archivos con los que se trabaje. Esto es necesario para poder abrir, guardar o utilizar archivos, gráficos, bases de datos, etc.

22

INFOPUC

STATA 12 para Economistas

Al abrir la base de datos se cargará la ventana de variables. Para pedir ayuda sobre el comando se deberá invocar la ayuda de STATA: help use

Uso del comando use a través del help

Pontificia Universidad Católica del Perú

23

Jorge Valdivia

4. Para conocer el contenido de la base, se emplearán los comandos describe y codebook: El comando describe se emplea

Comando describe

para describir el contenido de datos

en

la

memoria

del

computador. Brinda la siguiente información: 

Contenido de la data de: (ruta del archivo)



Número

de

observaciones,

variables 

Fecha

y

tamaño

de

la

memoria empleada 

Nombre de la variable, tipo de almacenaje (string o numérica), y la etiqueta de la variable



Comando codebook

El comando codebook se emplea

para

describir

el

contenido de las variables de manera detallada, brindando información máximo,

como

rango,

mínimo,

media,

varianza, missings, etc. El contenido mostrado depende de cada variable. 5. Otras formas de abrir una base de datos: Al digitar en la línea de comandos la siguiente sintaxis: use auto.dta in 1/10

se le indica al STATA la apertura de los 10 primeros registros de la base de datos. Este tipo de órdenes se aplicará cuando se desee realizar una exploración a la base de datos, sin necesidad de cargar la base completa.

24

INFOPUC

STATA 12 para Economistas

De la misma manera, es posible aplicar filtros que indiquen qué parte de la base de datos se utilizará. En la base auto, la variable price representa el total de miembros del hogar. Por ello, si está interesado en conocer solo los precios mayores a 3000, se aplicará el siguiente condicional:

use auto if price>3000

En muchas ocasiones, solo serán de nuestro interés algunas de las variables contenidas en la base de datos. Para ello se empleará la siguiente sintaxis:

use make price mpg rep78 using auto Donde los comandos empleados son use y using; mientras que las variables de interés son make, price, mpg y rep78. Como en los casos anteriores, la base de datos se denomina auto. Cabe mencionar que no ha sido necesario incorporar el nombre del directorio, debido a que eso fue establecido líneas arriba a través del comando cd.

2.1.4

Estructura de comandos

En función al análisis de datos que se desee realizar, la estructura de la sintaxis cambiará con la finalidad de elaborar reportes según las necesidades del investigador. Por ejemplo, el comando summarize brinda reportes de los principales estadísticos de la base de datos. Dicho comando se emplea de las siguientes maneras:

summarize price if price>3500

Pontificia Universidad Católica del Perú

25

Jorge Valdivia

by foreign: summarize price if price>3500

summarize price,detail

2.1.5

Ingresando nuevos datos a STATA

Para crear o introducir datos en STATA y generar nuevas variables, se debe utilizar el comando edit. Se puede acceder a la ventana emergente del comando en el menú Dara  Data Editor  Data Editor (Edit), o haciendo clic en el botón edit:

Una vez abierto, aparece la ventada Stata Editor, la que permite ingresar información libremente. Si se escriben números, se va generar una variable

26

INFOPUC

STATA 12 para Economistas

numérica que va a aparecer de color negro; si se escriben palabras, la data va a aparecer en color rojo. A este tipo de datos se les llaman variables string. Los espacios en blanco van a estar representados por un punto (missing data).

Pontificia Universidad Católica del Perú

27