Mult Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial An´alisis Multivariante con Stata Diploma Avanz

Views 93 Downloads 0 File size 5MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´alisis Multivariante con Stata Diploma Avanzado en Metodolog´ıa de Investigaci´on en Ciencias de la Salud EVES. Valencia, Oct 2013

Francisco Garc´ıa Garc´ıa [email protected]

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Indice

1

Introducci´ on

2

Clustering

3

An´ alisis Discriminante

4

An´ alisis Factorial

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´ alisis Multivariante An´ alisis Multivariante con Stata

Algunas preguntas...

1

¿De qu´ e forma se pueden agrupar a los pacientes que ingresan en un hospital seg´ un los recursos que consumen?

2

¿Qu´ e criterios pueden ayudar a diagnosticar si una obstrucci´ on de v´ıas biliares est´ a provocada por un tumor maligno o es de naturaleza benigna?

3

¿C´ omo se puede obtener un indicador de necesidad de servicios sanitarios en distintas unidades geogr´ aficas?

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´ alisis Multivariante An´ alisis Multivariante con Stata

¿Qu´ e tienen en com´ un las preguntas anteriores?

Estas cuestiones tienen en com´ un que sus respuestas se basan en el an´ alisis conjunto de muchas variables. El An´ alisis Multivariante presenta m´ etodos que analizan conjuntamente varias variables, medidas sobre un grupo de individuos u objetos. Los resultados del An´ alisis Multivariante proporcionar´ a una informaci´ on interesante para la toma de decisiones del investigador.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´ alisis Multivariante An´ alisis Multivariante con Stata

Clasificaci´on de m´etodos multivariantes:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´ alisis Multivariante An´ alisis Multivariante con Stata

An´alisis Multivariante con Stata

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

An´ alisis Multivariante An´ alisis Multivariante con Stata

Nos centraremos en los siguientes m´ etodos:

1

An´ alisis Cl´ uster.

2

An´ alisis Discriminante.

3

An´ alisis Factorial.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

An´ alisis Cl´ uster Su objetivo es formar grupos de objetos (individuos) homog´ eneos respecto a una variedad de atributos que pueden ser tanto cualitativos como cuantitativos, de forma que las observaciones pertenecientes a un grupo sean muy similares entre s´ı y muy disimilares del resto. A diferencia del An´ alisis Discriminante se desconoce el n´ umero y la composici´ on de dichos grupos. El An´ alisis de Clustering busca la formaci´ on de grupos mientras que el An´ alisis Discriminante predice la pertenencia a grupos ya prefijados. Ejemplos: 1

Detecci´ on de subgrupos de pacientes con c´ ancer de mama en funci´ on de variables cl´ınicas y gen´ eticas.

2

Agrupar diferentes frutas y verduras por sus caracter´ısticas nutricionales (energ´ıa, prote´ınas, l´ıpidos, gl´ ucidos...)

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Los tipos de clustering variar´ an en funci´ on de 3 criterios: 1

¿Jer´ arquico o no jer´ arquico?

2

¿Qu´ e m´ etodo utilizamos para medir la similitud de los grupos?

3

¿Qu´ e medida de distancia usaremos?

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

1. Jer´arquico vs. no jer´arquico

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

2. M´etodo para medir la similitud entre grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

2. M´etodo para medir la similitud entre grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

3. Tipo de medida de distancia utilizada. Distancia eucl´ıdea

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

3. Tipo de medida de distancia utilizada.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Stata tiene implementado diversos m´etodos de an´alisis de clustering:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Clustering en Stata

Tambi´ en en Stata, escogeremos el m´ etodo de clustering que se ajuste a las contestaciones de las preguntas que ya comentamos: 1

¿Jer´ arquico o no jer´ arquico?

2

¿Qu´ e m´ etodo utilizamos para medir la similitud de los grupos?

3

¿Qu´ e medida de distancia usaremos?

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Clustering en Stata

Independientemente del m´ etodo elegido, seguiremos varios pasos: 1

Generamos el objeto cl´ uster.

2

Visualizamos el dendrograma o ´ arbol de cl´ uster (para algunos m´ etodos no est´ a implementado).

3

Extraemos informaci´ on de los grupos detectados.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

1. Generamos un objeto cl´uster.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

2. Visualizamos el clustering mediante un dendrograma.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

3. Extraemos informaci´on sobre los grupos detectados

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Empezamos trabajando con el dataset homework.dta que describe la realizaci´ on de tareas dom´ esticas de un grupo de 30 personas. La matriz de datos tiene una dimensi´ on de 30 filas y 61 columnas. Cada fila es una persona y cada variable representa si esa persona realiza o no cada una de las 60 tareas valoradas (variables binarias). El objetivo es determinar grupos parecidos de personas seg´ un las actividades dom´ esticas que realicen. Para este primer ejemplo contamos con una informaci´ on extra. El investigador nos proporciona previamente a qu´ e grupo pertenece cada individuo, seg´ un sus criterios (est´ a recogido en la variable 61 del dataset). Esta referencia ser´ a interesante para evaluar como est´ a trabajando nuestro clustering. Por supuesto, no ser´ a habitual que dispongamos de esta informaci´ on al comienzo del estudio!

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Leemos los datos desde Stata. Tenemos varias posibilidades: 1. Insertando en la ventana de comandos: use http://www.stata-press.com/data/r12/homework.dta 2. Recuperando el dataset del repositorio de datos de Stata: File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual 3. Otra opci´ on es directamente desde File / Open y seleccionamos el fichero de datos en la carpeta donde lo tengamos almacenado. En cualquier an´ alisis estad´ıstico que hagamos, siempre habr´ a que realizar un descriptivo que nos permita conocer nuestros datos: Statistics / Summaries, tables and tests. Graphics / Scatterplot matrix.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 1. Generamos el objeto cluster: Statistics / Multivariate Analysis / Cluster Analysis / Cluster Data

Si vamos al editor, observaremos que tenemos 3 nuevas variables: id, ord, hgt (id, orden y altura). Son variables que proporcionan info sobre la construcci´ on del clustering.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 2. Representamos el dendrograma o ´ arbol cl´ uster: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 2. Representamos el dendrograma o ´ arbol cl´ uster: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Dendrograms

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Summary variables from cluster analysis

Tras la visualizaci´ on del dendrograma, podemos decidir el n´ umero de clusters con el que queremos trabajar. Hemos escogido 3 y conoceremos que sujetos pertenecen a cada uno de ellos. Esta informaci´ on quedar´ a incorporada en una nueva variable que se crear´ a.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries, tables and tests / Summary and descriptive statistics / Summary statistics

En la pesta˜ na by if in , indicamos la variable que establece los grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries, tables and tests / Summary and descriptive statistics / Summary statistics

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata: Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Summaries, tables and tests /Table / Table of summary statistics

Como ten´ıamos la asignaci´ on “real” de sujetos a sus grupos iniciales, podemos evaluar como ha realizado nuestro clustering la agrupaci´ on de individuos: los resultados son coincidentes!

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejemplo de an´alisis de clustering con Stata:

Paso 3. Extracci´ on de informaci´ on de los grupos generados: Statistics / Multivariate Analysis / Cluster Analysis / Postclustering / Detailed listing of clusters

Nos informa de las caracter´ısticas del clustering utilizado.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Matrices de similitud/disimilitud

El an´ alisis de clustering tambi´ en se puede realizar sobre una matriz de similitud / disimilitud. Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 1: clustering jer´arquico Trabajaremos con el dataset labtech.dta disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Los datos representan un par´ ametro cl´ınico medido en 50 pacientes. Para cada sujeto se determinaron 4 cuantificaciones a lo largo del d´ıa y las 4 fueron efectuadas por el mismo t´ ecnico. De modo que nuestra matriz dispone de 50 filas (pacientes) y 5 columnas (una para cada una de las 4 mediciones realizadas y una quinta columna con el nombre del t´ ecnico). El objetivo del estudio es determinar si hay grupos homog´ eneos de pacientes considerando las medidas realizadas del par´ ametro cl´ınico. Decidimos arbitrariamente elegir el clustering single-linkage con la distancia eucl´ıdea que aparece por defecto.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 1: clustering jer´arquico Plan de trabajo: 1

Realiza una descripci´ on de los datos. Explora gr´ aficamente la relaci´ on entre las 4 mediciones mediante gr´ aficos de dispersi´ on.

2

Realiza el an´ alisis de clustering de las muestras obteniendo el correspondiente dendrograma.

3

¿Hay alguna agrupaci´ on clara en el ´ arbol del cluster? ¿Detectas algo extra˜ no en el dendrograma? ¿Alguna explicaci´ on?. El an´ alisis de clustering tambi´ en constituye una buena herramienta de exploraci´ on de los datos. Pista: cuando hagas el dendrograma cambia la variable que se utiliza para dar nombre a las muestras y elige “labtech” que es el nombre de los t´ ecnicos de laboratorio.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico

Trabajaremos con el dataset physed.dta disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Los datos recogen la informaci´ on de velocidad, fuerza y flexibilidad de 80 personas que participan en un programa de rehabilitaci´ on. Tenemos como objetivo determinar 4 grupos homog´ eneos seg´ un los atributos f´ısicos medidos, para optimizar la formaci´ on y asignaci´ on de recursos dirigidos a estos sujetos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico Plan de trabajo: 1

Leemos los datos en Stata.

2

Realiza un an´ alisis descriptivo que nos permita conocer los datos con los que estamos trabajando. Para empezar un resumen de estad´ısticos descriptivos y un gr´ afico de dispersi´ on de las 3 variables estar´ıa bien. ¿Hay alg´ un tipo de relaci´ on entre las variables? ¿A partir de este descriptivo detectas la existencia de grupos de pacientes?.

3

Realiza el an´ alisis de clustering no jer´ arquico de las muestras utilizando el m´ etodo kmeans. Intenta realizar el correspondiente dendrograma. ¿Alg´ un problema?

4

Tras la realizaci´ on del an´ alisis de cl´ uster, vamos a conocer mejor los grupos detectados. Contesta la siguientes preguntas:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico

Plan de trabajo: ¿Cu´ antas personas est´ an incluidas en cada uno de los 4 grupos? Nos gustar´ıa conocer la media, m´ınimo y m´ aximo de los atributos evaluados para cada grupo y as´ı confirmaremos si realmente est´ an bien diferenciados. Comenta los resultados. Por u ´ltimo, representa de nuevo los datos utilizando los gr´ aficos de dispersi´ on pero esta vez en lugar de que aparezcan puntos, mejor si indicamos que aparezca el n´ umero del grupo al que pertenece cada sujeto, as´ı visualizaremos la relaci´ on entre las variables incorporando esta informaci´ on.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico Resultados:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico Resultados:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico Resultados:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de clustering Clustering con Stata Ejercicios

Ejercicio 2: clustering no jer´arquico Resultados:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

An´ alisis Discriminante Esta t´ ecnica presenta reglas de clasificaci´ on o ´ptimas de nuevas observaciones de las que se desconoce su grupo de procedencia bas´ andose en la informaci´ on proporcionada los valores que en ella toman las variables independientes.

Ejemplos: 1

Determinar las variables cl´ınicas que permitan discriminar mejor entre pacientes de alto/no alto riesgo en una Unidad de Medicina Intensiva.

2

En planificaci´ on y gesti´ on sanitaria tambi´ en se presentan problemas de discriminaci´ on. ¿C´ omo se explican las diferencias entre los usuarios de la sanidad p´ ublica y la privada?, ¿hasta qu´ e punto son el nivel de renta, la gravedad de los s´ıntomas, etc., responsables de la elecci´ on de m´ edico? Las encuestas de salud proporcionan informaci´ on de base suficiente para contestar a estas preguntas con ayuda del An´ alisis Discriminante.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Tipos de An´ alisis Discriminante: 1

Linear Discriminant Analysis (LDA).

2

Quadratic Discriminant Analysis (QDA).

3

Logistic Discriminant Analysis.

4

K th-Nearest-Neighbor Discriminant Analysis.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Tipos de An´ alisis Discriminante:

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

¿C´omo realizamos el An´alisis Discriminante en Stata?

Varios pasos: 1

Descripci´ on de los datos.

2

Estimaci´ on del modelo.

3

Evaluaci´ on del modelo y predicci´ on.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

¿C´omo realizamos el An´alisis Discriminante en Stata?

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Empezamos trabajando con el dataset twogroups.dta que incluye 30 observaciones y tres variables. La primera establece dos grupos y las variables x, y son las que discriminan la pertenencia a un determinado grupo.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 1. Descripci´ on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 1. Descripci´ on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 1. Descripci´ on de los datos: Graphs / Twoways graph: scatter

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 2. Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 2. Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 2. Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 2. Estimaci´ on del modelo: Statistics / Multivariate Analysis / Discriminant Analysis / DLA

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Descripci´ on de los datos por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Descripci´ on de los datos por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Descripci´ on de los datos por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Descripci´ on de los datos por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Evaluaci´ on del modelo: tasa de error por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Evaluaci´ on del modelo: tasa de error por grupos.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Evaluaci´ on del modelo: sujetos mal clasificados.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Reports and statistics

Evaluaci´ on del modelo: sujetos mal clasificados.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejemplo de An´alisis Discriminante con Stata: Paso 3. Evaluaci´ on y predicci´ on del modelo: Postestimation / Predictions and errors

Predicci´ on para un nuevo caso o sujeto.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejercicio 1: An´alisis Discriminante Lineal (DLA)

Trabajaremos con el dataset lawnmower2 disponible en File / Example Datasets / Stata 12 Manual Datasets / Multivariate Statistics Reference Manual Tenemos 24 individuos con informaci´ on correspondiente a tres variables: owner que establece los dos grupos que hay en el dataset (propietario y no propietario), income y lotsize son las dos variables que discriminan si un sujeto pertenece a un grupo u a otro.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejercicio 1: An´alisis Discriminante Lineal (DLA)

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos Tipos de An´ alisis Discriminante An´ alisis Discriminante con Stata Ejercicios

Ejercicio 1: An´alisis Discriminante Lineal (DLA) Plan de trabajo: 1

Realiza una descripci´ on de los datos. Explora gr´ aficamente los datos mediante un diagrama de dispersi´ on. ¿Crees que est´ an bien diferenciados los sujetos pertenecientes a cada grupo?

2

Realiza un an´ alisis de discriminante DLA y pide la tabla de clasificaci´ on Leaveone-out. Interpreta esta tabla, ¿es un buen clasificador el modelo que hemos escogido?. Describe con detalle el funcionamiento de las matrices de confusi´ on: significado de los valores que est´ an en la diagonal, en los extremos. . .

3

Vamos a acercarnos un poco m´ as a nuestros datos y al modelo que hemos generado: - Desde el men´ u de Postestimation realiza un descriptivo por grupos para ver como se comportan las variables. - Por sujetos: lista aquellos sujetos mal clasificados y comenta los resultados que nos ofrece STATA. - Por grupos: ¿cu´ al es el grupo que presenta una probabilidad de error m´ as alta?

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

An´ alisis Factorial Se utiliza para analizar interrelaciones entre un n´ umero elevado de variables cuantitativas explicando dichas interrelaciones en t´ erminos de un n´ umero menor de variables que se denominan factores o componentes principales.

An´ alisis Factorial vs. An´ alisis de Componentes Principales: El An´ alisis Factorial y el An´ alisis de Componentes Principales est´ an muy relacionados. Algunos autores consideran el segundo como una etapa del primero.

El An´ alisis de Componentes Principales trata de hallar componentes (factores) que sucesivamente expliquen la mayor parte de la varianza total. Por su parte el An´ alisis Factorial busca factores que expliquen la mayor parte de la varianza com´ un. El An´ alisis Factorial supone que existe un factor com´ un subyacente a todas las variables, el An´ alisis de Componentes Principales no hace tal asunci´ on.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplos: 1

Si un psic´ ologo quiere determinar los factores que caracterizan la inteligencia de un individuo a partir de sus respuestas a un test de inteligencia, utilizar´ıa para resolver este problema un An´ alisis Factorial.

2

Determinaci´ on de indicadores que midan las necesidades en los servicios sociales de una ciudad a partir de datos de indicadores socioecon´ omicos y demogr´ aficos. An´ alisis de Componentes Principales.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

An´alisis Factorial con Stata

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

An´alisis Factorial con Stata

Varios pasos: 1

Descripci´ on de los datos.

2

Elecci´ on y realizaci´ on del tipo de an´ alisis: Factorial / Componentes Principales.

3

Post-estimaci´ on: evaluaci´ on de resultados.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata:

Disponemos del set de datos audiometric.dta que incluye mediciones audiom´ etricas de ni˜ nos de 9 a˜ nos. Se midieron 4 intensidades diferentes para el o´ıdo derecho y el izquierdo. As´ı por ejemplo la variable lft1000 hace reference al o´ıdo izquierdo en la frecuencia 1000 Hz.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 1. Descripci´ on de los datos: correlaciones Statistics / Summaries, tables, and tests / Summary and descriptive statistics / Correlations and covariances

La matriz de correlaciones de todas las variables nos proporciona una informaci´ on interesante sobre la relaci´ on existente entre ellas.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Seleccionamos las variables sobre las que realizaremos el an´ alisis factorial.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Elegimos el m´ etodo de an´ alisis factorial. En este caso PCA (Principal Component Factor).

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Descripci´ on de las variables.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Lista de valores propios y la proporci´ on de variabilidad explicada.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Paso 2. An´ alisis de Componentes Principales Statistics / Multivariate Analysis / Factor and Principal Component Analysis / PCA

Componentes principales para cada variable.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Screeplot. Gr´ afico de los valores propios.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Screeplot. Gr´ afico de los valores propios.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci´ on gr´ afica de las variables mediante sus dos primeras componentes principales.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci´ on gr´ afica de las variables mediante sus dos primeras componentes principales.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci´ on de las observaciones mediante las puntuaciones en sus dos primeras componentes principales.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Ejemplo de An´alisis de Componentes Principales con Stata: Post-estimaci´ on: evaluaci´ on de resultados. Statistics / Multivariate Analysis / Factor and Principal Component Analysis / Postestimation

Representaci´ on de las observaciones mediante las puntuaciones en sus dos primeras componentes principales.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Objetivos An´ alisis Factorial con Stata

Referencias bibliogr´ aficas: An´ alisis Multivariante. Aplicaci´ on al ´ ambito sanitario. Beatriz Gonz´ alez L´ opezValc´ arcel. Editores SG. Manual de Stata, versi´ on 12.

Francisco Garc´ıa Garc´ıa

An´ alisis Multivariante son Stata

Introducci´ on Clustering An´ alisis Discriminante An´ alisis Factorial

Francisco Garc´ıa Garc´ıa

Objetivos An´ alisis Factorial con Stata

An´ alisis Multivariante son Stata