Componentes Principales

TEMA 2: COMPONENTES PRINCIPALES ÍNDICE: 1- ¿Cómo se relacionan todas las variables con la que yo quiero? 2- Matriz de co

Views 77 Downloads 0 File size 613KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TEMA 2: COMPONENTES PRINCIPALES ÍNDICE: 1- ¿Cómo se relacionan todas las variables con la que yo quiero? 2- Matriz de correlaciones y de varianzas y covarianzas para las nueve variables 3- Representación Gráfica de los Autovalores 4- Calcular las Cargas Factoriales (rij) 5- Activas .PC 6- Círculos de Correlación 7- Retención de Componentes 8- Qué Explica la C1 de las Variables (Porcentaje) 9- Problemas que suelo tener -Generar el .Table -Realizar gráfica y que aparezcan los nombres.

El objetivo es la disminución de información. ¿Cómo se relacionan todas las variables con la que yo quiero? Estadísticos --- Resúmenes --- Matriz de Correlaciones Así podemos ver qué relación lineal presentan las variables cuantitativas. Al realizar la matriz de correlaciones obtengo una tabla con todas las variables, para que podamos quedarnos con 2 o 3 variables todas deben tener una buena relación, así esas 2 o 3 variables explicarán todas. Los nuevos componentes (variables) generados deben explicar la inercia (información que todas comparten). Al tipificar obtengo igual coeficiente de correlación, covarianza y varianza (la cual es igual a 1). La varianza mide la variabilidad, a través de ella puedo saber qué variables son constantes, esto sucede cuando la varianza es cero. Si entre dos variables no existe relación son incorreladas (dependencia grado 1). No obstante, no importa si existen 1 o 2 con las que no tenga relación, basta con que tenga buena relación lineal con un grupo de variables. (Ej: Ca tiene buena relación con Conduct, N, pH).

En este caso podemos quitar Conduc, ya que el Na aporta casi toda su info (0,97). La matriz de varianza y covarianza se denota con una ”S”. Trabajando con Soils Nos movemos en r 9 y queremos pasar a r 2 o r 3 . Obtenemos una matriz 9x9, de la cual podemos decir que es: -

-

Cuadrada. Simétrica (es lo mismo (x,y) que (y,x). Inversa, det distinto de 0, no obstante es un determinante muy pequeño, esto nos indica que existe mucha relación entre las variables. Si la matriz fuera incorrelada el det = 1. 9 autovalores, el 1º autovector coincide con C1… I c - I I = 0.

Las coordenadas del centroide son las medias de x e y. Para hacer un cambio en el sistema de referencia de los componentes principales necesito α. Para conocer la INERCIA nuestro punto de partida es una matriz, cuyas filas son las individuos y las variables son las columnas. Medida de Circularidad: R, matriz de correlación y S, matriz de varianza y covarianzas. Al tipificar ambas son iguales. Para obtener un ajuste perfecto la nube de puntos debe de estar muy perfilada, ser una recta. Trabajando con Soils Realizando una matriz de correlaciones y sacando sus autovalores y autovectores (eigen(A)) podemos ver que es la 1º columna de autovectores la que más explica (6.54) Estadísticos --- Análisis dimensional --- Análisis Componentes Principales Princomp  Salida de Componentes Principales cor = TRUE  Trabajo con matriz de correlaciones cor = False  Trabajo con matriz de varianzas y covarianzas .PC  el . quiere decir que es temporal (si vuelvo a ejecutarlo ya no funciona, para que funcione ejecutamos toda la línea) El 1º autovector es la 1º componente = 6,54 + 50%

Proporción varianza: lo que explica cada componente Acumulate proporción: a la 2º le suma la 1º, a la 3º le suma la 1º y 2º… C11 = a11*x11 + a12*x21… a11: PESOS, nos ayudan a explicar las componentes. Cargas factoriales: ayudan a completar la información

Matriz de correlaciones y de varianzas y covarianzas para las nueve variables R