1 Curso de Análisis Estadístico de Datos Composicionales ICP-Piedecuesta, Santander Marzo-2007 Introducción a la Descomposición en Valores Principales R. Meziat Departamento de Matemáticas, Universidad de los Andes
2 Contenido 1.Matrices cuadradas, simétricas y definidas positivas 2.Valores propios de una matriz cuadrada y sus vectores propios asociados
3
4
5
6 PROPIEDADES DE LA SVD
7
8
9
10
11 Teorema de Eckart-Young
12
13 ANÁLISIS POR COMPONENTES PRINCIPALES Objetivo: Reducir la dimensión en el conjunto de datos y mantener la variabilidad de la collección original.
14 metodología Supondremos que la matriz A es de dimensiones NXD, de manera que contiene N observaciones para D variables. Fácilmente encontramos la matriz de covarianzas para las variables involucradas Claramente S es DXD simétrica y semidefinida positiva. Procedimiento de cálculo de S sigue a continuación:
15 metodología
16 Calculamos los valores propios para la matriz de covarianzas S: Calculamos una base ortonormal de correspondientes vectores propios:
17 metodología Manteniendo el orden decreciente en los valores propios tenemos fijamos k para los primeros y mayores valores propios de S y sus k correspondientes vectores propios:
18 metodología Definimos una transformación natural de en como:
19 Aplicación a la matriz de covarianzas
20 FIN