Lecture 7 Introduction to the Singular Value Decomposition

1. 问题引入和投影矩阵的性质

Goal:对于观测值X1,X2,,XpRn,找到一个一维子空间(可以理解为一根直线)能”最好的拟合数据”

Solution:

 把每一个 Xi 投影到 aProjaXi , 投影到让距离 di2=XiProjaXi22

复习Projection Matrices

If ARn×p张成的子空间,那么Projection of X onto span(cols(A))=ProjAX,如果A的每列都是线性无关的,并且有:

(1)ProjAX=A(ATA)1X

其中,PA=A(ATA)1AT

还有性质:

  1. (2)PA=PA2=PAPA=PAT=PATPA
  2. If A=a,

    (3)Pa=a(aTa)1aT=aaTaTa

    因为(aTa)1是一个标量(可以看详细投影矩阵的证明)。

  1. The orthofonal complement of a subspace is the set of all vectors orthogonal to the subspace.

    子空间的正交补 orthofonal complement 是所有正交于子空间的向量的集合(这个子空间是正交子空间)。并且:ATB=0(正交)

    (不是这个图的示意,是)如果ARn×r0,那么BRn×(nr)。维度上和不变,正交补的维度是其差。

对于任意的XRn,能写作:

(4)IX=PAX+PBX=(PA+PB)XI=PA+PB PB=IPA

正交空间

SVD几何表示

2. 证明最小距离和、引入奇异向量奇异值

SVD

Pa用式3代入,然后相当于做了提取公因子Xi [拓展作单位矩阵 IXi ],那么IaaTaTa可以看作投影矩阵IPa,由式4可得这也是投影矩阵PB,这就是正交补。再写作内积展开式,由性质2公式3可以知道(IaaTaTa)T(IaaTaTa)=IaaTaTa.

​ 而XiTX是常数跟a无关。即只要最大化XiaaTXiaTa.

aTXi是标量。

(5)XXT=[||||X1X2Xp||||][X1X2Xp]=X1X1T+X2X2T++XpXpT=1pXiXiT

​ 用式5矩阵的外积,写作矩阵外积去掉求和,只要求argmaxa(aTXXTaaTa)

现在定义一些名词:

  1. 使得上是取得最大值的向量a^称作X的第一个左奇异向量。

  2. aTXXTaaTa=σ12(这里没用黑粗体懒得写了)的值称作X第一个奇异值。

    (6)aTXXTaaTa=σ12=Xop2 "operator norm"=X22(2)

3. 奇异值分解

SVD降维

U的列向量是X的列向量的正交基。

Σ是没有负元素的对角矩阵,σ1σ2σp

U=[U1,U2,,Un], U1is the best 1d subspace fit to Xis。也是上面式6的解。

X~i(1)=XiProjU1Xi

U2= the best 1d subspace fit to X~is.

Xn×p有秩r<min(n,p)

thin Σ

4. PCA

PCA-1

PCA-2