K-L 变换的推导分两步,第一步给出方均截断误差的一个下界,第二步再给出一组具体的 RN 空间中的正交基,说明这个下界可以取到,然后我们可以称这一组基上的展开为 K-L 变换。
K-L变换推导#
设 N 维随机向量 x 的自相关矩阵为 Cx=E[xxT]。由于 Cx 为实对称半正定矩阵,其特征值分解为
Cxuj=λjuj,(j=1,2,…,N)其中,特征向量构成标准正交基,即 ujTuk=δjk。设特征值已按降序排列,若有 l>1 多重特征值,则分开写成 l 个特征值;由于其特征空间一定为 l 维子空间,所以不会造成问题。
λ1≥λ2≥⋯≥λN≥0设有一组任意的标准正交基 {ϕ1,ϕ2,…,ϕN};容易得到,在这一组正交基上展开,保留前 M 项的截断误差均方值(MSE)为:
ϵ2=i=M+1∑NϕiTCxϕi将基向量 ϕi 投影到 Cx 的特征子空间 {uj} 中得到
ϕi=j=1∑Naijuj其中投影系数 aij=ujTϕi。由于 {ϕi} 和 {uj} 均为标准正交基,过渡矩阵 A=[aij]N×N 为正交矩阵,满足:
i=1∑Naij2j=1∑Naij2uj=1=1=i=1∑Najiϕi将 ϕi 的展开式代入截断误差公式:
ϕiTCxϕi=(j=1∑Naijuj)TCx(k=1∑Naikuk)=j=1∑Nk=1∑NaijaikujT(Cxuk)=j=1∑Nk=1∑Naijaikλk(ujTuk)=j=1∑Nk=1∑Naijaikλkδjk=j=1∑Naij2λj求和得到总截断误差,并交换求和顺序:
ϵ2=i=M+1∑N(j=1∑Naij2λj)=j=1∑Nλj(i=M+1∑Naij2)令 wj=∑i=M+1Naij2,则目标函数化为
ϵ2=j=1∑Nwjλj对权重 wj 放缩可知其上下界。根据正交矩阵的性质:
0≤wj=i=M+1∑Naij2≤i=1∑Naij2=1且对所有 wj 求和:
j=1∑Nwj=j=1∑Ni=M+1∑Naij2=i=M+1∑N(j=1∑Naij2)=i=M+1∑N1=N−M总结一下目前的推论如下:
0≤wj≤1,∀j∈{1,…,N}j=1∑Nwj=N−Mλ1≥λ2≥⋯≥λN≥0由于 wj 的上限为 1,且总和为 N−M,根据排序不等式,我们可以得到下列 N−1 个不等式(1≤M≤N−1):
ϵ2=j=1∑Nwjλj≥j=M+1∑Nλj不等式右侧仅由随机变量 x 的性质决定;由此我们分别得到了 N−1 个截断误差的下界。接下来证明这个下界可以取到。
当 aij=δij 时,我们有 ϕi=ui, ∀j∈{1,…,N},此时
wjwj=1,对于 j∈{M+1,M+2,…,N}=0,对于 j∈{1,2,…,M}容易验证此时所有等号同时取得。
引理:排序不等式#
已知序列 {λj} 满足 λ1≥λ2≥⋯≥λN≥0,且权重变量 {wj} 满足 0≤wj≤1,∀j∈{1,…,N} 且 ∑j=1Nwj=N−M(1≤M≤N−1 且为整数)。
根据排序不等式的原理,当较小的权重与较大的值相乘、较大的权重与较小的值相乘时,内积达到最小。因此,我们需要证明:
j=1∑Nwjλj≥j=M+1∑Nλj我们将目标不等式作差,考察其差值 Δ:
Δ=j=1∑Nwjλj−j=M+1∑Nλj将求和区间拆分为前 M 项与后 N−M 项:
Δ=j=1∑Mwjλj+j=M+1∑N(wj−1)λj根据已知条件,序列 {λj} 是单调递减的,因此对于任意 j≤M,都有 λj≥λM;对于任意 j≥M+1,都有 λj≤λM。
由于 wj≥0,对于前 M 项,我们可以得到:
j=1∑Mwjλj≥j=1∑MwjλM=λMj=1∑Mwj同时,由于 wj≤1,即 (wj−1)≤0。结合 λj≤λM (j≥M+1) 的条件,在相乘放缩时不等号方向反转,因此对于后 N−M 项,我们可以得到:
j=M+1∑N(wj−1)λj≥j=M+1∑N(wj−1)λM=λMj=M+1∑N(wj−1)将上述两部分的放缩结果代入 Δ 的表达式中:
ΔΔΔ≥λMj=1∑Mwj+λMj=M+1∑N(wj−1)≥λMj=1∑Mwj+j=M+1∑Nwj−j=M+1∑N1≥λM(j=1∑Nwj−(N−M))根据已知条件 ∑j=1Nwj=N−M,代入上式即可得到:
Δ≥λM((N−M)−(N−M))=0因此,∑j=1Nwjλj−∑j=M+1Nλj≥0,即:
j=1∑Nwjλj≥j=M+1∑Nλj证毕。上面已经给出了取等条件,所以这里证明下界就可以了。