Ax=b及最小二乘法

二维情况

$e \bot a$, 则有

$a^T(b-xa)= 0$

$xa^Ta = a^Tb$

得到: $x = \frac {a^T b} {a^T a}, p = ax => p = a \frac {a^T b} {a^T a} $

$p =({a a^T}/ {a^T a}) b \; p为投影\\\ 或写\;p = Pb \; P为投影矩阵\\\ P = \frac {a a^T} {a^T a} $

解读:

  1. 假设b’=2b, 长度增加2倍,投影会怎么变化?A:p增加2倍
  2. 假设a’=2a, 长度增加2倍,投影会怎么变化? A: p 不变化。
  3. 我们发现,投影是矩阵对向量a的变换。或表示为 投影=[投影矩阵][向量b]

发问:

  1. P的列空间是什么?
    1. C(P)是穿过a的直线
    2. rank (P) = 1
  2. 对称吗?
    1. $P^T = P$, 对称
  3. 对p进行第二次投影会发生什么?
    1. 第二次投影,p点不动,则有$P^2$=P

引申到多维

  • 为什么投影:
    • Ax=b也许没有解, 方程数比未知数多。因此把问题转化成b在a上的投影问题。
    • 因此解$A \hat x=p$, p是b在列空间上的投影。

b是不在平面上的一点, b在平面上的投影为p。

a1, a2 是两个独立向量,的平面空间可以定义为以a1, a2为列向量的空间

误差 e = b - p, 垂直于平面

p的形式应该是p=x1a1+x2a2=A$\hat x$

现在的问题专为:$p=A\hat x$, 找到$\hat x$. 已知$e = b-A \hat x$, e 垂直于平面, 即$e \bot a_1, e \bot a_2$ 于是有:

$a_1^T(b-A \hat x) = 0, a_2^T(b-A \hat x) = 0$

写成矩阵形式

$$\begin{bmatrix} a_1^T \\\ a_2^T \end{bmatrix} (b - A \hat x) = \begin{bmatrix} 0 \\\ 0 \end{bmatrix} $$

或写成:

$A^T(b-A \hat x) = 0$

可知e位于$A^T$的零空间,且有$e \bot C(A)$

得到 $A^TA \hat x = A^T b $

$\hat x = (A^TA)^{-1}A^Tb$

投影$p = A \hat x = A(A^TA)^{-1}A^Tb$

投影矩阵:

$$\bbox [5px,border:2px solid red] {P = A \hat x = A(A^TA)^{-1}A^T}$$

解读:

如果进一步演算

$$ P = A(A^{T}A)^{-1}A^T = A A^{-1} (A^T)^{-1} A^T = I $$

我们得到了单位矩阵,问题出在哪?

A:

  1. A不是方阵,因此没有逆矩阵,所以不能进一步拆解
  2. 如果A是方阵且可逆,那么他的列空间是整个$R^n$。 如果我投影到$R^n$的投影矩阵矩阵是什么?是单位矩阵(因为这个投影什么都不需要做,对原来的向量不需要做任何改变。如果将b投影到$R^3$, b本身位于列空间,所以这个投影是单位矩阵。)
  3. 回忆1维的例子,$P = \frac {a a^T} {a^T a} $. 有点像
  4. 我们和别的投影矩阵一样,我们对这个投影矩阵有什么样的期待?
    1. 对称, $P^T = T$
    2. $P^2 = P$? 证明: $$ P^2 = A(A^T A)^{-1} A^T A(A^T A)^{-1} A^T \\\ = A(A^T A)^{-1}\;(A^T A(A^T A)^{-1}) A^T \\\= A(A^T A)^{-1} A^T $$

总结:

  1. 如果b位于列空间, Pb=b, (想像桌面上的铅笔的投影没有变化) $$ P = A(A^T A)^{-1} A^T \\
    b = Ax \\
    Pb = A(A^T A)^{-1} A^T Ax \\\= A((A^T A)^{-1} A^T A)x \\\ = Ax \\\= b $$

  2. 如果b垂直于列空间,Pb=0, (想象铅笔垂直于桌面)

  3. 什么向量垂直于列空间?答案是$N(A^T)$的向量, $A^T$的零空间的向量。

例题:

问题:

解答:

视频连接