理解矩阵
综合整理对矩阵的理解
向量
- 向量是什么
- 向量是具有n个相互独立的性质。
- 向量本身可以看成n x 1 的矩阵。
向量操作
线性组合:$c \textbf{v} + d \textbf{w} = c \begin{bmatrix} 1\\\\
1 \end{bmatrix} +d \begin{bmatrix} 2 \\
3 \end{bmatrix}=\begin{bmatrix} c+2d\\
c+3d \end{bmatrix} $- 二维情况,若w与v不共线,线性组合$c \textbf{v}+d \textbf{w}$ 生成2维平面
点积 (数值积、标量积、内积)
- 代数定义:$v \cdot w = \sum_{i=1}^n a_ib_i$ , n = dim S(v)
- $v \cdot w = v^Tw$
- 几何定义: $v \cdot w = \vert a \vert \vert b \vert cos\theta$
- 向量v在另一个向量w上投影长度和w长度的积$v \cdot w = \Vert v \Vert cos \theta \Vert b \vert$
- 如果v是某坐标轴的单位向量,两个向量的点积a⋅ba⋅b就是向量b在此坐标轴上的坐标值。这个结论非常重要,这是傅立叶分析的理论基础。
- 从内积数值上我们可以看出两个向量的在方向上的接近程度。当内积值为正值时,两个向量大致指向相同的方向(方向夹角小于90度);当内积值为负值时,两个向量大致指向相反的方向(方向角大于90度);当内积值为0时,两个向量互相垂直。
- 向量内积的解释
- 力学:一个斜坡上用力F斜上拉一个物体,位移为S(没有重力的情况下),那么这个力F所作的功:$W=F_sS=FScos\theta$
- 电路:热损失=(压降)(电流)=$e^Ty$
- 经济: 收入= (数量)(价格) = $q^Tp$
长度(大小(Magnitude)、模长、范数) : $\Vert v \Vert=\sqrt{v \cdot v}$
- $\vert v \cdot w \vert \leq \sqrt {\Vert v \Vert \Vert w \Vert}$
表示方法:
- 两个数值
- 从原点出发的箭头
- 平面上的一个点
单位向量
- 定义:$u=v/ \Vert v \Vert$是与v同方向的单位向量。
柯西-施瓦茨不等式(Schwars inequality):
- $\vert v \cdot w \vert \leq \Vert v \Vert \Vert w \Vert$
三角不等式:
- $\Vert v + w \Vert \leq \Vert v \Vert + \Vert w \Vert$
矩阵
线性方程 Ax = b的解$x=A^-1b$
矩阵A作用于向量x,结果Ax是A的列向量的线性组合。
Ax是x与A各行的点积
逆矩阵: $x = A^{-1}b$
循环差(Cyclic differences)的解是常数C=(c c c)
独立与非独立
- 独立:w与u和v不共面
- 非独立:$w^*与u和v共面
运算
- A(BC) = (AB)C
- A(B+C) = AB+AC
- $AB \neq BA$
- 置换(permutation)
行交换:$P_{ij}$是单位矩阵i,j两行的互换
AB=C, $C_{ij}$是A中第i行和B中第j列的点积
$ A = [A1 A2], B =\begin{bmatrix} B_1 \\\ B2 \end{bmatrix} => AB = A_1B_1 + A_2B_2$
$(A^p)(A^q) = A^{p+q}$
$A^{-1}A = A, AA^{-1}=I$
转置
- $(A^T)_{ij} = A_ji$
- $(AB)^T=B^TA^T$
- $(A^{-1})^T=(A^T)^{-1}$
- $x \cdot y = x^Ty$
对称矩阵
- $S^T=S$
正交矩阵(orthogonal matrix)
- $Q^T = Q^{-1}$
- $Q^T = Q^{-1}$
逆矩阵
- 可逆:
- 算法测试:消元:A有n个非零主元(pivot)
- 代数测试: det A $\ne$ 0
- 方程测试:Ax=0, x=0是唯一解
- A, B,C可逆,则ABC可逆,且有$(AB)^{-1} = B^{-1}A^{-1},(ABC)^{-1} = C^{-1}B^{-1}A^{-1}$
- $A A^{-1} = I$, 用高斯-约旦消元法由 $\begin{bmatrix} A & I \end{bmatrix}$可得$\begin{bmatrix} I & A^{-1} \end{bmatrix}$
奇异矩阵(singular matrix
- 行列式为0
- 有无穷多个解
相似矩阵
- A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系:$A = P^{-1}BP$
- 一族相似矩阵都是同一个线性变换的描述
矩阵的本质是什么?
- 矩阵的本质是运动的描述。是线性空间里跃迁的描述
- 矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。
- 矩阵描述了一个坐标系。
线性变换是什么?
- 线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。
- 矩阵与向量相乘,就是实施运动(变换)的过程.
- Ax = b的意思是:
- “向量a经过矩阵A所描述的变换,变成了向量b。
- 有一个向量,它在坐标系A的度量下得到的度量结果向量为a,那么它在坐标系I的度量下,这个向量的度量结果是b。因为Mx=Ib。
- 对坐标系施加变换的方法,就是让表示那个坐标系的矩阵与表示那个变化的矩阵相乘。
线性方程的解
- 行表达式显示
- 二维:两条线交于一点,及方程的解
- 三维:三个平面交于一点
- 列表达式方程A作用于向量x生成向量b
- 线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。
- 矩阵与向量相乘,就是实施运动(变换)的过程.
- Ax = b的意思是:
- “向量a经过矩阵A所描述的变换,变成了向量b。
- 有一个向量,它在坐标系A的度量下得到的度量结果向量为a,那么它在坐标系I的度量下,这个向量的度量结果是b。因为Mx=Ib。
- 对坐标系施加变换的方法,就是让表示那个坐标系的矩阵与表示那个变化的矩阵相乘。
- 消元 = 因式分解: A = LU
- 需要$n^3$次计算
- 需要$n^3$次计算
空间
定义
- 标准n维空间$R^n$包含所有带有n个元素的列向量
- 如果v, w是空间S的向量,cv+dw的线性组合一定在S空间内
- S空间的向量,可以是矩阵或者x的函数。零空间是包含一个点x=0的空间
- $R^n$的子空间,是$R^n$内向量的线性空间,例如线y=3x位于$R^2$内
- v+w在子空间内
- cv在子空间内
- 0v必须在子空间内,所以每个子空间都包含零向量
- 不通过原点的平面不是子空间
- 包含v, w的子空间,必须包含所有cv+dw的线性组合
- 矩阵A的列空间包含所有A的列的线性组合,是$R^m$的子空间。
- 列空间包含所有向量Ax。当b位于A的列空间C(A)中,Ax=b才有解
- 向量空间的例子
- M 所有 n x n矩阵构成的向量空间
- F 实函数f(x) 构成的向量空间
- Z 只包含一个零向量的向量空间
- 零空间
- $R^n$中的零空间N(A)包含所有x使得Ax=0的解。此解集包括x=0
- 消元不改变零空间:N(A) = N(U)=N®
- The reduced row echelon form R = rref(A) has all pivots= 1, with zeros above and below
- 如果矩阵R的j列是自由的(没有主元),则Ax=0有$x_j=1$的特殊解。
- 主元的个数=R中非零的行数=R的秩r,于是n-r=自由列数
- Ax=b
- 全部解: $x = x_p + x_n$
- 对$[A\; b]$消元,得到$[R\; d]$, 那么Ax=b等效于Rx=d
- Ax=b和Rx=d只有所有在R中的0行在d中也是0
- 如果Rx=d有解,那么特解xp的所有自由变量都是0
- 当N(A) = 0 时,A有所有列的秩是满的(A has full coliumn rand) r = n
- 当列空间C(A)为$R^m$, A所有行的秩是满的, r = m:Ax=b永远有解
- 四种情况
- r = m = n: 可逆
- r = m < n: Ax=b有解
- r = n < m: Ax=b有1个或0个解
- r < m, r < n: 0 或 $\infty$
- 独立、基和维度
- A的独立列:Ax=0的唯一解x=0. 所以零空间是Z
- 独立向量:所以零组合$c_1v_1+…+c_kv_k = 0$, 且所有c=0
- m < n的矩阵A有独立列,那么A至少有n-m个独立向量/特解
- 如果S是v的所有线性组合,那么$v_1, …v_k$生成空间S
- 当向量$v_1, …v_k$独立且生成S,$v_1, …v_k$是S的基
- S的维度 dim S 等于 S的基的向量的个数
- 如果A是4x4的可逆矩阵,那么他的列是$R^4$的基。 dim $R^4$ = 4
- 四个子空间的维度
- dim C(A) = dim $C(A^T) = r = rank(A)
- dim N(A) = n - r, dim $N(A^T)$ = m - r
- 消元生成行空间的基和N(A), 他们与R相同
- 消元通常会改变列空间和左零空间, 但是维度不变。
- 求一个矩阵的秩:A= $uv^T$ = 列 x 行:C(A) 的基为u, $C(A^T)$=v
空间是什么?
- 由很多(实际上是无穷多个)位置点组成;
- 这些点之间存在相对的关系;
- 可以在空间中定义长度、角度;
- 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动
- 每个空间都必须容纳和支持在其中发生的符合规律的运动(变换)。
方程是什么?
- ax+by + b = 0: 意味着对x,y拉伸之后,求和在移动b个单位回到原点
- 意味着一组向量(x, y|ab+by+b=0)的线性变换之后的投影是一个固定值,或者高维在低维的映射。
线性是什么?
- 线性变换不改变共线性质和距离的比例,就是说原来共线的变换之后还共线,原来等距离的变换之后距离还相等。
- 数加代表位置偏移。数乘代表伸缩和方向。
- 线性变换效果等价于于与向量(a,b)做点乘,其中a和b是两个基向量被变化到的位置。
线性空间是什么?
- 线性空间中的每一个对象是一个多项式。如果我们以x0, x1, …, xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。
- 闭区间[a, b]上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。
基是什么?
- 基是线性空间里的坐标系
- 如果一组向量是彼此线性无关的话,那么它们就可以成为度量这个线性空间的一组基,从而事实上成为一个坐标系体系,其中每一个向量都躺在一根坐标轴上,并且成为那根坐标轴上的基本度量单位(长度1)。
行列式
- 矩阵M的行列式实际上是组成A的各个向量按照平行四边形法则搭成一个n维立方体的体积。