上一次演讲中我问到:“数学对你来说意味着什么?”有的人回答:“处理数字,处理结构”,“那么如果我问你音乐对于你来说意味着什么,你会回答“处理音符吗”? ——塞尔日·兰
变换中被留在张成空间内的向量,就是特征向量(上例x轴和 ( − 1 , 1 ) (-1,1) (−1,1))。 其中每个向量被拉伸或抽缩的比例因子,就是特征值(上例3和2)。 正负表示变换的过程中是否切翻转了方向。 从计算角度来看特征值和特征向量,里面包含了很多对以前只是回顾和整合。
根据特征向量和特征值的定义,使用数学的方法来表示即 A v ⃗ = λ v ⃗ \mathbf A \mathbf{\vec v} = \lambda \mathbf{\vec v} Av =λvA \mathbf A A 是求特征值和特征向量的变换矩阵; v ⃗ \mathbf{\vec v} v 是特征向量; λ \lambda λ 是特征值;目标是找 v ⃗ \mathbf{\vec v} v 和 λ \lambda λ
至于为何会用这个式子来定义特征向量和特征值呢,我们继续观察这个式子中的 λ v ⃗ \lambda \mathbf{\vec v} λv ,考虑到右边是一个矩阵乘法,我们希望左右都是一个矩阵乘法,这样方便等价和计算。观察发现, λ v ⃗ \lambda \mathbf{\vec v} λv 就是给 v ⃗ \mathbf{\vec v} v 中每一个元素都乘以 λ \lambda λ 。对角矩阵 I \mathbf I I 且对角线元素为 λ \lambda λ 的矩阵也能有同样的变换结果,得到下列表达式 A v ⃗ = ( λ I ) v ⃗ ⟹ ( A − λ I ) v ⃗ = 0 \mathbf A \mathbf{\vec v} = (\lambda \mathbf I ) \mathbf{\vec v} \implies (\mathbf A - \lambda \mathbf I ) \mathbf{\vec v} = 0 Av =(λI)v ⟹(A−λI)v =0 观察这个等式你会发现:可以把 A − λ I \mathbf A - \lambda \mathbf I A−λI 矩阵看成一个对 v ⃗ \mathbf{\vec v} v 矩阵的变换,目的是把 v ⃗ \mathbf{\vec v} v 压缩到更低的维度。而空间压缩对应的恰好就是变换矩阵的行列式为0
旋转变换 解出特征值能发现答案是 ± i \pm i ±i ,没有特征向量存在,即特征值出现复数的情况一般对应于变换中的某种旋转。 剪切变换 Shear变换。x轴不变,只有一个特征值,为1( ( λ − 1 ) 2 = 0 (\lambda-1)^2=0 (λ−1)2=0) 伸缩变换 特征值只有一个,但是是空间中所有的向量都是特征向量。
对角矩阵:只有对角线非零的矩阵。解读它的方法是:所有的基向量都是特征向量。因为之前提到过,矩阵的第一列是 ı ^ \hat {\imath} ı^ ,第二列是 ȷ ^ \hat {\jmath} ȷ^ ,往后同理。这样就能发现,如果一列只有对应的位置非零,那么这个坐标轴本身就就是特征向量。 一组基向量(同样是特征向量)构成的集合被称为一组:特征基 对角矩阵有一个好处是计算方便,多次矩阵乘法非常容易,这时我们就希望利用对角矩阵(基向量为特征向量)的便于计算的特性,利用上一节提到的基向量变换的方法,把特征向量作为基,对每一个矩阵进行变换后再进行计算,最后再左乘变换矩阵的逆求回原矩阵得到结果。 但需要说明的是,并不是所有的矩阵都能对角化,比如Shear变换,它的特征向量不够多,不足以张成一个空间。