博客
关于我
线性代数应该这样学9:上三角矩阵、对角矩阵
阅读量:426 次
发布时间:2019-03-06

本文共 6691 字,大约阅读时间需要 22 分钟。

在本系列中,我的个人见解将使用斜体标注。由于时间关系,移除了例题部分,可参考,如有疑问,可在评论区处留言。由于文章是我独自整理的,缺乏审阅,难免出现错误,如有发现欢迎在评论区中指正。

目录

Part 1:上三角矩阵

本节含有许多实用性的结果,并且证明手段往往不唯一,应当认真体会一下不同证明方法之间的异同

本征值的存在性 有限维非零复向量空间上,每个算子均有本征值。

注意,这里并没有涉及本征值的个数,也不涉及重特征值问题

\(\dim V=n>0\)\(T\in\mathcal L(V)\)。取\(v\in V\)\(v\ne 0\)\(n+1\)个向量\(v,Tv,\cdots,T^nv\)线性相关,故存在不全为0的实数\(a_0,a_1,\cdots,a_n\),使得

\[0=a_0v+a_1Tv+\cdots+a_nT^nv.\]

如果\(a_1=\cdots=a_n=0\),则由于\(v\ne 0\)必有\(a_0=0\),这与线性相关矛盾。令

\[p(z)=a_0+a_1z+\cdots+a_nz^n,\]

由上面的分析,它不是一个常值多项式,故存在\(\lambda_1,\cdots,\lambda_m\in\mathbb{C}\),使得

\[p(z)=a_0+a_1z+\cdots+a_nz^n=c(z-\lambda_1)\cdots(z-\lambda_m)\]

所以

\[0=p(T)v=c(T-\lambda_1I)\cdots(T-\lambda_mI)v\]

至少存在一个\(j\),使得\(T-\lambda_jI\)不可逆(否则容易得出\(v=0\)),故找到了\(T\)的一个本征值\(\lambda_j\)

习题16、17分别利用线性映射证明本征值的存在性,下面给出证明。

对于\(T\in\mathcal L(V)\),构造线性映射\(f\in\mathcal L(\mathcal P_n(\mathbb{C}),V)\),其中\(\forall p\in\mathcal P_n(\mathbb{C})\),有

\[f(p)=p(T)v\in V.\]

由于\(\dim\mathcal P_n(\mathbb{C})=n+1>n=\dim V\),所以\(f\)不是单射,存在\(p\ne 0\)使得

\[p(T)v=0.\]

显然\(p(z)\)不能是非零常数,由代数基本定理,可以分解为

\[c(T-\lambda_1I)\cdots(T-\lambda_mI)=0,\]

所以存在一个\(\lambda_j\)\(T\)的特征值。


对于\(T\in\mathcal L(V)\),构造线性映射\(g\in\mathcal L(P_{n^2}(\mathbb{C}),\mathcal L(V))\),其中\(\forall p\in\mathcal P_{n^2}(\mathbb{C})\),有

\[g(p)=p(T),\]

由于\(\dim\mathcal P_{n^2}(C)=n^2+1>n^2=\dim\mathcal L(V)\),所以\(g\)不是单射,存在\(p\ne 0\)使得

\[p(T)=0\]

显然\(p(z)\)不能使非零常数,故依旧有如上的分解。

算子的矩阵(matrix of an operator)\(T\in\mathcal L(V)\),并设\(v_1,\cdots,v_n\)\(V\)的基,\(T\)关于该基的矩阵定义为\(\mathcal M(T)=(A_{i,k})_{n\times n}\),其元素定义为

\[Tv_k=A_{1,k}v_1+\cdots+A_{n,k}v_k.\]

在讨论线性映射的矩阵时,为\(V,W\)都找了一组基;而进入到算子的矩阵,由于线性空间只有一个,所以只使用\(V\)的一组基,并且一般使用标准基

矩阵的对角线(diagonal of a matrix) 方阵的对角线由位于左上角到右下角的直线上的元素组成。

上三角矩阵(upper-triangular matrix) 如果位于方阵对角线下方的元素都是0,则这个方阵称为上三角矩阵。

上三角矩阵与不变子空间之间存在联系,若\(T\in\mathcal L(V)\),且\(v_1,\cdots,v_n\)\(V\)的基,则以下三个说法等价:

  1. \(T\)关于\(v_1,\cdots,v_n\)的矩阵\(\mathcal M(T)\)是上三角的。
  2. \(\forall j=1,\cdots,n\)\(Tv_j\in\mathrm{span}(v_1,\cdots,v_j)\)
  3. \(\forall j=1,\cdots,n\)\(\mathrm{span}(v_1,\cdots,v_j)\)\(T\)下的不变子空间。

上三角矩阵的存在性\(V(\mathbb{C})\)上,每个算子\(T\in\mathcal L(V)\)均有上三角矩阵。

这个定理的实用之处在于,将特征值关联到了线性映射上。并且,书上给出的两个证明,一个基于限制算子,一个基于商算子,由于商算子我们平时不常用,因此更应该注意商算子的用法

限制算子:使用数学归纳法,若\(\dim V=1\),则结论显然成立。

现设\(\dim V>1\),且对于所有维数比\(V\)小的复向量空间都成立这样的结论。设\(\lambda\)\(T\)的任意本征值,\(U=\mathrm{range}(T-\lambda I)\),则由于\(T-\lambda I\)不是满射,有\(\dim U<\dim V\)。下证明\(U\)\(T\)下的不变子空间,\(\forall u\in U\),有

\[Tu=(T-\lambda I+\lambda I)u=(T-\lambda I)u+\lambda u\in U.\]

\(T|_U\)\(U\)上的算子,由归纳假设,\(U\)有基\(u_1,\cdots,u_m\)使得\(T|_U\)关于这个基有上三角矩阵,因此对每个\(j=1,\cdots,m\)都有

\[Tu_j=T|_U (u_j)\in\mathrm{span}(u_1,\cdots,u_j).\]

\(u_1,\cdots,u_m\)扩充成\(V\)的基\(u_1,\cdots,u_m,v_1,\cdots,v_n\),对每个\(k\),都有

\[Tv_k=(T-\lambda I)v_k+\lambda v_k,\]

由于\((T-\lambda I)v_k\in U\)\(\lambda v_k\in\mathrm{span}(v_k)\subset\mathrm{span}(v_1,\cdots,v_k)\),所以

\[Tv_k\in\mathrm{span}(u_1,\cdots,u_m,v_1,\cdots,v_k),\]

\(T\)关于基\(u_1,\cdots,u_m,v_1,\cdots,v_n\)有上三角矩阵。


商算子:使用数学归纳法,若\(\dim V=1\),则结论显然成立。

现设\(\dim V=n>1\),并设对于所有\(n-1\)维复向量空间都成立这样的结论。设\(v_1\)\(T\)的任意一个本征向量,\(U=\mathrm{span}(v_1)\),则\(U\)\(T\)下的不变子空间,且\(\dim U=1\),故\(\dim V/U=n-1\)

\(V/U\),由归纳假设,存在一组基\(v_2+U,\cdots,v_n+U\),使得\(T/U\)关于该基有上三角矩阵,即\(\forall j=2,\cdots,v_n\)

\[(T/U)(v_j+U)\in\mathrm{span}(v_2+U,\cdots,v_j+U),\]

\[Tv_j+U=a_2v_2+\cdots+a_jv_j+U,\]

所以

\[Tv_j-(a_2v_2+\cdots+a_jv_j)=a_1v_1,\]

\[Tv_j\in\mathrm{span}(v_1,\cdots,v_j).\]

这就证明\(T\)关于\(v_1,\cdots,v_n\)这组基(这一组确实是基)存在上三角矩阵。

上三角矩阵与可逆性\(T\in\mathcal L(V)\)关于\(V\)的某个基有上三角矩阵,则\(T\)是可逆的当且仅当这个上三角矩阵对角线上的元素都不是0。

这是一个基础定理,由此可以很容易得到其他推论

\(v_1,\cdots,v_n\)\(V\)的基,\(T\)关于这组基存在上三角矩阵:

\[\mathcal M(T)=\begin{pmatrix}\lambda_1 & & & * \\\vdots & \lambda _2 & & \\0 & 0 & \ddots & \\0 & 0 & \cdots & \lambda_n\end{pmatrix}.\]

先证充分性。上面的矩阵表明\(Tv_1=\lambda_1v_1\),由于\(\lambda_1\ne 0\),所以\(T(v_1/\lambda_1)=v_1\),即\(v_1\in\mathrm{range}T\)。从而

\[T(v_2/\lambda_2)=a_1v_1+v_2,\quad v_2\in\mathrm{range}T,\\T(v_3/\lambda_3)=b_1v_1+b_2v_2+v_3,\quad v_3\in\mathrm{range}T,\\\vdots\]

以此类推,\(v_1,\cdots,v_n\in\mathrm{range}T\),故\(T\)是满的,等价于\(T\)是可逆的。

再证必要性。\(T\)是可逆的故\(\mathrm{null}T=\{0\}\),所以\(Tv_1=\lambda_1v_1\ne 0\)\(\lambda_1\ne 0\)。如果存在某个\(\lambda_j=0\),且\(\forall k<j\)都有\(\lambda_k\ne 0\),则

\[Tv_j\in\mathrm{span}(v_1,\cdots,v_{j-1}),\]

同时\(T\)\(\mathrm{span}(v_1,\cdots,v_{j})\)映射到\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上,即\(T\)在子空间\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上不是单射,存在某个\(v\in\mathrm{span}(v_1,\cdots,v_j)\)使得\(v\ne 0\)\(Tv=0\),这与\(T\)的可逆性矛盾。

上三角矩阵的特征值\(T\in\mathcal L(V)\)关于\(V\)的某个基有上三角矩阵,则\(T\)的本征值恰为这个上三角矩阵对角线上的元素。

\(\lambda \in\mathbb{F}\),则

\[\mathcal M(T-\lambda I)=\begin{pmatrix}\lambda_1-\lambda & & & * \\\vdots & \lambda _2-\lambda & & \\0 & 0 & \ddots & \\0 & 0 & \cdots & \lambda_n-\lambda\end{pmatrix}.\]

为使得\(T-\lambda I\)可逆,必有\(\lambda\)等于\(\lambda_1,\cdots,\lambda_n\)中的某一个,即\(\lambda_1,\cdots,\lambda_n\)\(T\)的全部特征值。

Part 2:对角矩阵

对角矩阵(diagonal matrix) 对角矩阵是对角线以外的元素全是0的方阵。

  • 若一个算子关于某个基有对角矩阵,则对角线上的元素恰为该算子的本征值。

本征空间(eigenspace)\(T\in\mathcal L(V)\)\(\lambda \in \mathbb{F}\),则\(T\)相应于\(\lambda\)的本征空间定义为

\[E(\lambda,T)=\mathrm{null}(T-\lambda I).\]

  • 如果\(\lambda\)不是\(T\)的本征值,则\(E(\lambda,T)=\{0\}\),反之亦然。
  • \(E(\lambda,T)\)\(T\)的相对应于\(\lambda\)的全体本征向量加上\(0\)构成的集合。
  • \(E(\lambda,T)\)\(V\)关于\(T\)的不变子空间,\(\forall v\in E(\lambda,T)\)\(Tv=\lambda v\)

本征空间的和是直和\(V\)是有限维的,\(T\in\mathcal L(V)\),且\(\lambda_1\cdots,\lambda_m\)\(T\)的互异本征值,则

\[E(\lambda_1,T)+\cdots+E(\lambda_m,T)\]

是直和,且

\[\dim E(\lambda_1,T)+\cdots+\dim E(\lambda_m,T)\le \dim V.\]

这说明,不同本征空间是互不相交的(除了\(0\))。这里用的是小于等于号,说明\(V\)中并非所有向量都是特征向量

假设\(u_j\in E(\lambda_j,T)\),且\(u_1+\cdots+u_m=0\)。由于相应于不同本征值的本征向量线性无关,所以\(u_j=0,\forall j\),这说明

\[E(\lambda_1,T)+\cdots+E(\lambda_m,T)\]

是直和,自然成立下方的不等式。

可对角化(diagonalizable) 如果算子\(T\)关于\(V\)的某个基有对角矩阵,则\(T\)是可对角化的。

可对角化的算子具有很简洁的表达形式,如果要计算\(Tv\),只要将\(v\)关于对角基分解即可

以下说法等价:

  • \(T\)可对角化。
  • \(V\)有由\(T\)的本征向量构成的基。
  • \(V\)有在\(T\)下不变的一维子空间\(U_1,\cdots,U_n\),使得\(V=U_1\oplus\cdots\oplus U_n\)
  • \(V=E(\lambda_1,T)\oplus\cdots\oplus E(\lambda_m,T)\)
  • \(\dim V=\dim E(\lambda_1,T)+\cdots+\dim E(\lambda_m,T)\)

以上五点,\(1\Leftrightarrow 2\Leftrightarrow 3\)\(4\Leftrightarrow 5\)都是显然的,下证\(2\Leftrightarrow 4\)

先证\(2\Rightarrow 4\),若\(V\)\(T\)的本征向量构成的基,则显然

\[V=E(\lambda_1,T)+\cdots+E(\lambda_m,T).\]

又因为不同本征值对应的本征空间是直和,所以

\[V=E(\lambda_1,T)\oplus\cdots\oplus E(\lambda_m,T).\]

最后证\(4\Rightarrow 2\),在每个\(E(\lambda_j,T)\)内取一组基,将其合在一起就得到\(V\)的本征向量构成的基。

本征值足够多则可对角化\(T\in\mathcal L(V)\)\(\dim V\)个互异的本征值,则\(T\)可对角化。

\(\dim V=n\)\(\lambda_1,\cdots,\lambda_n\)\(T\)\(n\)个互异本征值,对应的本征向量为\(v_j\),则这些\(v_j\)是线性无关的,由于长度为\(n\)的线性无关组是\(V\)的基,所以\(v_1,\cdots,v_j\)\(V\)的一组基,故\(T\)可对角化。

事实上,由于不同本征空间都是\(T\)下的不变子空间,所以将不同本征空间的基组成整个\(V\)上的一组线性无关向量,对应的矩阵是一个对角子矩阵;进而将这个向量组扩充成一组基

转载地址:http://ftbyz.baihongyu.com/

你可能感兴趣的文章
【DG】主rac + 备rac dg 部署
查看>>
【DG】物理DG中主库的LNSn、NSS、NSA进程的比较
查看>>
Oracle一次缩小表空间的处理过程
查看>>
数据库笔试面试题库(Oracle、MySQL等)
查看>>
【三思笔记】 全面学习Oracle分区表及分区索引
查看>>
【AIX】AIX内存机制
查看>>
造成错误“ORA-12547: TNS:lost contact”的常见原因有哪些?
查看>>
wcf webHttpBinding Post 大数据量提交 ios c#客户端
查看>>
sql 时间总结
查看>>
【权限的思考】(一)使用反射实现动态权限
查看>>
多线程设置flag标志位实现同步
查看>>
[LeetCode题解]141. 环形链表 | 快慢指针
查看>>
MySQL错误日志(Error Log)
查看>>
MySQL二进制文件(binlog)
查看>>
Redis性能篇(二)CPU核和NUMA架构的影响
查看>>
MMORPG大型游戏设计与开发(客户端架构 part3 of vegine)
查看>>
C基础 带你手写 redis ae 事件驱动模型
查看>>
深度优先搜索和广度优先搜索
查看>>
我是个怎样的人
查看>>
C基础 北京大公司面试简单总结
查看>>