线性代数学习笔记(九):埃尔米特矩阵

6.4 埃尔米特矩阵

在前面的章节中我们一直关注的都是实矩阵, 在本节中我们将讨论关于复矩阵的一些内容, 并关注类似于对称以及正交的矩阵

复内积

为一复标量, 则 的长度为

中的向量 的长度为

为了保持和前面记号的相似性, 我们可以记

从而有

定义 为一复数域上的向量空间. 上的 内积 (inner product)是一个关联 中的任意一对向量 的复数 , 它满足如下条件:

  1. , 等号成立的充要条件为 .
  2. 中所有的 成立.
  3. .

在定义了内积以后, 实数域中很多定理可以相应的推广到复数域中. 回顾定理5.5.2, 若 为一实内积空间 中的一组规范正交基, 且

相应的, 若是在复内积空间中, 若 为一组规范正交基, 且

为了计算上面的 , 我们可以定义 上的一个内积为, 对 中的所有的

这个定义实际上是完全仿照前面实数域上的定义来的, 在实数域上我们有 , 在复数域中我们前面有 , 因此可以很自然的推广出复数域下的内积. 经过验证, 前面提到的内积的确满足内积的定义, 因此成立. 因为实数域和复数域内积定义的相似性, 所以很多计算都是相似的, 下面给出了一些对应的计算

埃尔米特矩阵

为一 的矩阵, 且对每一 , . 我们可以把 写为

其中 均为实的. 定义矩阵 的共轭为

为一个将 的每一个元素取共轭得到的矩阵. 的转置记为 . 所有的元素均为复数的 矩阵构成的向量空间记为 . 若 的矩阵, 且 , 则容易验证下列法则

  1. .
  2. .

定义 若一个矩阵 满足 , 则它称为 埃尔米特矩阵 (Hermitian).

埃尔米特矩阵有很多很好的性质, 下面我们将依次通过一些定理来介绍这些性质

定理6.4.1 埃尔米特矩阵的特征值均为实的. 此外, 属于不同特征值的特征向量是正交的

这个定理的证明基本是常规思路, 如下

证明 为一埃尔米特矩阵, 为其一个特征值, 为这个特征值对应的特征向量, 从而我们有

两边同时取共轭转置, 有

对于埃尔米特矩阵有 , 从而有

两边同时乘以 , 有

从而

所以 是实数.

另外取 为矩阵 的两个不相同的特征值, 其对应的特征向量分别为 . 于是我们有

对上面第二个式子取共轭转置有

也即

从而

也就是

从而

因为 , 所以 , 从而 .

从而得证

定义 若一个 矩阵 的列向量构成了 中的一个规范正交集, 则称其为 酉矩阵 (unitary matrix)

通过上面的定义不难发现 为酉矩阵的充要条件是 . 若 为酉矩阵, 因为其列向量是规范正交的, 因此其秩 必为 . 从而酉矩阵可逆, 从而可得

一个实的酉矩阵就是一个正交矩阵.

推论 6.4.2 若埃尔米特矩阵 的特征值互不相同, 则存在一个酉矩阵 对角化

证明 对每一个 的特征值 , 令 为属于 的特征向量. 令 . 则对每一 , 为属于 的单位特征向量. 根据定理6.4.1, 中的规范正交集. 令 为对每一 , 其第 个列向量为 的矩阵; 则 是酉矩阵, 且 对角化 .

前面这个推论有一个很强的条件就是 的特征值互不相同. 事实上, 当 的特征值不全相异的时候推论6.4.2也是成立的. 为了证明它, 我们首先来证明下面的定理

定理 6.4.3 (舒尔定理) 对每一个 的矩阵 , 存在一个酉矩阵 , 使得 为上三角的.

这个定理的证明稍微有点复杂, 利用数学归纳法可证

证明 时, 结论是显然的. 假设对 的矩阵该结论是成立的, 并令 为一 矩阵. 令 的特征值, 并令 为属于 的单位特征向量. 利用格拉姆-施密特过程, 构造 , 使得 的一组规范正交基. 令 . 则由归纳法, 为酉矩阵. 的第一列将为 . 而

因此 为一形如

的矩阵, 其中 为一个 的矩阵. 由归纳假设, 存在一个 的酉矩阵 , 使得 , 其中 是三角形的. 令

. 矩阵 为酉矩阵, 因为

从而 . 证毕

前面提到的因式分解 通常称为 舒尔分解 (Schur decomposition). 当 为埃尔米特矩阵的时候矩阵 将为对角的.

现在我们就可以证明前面提到的结论了.

定理 6.4.4 (谱定理) 若 为埃尔米特矩阵, 则存在一个酉矩阵 对角化 .

证明 根据定理6.4.3, 存在一个酉矩阵 , 使得 , 其中 为上三角的. 而且

也就是说, 为埃尔米特矩阵, 又因为 是上三角的, 所以必为对角的.

实舒尔分解

前面我们讨论舒尔分解的时候我们是对复数进行讨论的. 在实数域下也有类似的结论. 若 为一 矩阵, 可以有 , 其中 为一正交矩阵, 为形如

的实矩阵, 其中 或者 矩阵. 每个 分块对应于 的一对复共轭特征值. 矩阵 指的是 的实舒尔型. 下面我们将一步步来证明这个结论.

定义 的子空间 在矩阵 下保持不变, 若对每个 , 有 .

引理 6.4.5 为一实 矩阵, 其特征值为 (其中 为实数且 ), 并设 (其中 中的向量)是属于 的特征向量. 若 , 则 下保持不变.

证明 由于 为复数, 因此 必非零. 又因为 是实的, 也为 的特征值且 是属于 的特征向量. 若存在一个标量 满足 , 则 将均为 的倍数且不可能是无关的. 然而 属于不同的特征值, 因此他们必定线性无关. 因此 不会是 的倍数, 因此 的维数为2.

为证明 的不变性, 注意到由于 , 等号两边实部和虚部必须一致, 因此

于是可得

中的任意一向量, 则

所以 中, 因此 下保持不变.

利用这个引理我们就可以证明实矩阵的舒尔定理了. 证明思路和前面复矩阵的证明思路是相似的, 仍然利用归纳法进行.

定理 6.4.6 (实舒尔分解定理) 若 是一 实矩阵, 则 可以分解为乘积 , 其中 是一正交矩阵, 是前面提到的形式的矩阵.

证明 时, 若 的特征值是实的, 可以取 为属于第一个特征值 的单位特征向量, 为与 正交的任一单位向量. 若令 , 则 是一正交矩阵. 若令 , 则 的第一列为

于是 是上三角的, 且 . 若 的特征值是复的, 则可简单地令 . 于是每个 实矩阵有一实舒尔分解.

现在令 为一 矩阵, 其中 , 并假定对 , 每个 实矩阵有一个形如 的舒尔分解.令 的一个特征值. 若 为实的, 令 为属于 的单位特征向量, 并选取 是一正交矩阵, 如舒尔定理的证明一样, 可得 的第一列为 . 若 是复的, 令 (其中 为实数)为属于 的特征向量, 并令 . 由引理6.4.5, 下是不变的. 令 的一组规范正交基. 选区 使得 是一正交矩阵. 因为 下保持不变, 可得

其中 为标量, 因此 的前两列将为

因此一般来说, 将为分块形式的矩阵

其中

为实的, 则 矩阵

为复的, 则 矩阵且 矩阵.

在每一种情况, 可以对 应用归纳假设, 得到舒尔分解 . 假设舒尔型 个对角分块 . 若令