矩阵论知识结构
阅读数:182 评论数:0
跳转到新版页面分类
数学
正文
一、概述
矩阵论是数学的一个分支,主要研究矩阵及其代数性质、几何解释和应用。矩阵是一个由数(可以是实数或复数)排成的矩形阵列,这些数可以代表数据集合、线性方程组的系数或线性变换。
1、线性空间
空间可以理解为向量的集合,而线性空间就是满足下面8条性质的向量集合:
设$\alpha,\beta,\gamma \in V; \lambda,\mu \in R$
(1) $\alpha +\beta = \beta+\alpha$
(2) $(\alpha +\beta)+\gamma = \alpha +(\beta +\gamma) $
(3) 在V中存在零元素0,对于任何$\alpha \in V$,都有$\alpha+0 = \alpha$
(4) 对于任何$\alpha \in V$,都有$\alpha$的负数素$\beta \in V$,使$\alpha +\beta 0$
(5) $1\alpha = \alpha$
(6) $\lambda (\mu \alpha) = (\lambda \mu)\alpha$
(7) $(\lambda +\mu) \alpha = \lambda \alpha+\mu \lambda$
(8) $\lambda (\alpha+\beta)= \lambda \alpha+ \lambda \beta$
2、线性空间的基
通过线性空间的基和坐标我们就可以表示出线性空间中所有的向量,线性空间的基是不唯一的,对于同一个元素在不同基下坐标肯定是不同的,如果我们知道基于基之间的关系,我们就可以知道坐标与坐标的关系。
如果线性空间的两个基分别为(x1, x2,..., xn),(y1, y2, ..., yn),且满足:
$(y1, y2, ..., yn) = (x1, x2, ..., xn)C$
则对于一向量在两个基下坐标分别是$(\alpha1,\alpha2,..., \alpha n), (\beta1,\beta2,...,\beta n)$,则坐标满足:
$(\alpha1,\alpha2,...,\alpha n)^{T} = C^{-1}(\beta1,\beta2,...\beta n)^{T}$
3、线性子空间
子空间说明了该空间是一个线性空间的子集,线性说明这个子空间满足齐次性和叠加性,具体形式如下:
(1)如果$x,y \in V_1$,则$x+y \in V_1$
(2)如果$x \in V_1, k \in K$,则$kx \in V_1$
则称$V_1$是V的一个线性子空间或子空间。
4、线性子空间的交与和
这和集合的交与和性质差不多。
(1)直和:和集合的并类似,不同的是直和中并的两个集合是不相交的,即两个集合中没有共同元素。
5、线性变换及其矩阵
定理1:设线性空间$V_n$中取定两个基
$\alpha_1, \alpha_2, ...\alpha_n; \beta_1,\beta_2,...,\beta_n$
由基$\alpha_1, \alpha_2, ...\alpha_n$到基$\beta_1,\beta_2,...,\beta_n$的过渡矩阵为P,$V_n$中的线性变换T在这两个基下的矩阵依次为A和B,那么有$B=P^{-1}AP$
这时,我们能不能找到一组基,线性变换对应的矩阵B是一个对角阵,这样便于计算,这便引出了相似对象化的问题,于是问题便把问题变成找到矩阵P,将矩阵A变换到对角矩阵B,最后数学家找到一种工具,就是求特征值和特征向量。
$B=P^{-1}AP=> AP = PB$
将P和B进行分解,因为B是对角矩阵
$\left\{ \begin{aligned} AP1&=&\lambda 1P1 \\ AP2&=& \lambda 2P2 \\ &...\\ APn&=& \lambda nPn \end{aligned} \right.$
6、不变子空间
通俗的讲就是如果一个向量x属于一个子空间,如果经过线性变换得到的向量y仍然属于这个子空间,那么就称该空间为不变子空间。
7、Jordan标准型
因为并不是每一个矩阵A都能相似对角化,能相似对角化的条件是矩阵A存在n个线性无关的特征向量,而产不是所有矩阵都满足,所以我们退而求其次,使得矩阵B的形式如下:
\begin{equation}
\left [
\begin{array}{cccc}
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right]
\end{equation}
通过下列推导过程可以很好的说明Jordan标准型的求取:
$P^{-1}AP=\left [
\begin{array}{cccc}
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right] $
=>$AP = P \left [
\begin{array}{cccc}
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right] $
将矩阵P进行分解:$P=[x_1, x_2, ..., x_n]$
$ \left\{ \begin{aligned} Ax_1 &= \lambda_1 x_1 \\Ax_2 &=x_1+\lambda_2 x_2 \\ &\vdots \\ Ax_n &=x_{n-1}+\lambda_n x_n \end{aligned} \right.$
=>$\left\{ \begin{aligned} (\lambda_1 I -A)x_1 &=0 \\ (\lambda_2 I -A)x_2 &= -x_1 \\ &\vdots \\ (\lambda_n I -A)x_n &= -x_{n-1} \end{aligned} \right.$
8、两个特殊的线性空间
前面介绍的线性空间的性质,只能满足向量的一些线性运算,对于求取向量的模和方向根本无法表示,所以我们在线性空间的基础上添加一些性质,得到特殊的线性空间,在该空间中的向量运算可以给模和方向。我们称该空间为欧式空间和内积空间。
定义:
$\begin{aligned} x&=(\xi_1, \xi_2, \dots,\xi_n) \\ y&=(\eta_1,\eta_2,\dots,\eta_n) \\ (x,y)&=(\xi_1 \eta_1,\xi_2 \eta_2,\dots,\xi_n \eta_n)=x\cdot y^{T} \end{aligned}$
通过上述的定义,我们可以得到对于该空间的任意两个向量的内积推导如下:
$x=\xi_1 x_1+\xi_2 x_2 \dots+\xi_n x_n $,
$y=\eta_1 x_1+\eta_2 x_2 \dots+\eta_n x_n$
则$(x,y)=(\xi_1 \; \xi_2 \; \dots \; \xi_n)\cdot A\cdot \left\{ \begin{aligned} \eta_1 \\ \eta_2 \\ \vdots \\ \eta_n \end{aligned} \right\}$
其中矩阵A为:
$A=\left [
\begin{array}{cccc}
(x_1,x_1)&\cdots & (x_1,x_n)\\
(x_2,x_1) &\cdots& (x_2,x_n)\\
\vdots & \ddots & \vdots \\
(x_n,x_1)&\cdots &(x_n,x_n)
\end{array}
\right]$
只要知道矩阵A和两个向量x,y在基下的坐标,就可以通过公式求内积,但是矩阵A在不同基下表示形式也不同,所以我们现在关键的问题是找到不同基下矩阵A之间的关系,通过推导我们可以得到:
假设基$(x_1,x_2,\dots,x_n)$和基$(y_1,y_2,\dots,x_n)$关系如下:
$(y_1,y_2,\dots,y_n)=(x_1,x_2,\dots,x_n)\dot C$
则有:$B=C^{T}AC$
其中B为基$(y_1,y_2,\dots,y_n)$的度量矩阵,A为$(x_1,x_2,\dots,x_n)$的度量矩阵。