矩阵论知识结构

阅读数:182 评论数:0

跳转到新版页面

分类

数学

正文

一、概述 

矩阵论是数学的一个分支,主要研究矩阵及其代数性质、几何解释和应用。矩阵是一个由数(可以是实数或复数)排成的矩形阵列,这些数可以代表数据集合、线性方程组的系数或线性变换。

1、线性空间

空间可以理解为向量的集合,而线性空间就是满足下面8条性质的向量集合:

设$\alpha,\beta,\gamma \in V; \lambda,\mu \in R$

(1) $\alpha +\beta = \beta+\alpha$

(2) $(\alpha +\beta)+\gamma = \alpha +(\beta +\gamma) $

(3) 在V中存在零元素0,对于任何$\alpha \in V$,都有$\alpha+0 = \alpha$

(4) 对于任何$\alpha \in V$,都有$\alpha$的负数素$\beta \in V$,使$\alpha +\beta 0$

(5) $1\alpha = \alpha$

(6) $\lambda (\mu \alpha) = (\lambda \mu)\alpha$

(7) $(\lambda +\mu) \alpha = \lambda \alpha+\mu \lambda$

(8) $\lambda (\alpha+\beta)= \lambda \alpha+ \lambda \beta$

2、线性空间的基

通过线性空间的基和坐标我们就可以表示出线性空间中所有的向量,线性空间的基是不唯一的,对于同一个元素在不同基下坐标肯定是不同的,如果我们知道基于基之间的关系,我们就可以知道坐标与坐标的关系。

如果线性空间的两个基分别为(x1, x2,..., xn),(y1, y2, ..., yn),且满足:

$(y1, y2, ..., yn) = (x1, x2, ..., xn)C$

则对于一向量在两个基下坐标分别是$(\alpha1,\alpha2,..., \alpha n), (\beta1,\beta2,...,\beta n)$,则坐标满足:

$(\alpha1,\alpha2,...,\alpha n)^{T} = C^{-1}(\beta1,\beta2,...\beta n)^{T}$

3、线性子空间

子空间说明了该空间是一个线性空间的子集,线性说明这个子空间满足齐次性和叠加性,具体形式如下:

(1)如果$x,y \in V_1$,则$x+y \in V_1$

(2)如果$x \in V_1, k \in K$,则$kx \in V_1$

则称$V_1$是V的一个线性子空间或子空间。

4、线性子空间的交与和

这和集合的交与和性质差不多。

(1)直和:和集合的并类似,不同的是直和中并的两个集合是不相交的,即两个集合中没有共同元素。

5、线性变换及其矩阵

定理1:设线性空间$V_n$中取定两个基

$\alpha_1, \alpha_2, ...\alpha_n; \beta_1,\beta_2,...,\beta_n$

由基$\alpha_1, \alpha_2, ...\alpha_n$到基$\beta_1,\beta_2,...,\beta_n$的过渡矩阵为P,$V_n$中的线性变换T在这两个基下的矩阵依次为A和B,那么有$B=P^{-1}AP$

这时,我们能不能找到一组基,线性变换对应的矩阵B是一个对角阵,这样便于计算,这便引出了相似对象化的问题,于是问题便把问题变成找到矩阵P,将矩阵A变换到对角矩阵B,最后数学家找到一种工具,就是求特征值和特征向量。

$B=P^{-1}AP=> AP = PB$

将P和B进行分解,因为B是对角矩阵

$\left\{ \begin{aligned} AP1&=&\lambda 1P1 \\ AP2&=& \lambda 2P2 \\ &...\\ APn&=& \lambda nPn  \end{aligned} \right.$

6、不变子空间

通俗的讲就是如果一个向量x属于一个子空间,如果经过线性变换得到的向量y仍然属于这个子空间,那么就称该空间为不变子空间。

7、Jordan标准型 

因为并不是每一个矩阵A都能相似对角化,能相似对角化的条件是矩阵A存在n个线性无关的特征向量,而产不是所有矩阵都满足,所以我们退而求其次,使得矩阵B的形式如下:

\begin{equation}
\left [
\begin{array}{cccc} 
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right]
\end{equation} 

通过下列推导过程可以很好的说明Jordan标准型的求取:

$P^{-1}AP=\left [
\begin{array}{cccc} 
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right] $

=>$AP = P \left [
\begin{array}{cccc} 
\lambda_1& 1 &\cdots & 0\\
0 & \lambda_2 &\cdots& 0\\
\vdots & \vdots & \ddots & \vdots \\
0& 0 &\cdots &\lambda_n
\end{array}
\right] $

将矩阵P进行分解:$P=[x_1, x_2, ..., x_n]$

$ \left\{ \begin{aligned} Ax_1 &= \lambda_1 x_1 \\Ax_2 &=x_1+\lambda_2 x_2 \\ &\vdots \\  Ax_n &=x_{n-1}+\lambda_n x_n  \end{aligned} \right.$

=>$\left\{ \begin{aligned} (\lambda_1 I -A)x_1 &=0 \\ (\lambda_2 I -A)x_2 &= -x_1 \\ &\vdots \\  (\lambda_n I -A)x_n &= -x_{n-1} \end{aligned} \right.$

8、两个特殊的线性空间

前面介绍的线性空间的性质,只能满足向量的一些线性运算,对于求取向量的模和方向根本无法表示,所以我们在线性空间的基础上添加一些性质,得到特殊的线性空间,在该空间中的向量运算可以给模和方向。我们称该空间为欧式空间和内积空间。

定义:

$\begin{aligned} x&=(\xi_1, \xi_2, \dots,\xi_n) \\ y&=(\eta_1,\eta_2,\dots,\eta_n) \\ (x,y)&=(\xi_1 \eta_1,\xi_2 \eta_2,\dots,\xi_n \eta_n)=x\cdot y^{T} \end{aligned}$

通过上述的定义,我们可以得到对于该空间的任意两个向量的内积推导如下:

$x=\xi_1 x_1+\xi_2 x_2 \dots+\xi_n x_n $,

$y=\eta_1 x_1+\eta_2 x_2 \dots+\eta_n x_n$

则$(x,y)=(\xi_1 \; \xi_2 \; \dots \;  \xi_n)\cdot A\cdot \left\{ \begin{aligned} \eta_1 \\ \eta_2 \\ \vdots \\ \eta_n \end{aligned} \right\}$

其中矩阵A为:

$A=\left [
\begin{array}{cccc} 
(x_1,x_1)&\cdots & (x_1,x_n)\\
(x_2,x_1) &\cdots& (x_2,x_n)\\
\vdots & \ddots & \vdots \\
(x_n,x_1)&\cdots &(x_n,x_n)
\end{array}
\right]$

只要知道矩阵A和两个向量x,y在基下的坐标,就可以通过公式求内积,但是矩阵A在不同基下表示形式也不同,所以我们现在关键的问题是找到不同基下矩阵A之间的关系,通过推导我们可以得到:

假设基$(x_1,x_2,\dots,x_n)$和基$(y_1,y_2,\dots,x_n)$关系如下:

$(y_1,y_2,\dots,y_n)=(x_1,x_2,\dots,x_n)\dot C$

则有:$B=C^{T}AC$

其中B为基$(y_1,y_2,\dots,y_n)$的度量矩阵,A为$(x_1,x_2,\dots,x_n)$的度量矩阵。

 

二、知识结构

矩阵论的知识结构可以概括为以下几个主要部分:

  1. 矩阵的基本概念和运算

    • 矩阵的定义和示例
    • 矩阵加法、标量乘法和矩阵乘法
    • 矩阵的转置、共轭和共轭转置
    • 特殊矩阵(如单位矩阵、对角矩阵、对称矩阵、反对称矩阵、上(下)三角矩阵等)
  2. 矩阵的分解

    • LU分解
    • QR分解
    • Cholesky分解
    • 奇异值分解(SVD)
    • Jordan分解
    • 施密特正交化
  3. 行列式

    • 行列式的定义和性质
    • 行列式的计算方法
    • 克拉默法则
  4. 矩阵的逆

    • 可逆矩阵的定义和性质
    • 矩阵逆的计算方法
    • 伴随矩阵
  5. 线性方程组和矩阵的秩

    • 高斯消元法
    • 系数矩阵和增广矩阵
    • 矩阵的秩和线性无关
  6. 特征值和特征向量

    • 特征值和特征向量的定义
    • 特征方程和特征多项式
    • 对角化和谱定理
    • 动力系统和稳定性分析
  7. 内积空间和正交性

    • 向量空间和内积的定义
    • 正交和正交补
    • 正交投影和最小二乘问题
  8. 范数和条件数

    • 向量范数和矩阵范数
    • 矩阵条件数的定义和意义
  9. 应用

    • 线性代数方程组的求解
    • 最优化问题
    • 线性变换和几何
    • 信号处理和数据分析
    • 控制理论和系统分析
    • 数值分析和计算方法
  10. 高级主题(可能包括但不限于):

    • 矩阵函数(例如,矩阵指数和对数)
    • 矩阵不等式
    • 张量分析
    • 稀疏矩阵理论
    • 随机矩阵理论
  1.  



相关推荐

一、线性空间与线性变换 1、线性空间 线性空间(也称为向量空间)是矩阵论中的一个基本概念,它提供了一个框架来研究线性代数的多种问题。在线性空间中,向量可以相加和乘以标量(数),并且这些操作满足特定的公