版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
title: 笔记 - 对称双线性度量空间与线性方程组 categories:
线性函数, 双线性函数, Euclidean 空间等
<!-- more -->顾名思义, 线性函数就是具有线性的函数, 双线性函数就是具有双重线性的函数
因为这两个概念有许多相通之处, 故选用如下方式展示
{% tabs define-1-base,1 %}
<!-- tab 线性函数 -->定义 线性函数
对映射 $f:V\to\mathbb{P}$, 满足 $(\forall\alpha,\beta\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta)=kf(\alpha)+lf(\beta)$
例如矩阵的迹 $\operatorname{tr}A$
<!-- endtab --> <!-- tab 双线性函数 --><!-- endtab -->定义 双线性函数
对映射 $f:V\times V\to\mathbb{P}$, 满足
- $(\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta,\gamma)=kf(\alpha,\gamma)+lf(\beta,\gamma)$
- $(\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(\gamma,k\alpha+l\beta)=kf(\gamma,\alpha)+lf(\gamma,\beta)$
{% endtabs %}
{% tabs define-1-representation,1 %}
<!-- tab 线性函数 -->定义 表示向量
令 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 为 $V$ 的一组基, 称
$$ (f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n)) $$
为 $f$ 在 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 下的表示向量
我们有如下定理
$\eta:L(V,\mathbb{P})\to\mathbb{P}^n;~f\mapsto(f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n))$ 为双射
即所有线性函数的集合 $L(V,\mathbb{P})$ 与 $\mathbb{P}^n$ 同构
<a href="#t-1-1-1" id="end-t-1-1-1">$\Box$</a>
<!-- endtab --> <!-- tab 双线性函数 -->定义 表示矩阵/度量矩阵
令 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 为 $V$ 的一组基, 称
$$ (f(\epsilon_i,\epsilonj)){n\times n} $$
为 $f$ 在 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 下的表示矩阵
我们有如下定理
$\zeta:BL(V,\mathbb{P})\to\mathbb{P}^{n\times n};~f\mapsto(f(\epsilon_i,\epsilonj)){n\times n}$ 为双射
即所有双线性函数的集合 $BL(V,\mathbb{P})$ 与 $\mathbb{P}^{n\times n}$ 同构
<a href="#t-1-1-2" id="end-t-1-1-2">$\Box$</a>
<!-- endtab -->{% endtabs %}
证明很简单, 读者可尝试自行补充
我们发现
$\forall\alpha=\displaystyle\sum_{i=1}^nx_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilonn)X,\beta=\sum{i=1}^ny_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Y\in V$
都有
$$ f(\alpha,\beta)=X^TAY $$
这样就将双线性函数的计算转换成了矩阵乘法, 这个形式很重要
类比线性空间中的零元, 我们可定义零线性函数/零双线性函数
{% tabs define-1-zero,1 %}
<!-- tab 线性函数 --><!-- endtab --> <!-- tab 双线性函数 -->定义 零线性函数
对于线性函数 $f$, 若 $(\forall\alpha\in V),~f(\alpha)=0$, 则称 $f$ 为零线性函数, 记作 $\bold{0}$
<!-- endtab -->定义 零双线性函数
对于双线性函数 $f$, 若 $(\forall\alpha,\beta\in V),~f(\alpha,\beta)=0$, 则称 $f$ 为零双线性函数, 记作 $\bold{0}$
{% endtabs %}
设 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 和 $(\eta_0,\eta_1,\dots,\eta_n)$ 是 $V$ 的两组基底, 过渡矩阵 $T$ 使得
$$ (\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)T $$
{% tabs define-1-trans,1 %}
<!-- tab 线性函数 -->若线性函数 $f$ 在 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 和 $(\eta_0,\eta_1,\dots,\eta_n)$ 下的表示向量分别为 $(a_1,a_2,\dots,a_n)$ 和 $(b_1,b_2,\dots,b_n)$, 则
$$ (b_1,b_2,\dots,b_n)=(a_1,a_2,\dots,a_n)T $$
因此 $T$ 非奇异
<!-- endtab --> <!-- tab 双线性函数 -->若双线性函数 $f$ 在 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 和 $(\eta_0,\eta_1,\dots,\eta_n)$ 下的表示矩阵分别为 $A$ 和 $B$, 则
$$ B=T^TAT $$
因此 $T$ 非奇异, 称 $\operatorname{rk}A$ 为 $f$ 的秩
<!-- endtab -->{% endtabs %}
接下来我们定义一些特殊的双线性函数, 我们可以从这些函数具有的性质中感受到其与矩阵的密切关系
定义 非奇异双线性函数
称 $f$ 是非奇异的, 若
$$ (\forall\alpha\in V/{\theta},~\exists\beta\in V),~f(\alpha,\beta)\ne0 $$
下列命题等价
$1\iff2:$
$$ \begin{aligned} (\forall\alpha\in V,~\forall\beta\in V,~f(\alpha,\beta)=0\implies\alpha=0)&\iff(\forall X\in\mathbb{P}^n,~\forall Y\in\mathbb{P}^n,~X^TAY=0\implies X=0)\ &\iff(\forall X\in\mathbb{P}^n,~X^TA=0\implies X=0) \end{aligned} $$
$2\iff3:$ 显然
$2\iff4:$ 参照 $1\iff2$
<a href="#p-t-1-2" id="end-t-1-2">$\Box$</a>
定义 对称双线性函数
称 $f$ 是对称的, 若
$$ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=f(\beta,\alpha) $$
下列命题等价
证明参照 <a href="#t-1-2">定理 - 1-2</a>
<a href="#t-1-3" id="end-t-1-3">$\Box$</a>
定义 斜对称双线性函数
称 $f$ 是斜对称的, 若
$$ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=-f(\beta,\alpha) $$
定义 正定双线性函数
称 $f$ 是正定的, 若
$$ (\forall\alpha\in V/{\theta}),~f(\alpha,\alpha)>0 $$
我们将在 Euclidean 空间 见到它
它有类似 <a href="#t-1-2">定理 - 1-2</a>, <a href="#t-1-3">定理 - 1-3</a> 的定理 (<a href="#t-3-4">定理 - 3-4</a>)
定义 正交
对双线性函数 $f$, 称 $\alpha,\beta\in V$正交, 若 $f(\alpha,\beta)=0$
定义 正交基底
一组基底 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 称作正交基底, 若 $(\forall 1\leqslant i,j\leqslant n,i\ne j), f(\epsilon_i,\epsilon_j)=0$
对任意线性空间 $V$ 和其上的对称双线性函数 $f$, 正交基底总是存在
进而 $f$ 在该基底下的度量矩阵为对角矩阵, 对角线上的非零元素个数为 $f$ 的秩
若 $f$ 是非零函数, 即
$$ (\exists\alpha,\beta\in V),~f(\alpha,\beta)\ne0 $$
由
$f(\alpha,\beta)=\displaystyle\frac{1}{2}\left(f(\alpha+\beta,\alpha+\beta)-f(\alpha,\alpha)-f(\beta,\beta)\right)$ (这里利用了 $f$ 的对称性)
可知
$$ (\exists\epsilon\in V),~f(\epsilon,\epsilon)\ne0\tag{1.4.1} $$
接下来对 $\dim V$ 应用第二数学归纳法
若对 $1\leqslant\dim V\leqslant n-1$ 的情况命题都成立, 考察 $\dim V=n$ 的情形
对 $(1.4.1)$ 中的 $\epsilon$, 将其扩充为 $V$ 的一组基底 $(\epsilon,\eta{2},...,\eta{n})$
令 $\epsilon_i'=\displaystyle \eta_i-\frac{f(\eta_i,\epsilon)}{f(\epsilon,\epsilon)}\epsilon,\qquad i=2,3,...,n$
则 $(\epsilon,\epsilon'{2},...,\epsilon'{n})$ 为 $V$ 的基底, 且
$f(\epsilon,\epsilon_i')=0,\qquad i=2,3,...,n$
因此
$$ (\forall\alpha\in G[\epsilon'{2},...,\epsilon'{n}]),~f(\epsilon,\alpha)=0\tag{1.4.2} $$
又显然 $V=G[\epsilon]\oplus G[\epsilon'{2},...,\epsilon'{n}]$
考虑 $f|{G[\epsilon'{2},...,\epsilon'{n}]}$, 由归纳假设, $G[\epsilon'{2},...,\epsilon'{n}]$ 中有正交基底 $(\epsilon{2},...,\epsilon_{n})$
故由 $(1.4.2)$ 式可得 $(\epsilon,\epsilon{2},...,\epsilon{n})$ 为 $V$ 的一组正交基底
<a href="#p-t-1-4" id="end-t-1-4">$\Box$</a>
令 $V$ 为 $\mathbb{C}$ 上一 $n$ 维线性空间, $f$ 为 $V$ 上一对称双线性函数, 则存在正交基底 $(\epsilon_0,\epsilon_1,\dots,\epsilonn)$ 使得对 $V$ 上的任意向量 $\alpha=\sum{i=1}^nx_i\epsiloni,\beta=\sum{i=1}^ny_i\epsilon_i$ 均有
$$ f(\alpha,\beta)=\sum_{i=1}^rx_iy_i $$
其中 $r=\operatorname{rk}f$
若 $V$ 为 $\mathbb{R}$ 上一 $n$ 维线性空间, 其余同上, 则
$$ f(\alpha,\beta)=\sum_{i=1}^px_iyi-\sum{i=p+1}^rx_iy_i $$
另一种写法:
若 $V$ 为 $\mathbb{R}$ 上一 $n$ 维线性空间, 则由 <a href="#t-1-4">定理 - 1-4</a> 可知,
存在正交基底 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$, 使得 $f$ 的度量矩阵为 $\operatorname{diag}{d_1,d_2,\dots,dp,-d{p+1},-d{p+2},...,-d{r},0,...,0}$, 其中 $d_1,d_2,\dots,d_r>0,~0\leqslant p\leqslant r\leqslant n$
考虑 $f(\epsilon_i,\epsilon_i)=(-1)^{[i>p]}d_i,~1\leqslant i\leqslant r$
令 $\displaystyle\epsilon'_i={\epsilon_i\over\sqrt{d_i}}$, 则 $f(\epsilon'_i,\epsilon'_i)=(-1)^{[i>p]}$
容易验证 $(\epsilon'_0,\epsilon'_1,\dots,\epsilon'r,\epsilon{r+1},\epsilon{r+2},...,\epsilon{n})$ 为正交基底
故在正交基底 $(\epsilon'_0,\epsilon'_1,\dots,\epsilon'r,\epsilon{r+1},\epsilon{r+2},...,\epsilon{n})$ 下, $f$ 的度量矩阵为 $\operatorname{diag}{\underbrace{1,...,1}{p},\underbrace{-1,...,-1}{\operatorname{rk}f-p},0,...,0}$
我们可以注意到负号产生的原因是 $\sqrt{\phantom{-}}$ 要求被开方数非负, 而在 $\mathbb{C}$ 上没有这个限制, 故在 $\mathbb{C}$ 上即为 $\operatorname{diag}{\underbrace{1,...,1}_{\operatorname{rk}f},0,...,0}$
<a href="#p-ifr-1-4-1" id="end-ifr-1-4-1">$\Box$</a>
在后面还有进一步的讨论
令 $V$ 为 $\mathbb{P}$ 上一 $n$ 维线性空间, $f_1,f_2,\dots,f_k$ 为 $V$ 上 $k$ 个线性函数, 证明:
$$ W={\alpha\in V|f_i(\alpha)=0}\leqslant V $$
称 $W$ 为 $f_1,f_2,\dots,f_k$ 的零化子空间
若 $W\leqslant V$, 则存在 $V$ 上 $k$ 个线性函数 $f_1,f_2,\dots,f_k$ 使得 $W$ 为 $f_1,f_2,\dots,f_k$ 的零化子空间
首先, $\theta\in W$
又, 若 $\alpha,\beta\in W$, 即 $f_i(\alpha)=f_i(\beta)=0,~i=1,2,...,k$
则 $(\forall s,t\in\mathbb{P}),~f_i(s\alpha+t\beta)=sf_i(\alpha)+tf_i(\beta)=0,~i=1,2,...,k$
因此 $W\leqslant V$ 1
若 $\dim W=r\in[1,n)$, 取 $W$ 的一组基 $\epsilon_0,\epsilon_1,\dots,\epsilon_r$, $V$ 的一组基 $\epsilon_0,\epsilon_1,\dots,\epsilon_n$
令 $f_i(\epsilonj)=\delta{ij},~i,j=1,2,...,n$
取 $f{r+1},f{r+2},...,f_{n}$ 构成的零化子空间 $M$
则 $(\forall\alpha\in W),~\alpha\in M$, 即 $W\subseteq M$
又取 $\alpha=\sum_{i=1}^nk_i\epsilon_i\in M$, 由 $f_i(\alpha)=k_i,~i=1,2,...,n$ 可知 $k_i=0,i=r+1,r+2,...,n$
故 $\alpha\in W$, 即 $M\subseteq W$
因此 $W$ 是 $f{r+1},f{r+2},...,f_{n}$ 的零化子空间
<a href="#p-prob-1-1" id="end-prob-1-1">$\Box$</a>
令 $V$ 是复线性空间, $\dim V\geqslant 2$, $f$ 为 $V$ 上一对称双线性函数, 证明:
若 $f$ 非奇异, 则存在线性无关向量 $\zeta,\eta$ 使得
$$ f(\zeta,\eta)=1,f(\zeta,\zeta)=f(\eta,\eta)=0 $$
由 $\dim V\geqslant2$ 可知, 存在 $\alpha,\beta\in V$ 使得 $\alpha,\beta$ 线性无关
设 $f(\alpha,\alpha)=a,f(\beta,\beta)=b$
由 1 知, $(\exists\theta\ne\zeta\in V),~f(\zeta,\zeta)=0$
取 $\zeta\ne\xi'\in V/{\theta}$, 由 $f$ 非奇异知 $f(\zeta,\xi')=b\ne0$
令 $\xi=\displaystyle\frac{\xi'}{b}$
若 $f(\xi,\xi)\ne0$, 考虑 $f(\xi+t\zeta,\xi+t\zeta)$
$f(\zeta,\xi+t\zeta)=1$
由 1 知, $t$ 有根 $t_1$ 使得 $f(\xi+t_1\zeta,\xi+t_1\zeta)=0$
令 $\eta=\xi+t_1\zeta$ 即可
<a href="#p-prob-1-2" id="end-prob-1-2">$\Box$</a>
说实话, 我挺讨厌这种万物都往方程组上靠的做法
就是有非奇异对称双线性函数的线性空间
特别的, 当 $\mathbb{P}=\mathbb{R}$ 时即称其为伪 Euclidean 空间
显然, 这个非奇异对称双线性函数是满秩的, 即
$n$ 维对称双线性度量空间 $V$ 存在正交基底 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$, 使得 $V$ 上的非奇异对称双线性函数 $f$ 有
<a href="#prop-2-1" id="end-prop-2-1">$\Box$</a>
在继续讨论线性方程组之前, 我们先引入正交补的概念
定义 正交补(空间)
对 $n$ 维对称双线性度量空间 $V=(V,+,\cdot,\mathbb{P},f)$ 和 $V_1\leqslant V$, 称
$$ {\alpha\in V|(\forall\beta\in V_1),~f(\alpha,\beta)=0} $$
为 $V_1$ 的正交补(空间), 记作 $V_1^\perp$
显然 $V_1^\perp\leqslant V$
由定义立得
若 $\dim V_1=r\geqslant1$, 且 $(\beta_0,\beta_1,\dots,\beta_r)$ 为 $V_1$ 的一组基, 则
$$ V_1^\perp={\alpha\in V|f(\alpha,\beta_i)=0,~i=1,2,...,r} $$
即 $V_1^\perp$ 为 $\begin{cases} f(\alpha,\beta_i)=0\i=1,2,...,r \end{cases}$ 的解集
若令 $f$ 在基底 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 下的表示矩阵为 $A$, $\beta_0,\beta_1,\dots,\beta_r$ 的坐标分别为 $B_1,B_2,\dots,B_r,~\alpha$ 的坐标为 $X$, 则上述方程组可表示为
$$ X^TA(B_1,B_2,\dots,B_r)=\theta $$
另外, $V_1^\perp$ 与上式的解空间 $S$ 同构
<a href="#prop-2-2" id="end-prop-2-2">$\Box$</a>
若 $V$ 为 $n$ 维对称双线性度量空间, $V_1\leqslant V$, 则
当 $\dim V_1=0$ 时, 易知命题成立
当 $\dim V_1=r\geqslant1$ 时,
只需证 $\dim S=n-r$
$S$ 即为 $(B_1,B_2,\dots,B_r)^TAX=\theta$ 的解空间 (等式两边取转置)
令 $B=(B_1,B_2,\dots,B_r)^T$, 则 $\dim S=n-r\iff\operatorname{rk} BA=r$
而 $\operatorname{rk}B=r$, 由 $A$ 可逆知 $\operatorname{rk}BA=\operatorname{rk}B=r$
因此 $\dim S=n-r$
由 1 知, $\dim V_1^\perp=n-r,~\dim~(V_1^\perp)^\perp=r=\dim V_1$
又 $V_1\subseteq(V_1^\perp)^\perp$
故 $(V_1^\perp)^\perp=V_1$
<a href="#p-t-2-1" id="end-t-2-1">$\Box$</a>
未必有 $V_1\cap V_1^\perp={\theta}$, 即未必有 $V=V_1\oplus V_1^\perp$
如在 $\mathbb{C}^2$ 上引入 $f((x_1,y_1),(x_2,y_2))=x_1x_2+y_1y_2$, 显然可构成对称双线性度量空间, 而取 $V_1=G[(1,i)]$, 显然 $V_1=V_1^\perp$
<a href="#atten-2-1-1" id="end-atten-2-1-1">$\Box$</a>
进入正题
本节将在 $n$ 维对称双线性度量空间 $\mathbb{P}^n(E)$ 中讨论
$$ AX=\theta\tag{2.3.1} $$
和
$$ AX=B\tag{2.3.2} $$
其中 $\mathbb{P}^n(E)$ 表示 $\mathbb{P}^n$ 连同在自然基底下度量矩阵为 $E$ 的双线性函数 $f_E$ 所构成的对称双线性度量空间, 显然有
$$ f_E([a_1,a_2,\dots,a_n]^T,[b_1,b_2,\dots,bn]^T)=\sum{i=1}^na_ib_i $$
齐次线性方程组 $(2.3.1)$ 可记作
$$ \begin{cases} f_E(A_i^T,X)=0\ i=1,2,...,m \end{cases} $$
其中 $Ai=(a{i1},a{i2},...,a{in}),~i=1,2,...,m$
令 $V_1=G[A_1^T,A_2^T,...,A_m^T]$, 则上述齐次线性方程组的解空间恰为 $V_1^\perp$
非齐次线性方程组 $(2.3.2)$ 有解 $\iff\operatorname{rk}(A^1,A^2,...,A^n)=\operatorname{rk}(A^1,A^2,...,A^n,B)\iff B\in G[A^1,A^2,...,A^n]$
其中 $A^i=(a{1i},a{2i},...,a_{mi})^T,~i=1,2,...,n$
考虑 $(2.3.2)$ 的转置齐次线性方程组
$$ A^TY=\theta\tag{2.3.3} $$
由上一部分的讨论可知, $(2.3.3)$ 的解空间为 $G[A^1,A^2,...,A^n]^\perp$
故 $B\in G[A^1,A^2,...,A^n]\iff B$ 与 $(2.3.3)$ 的解空间正交
这可以作为一个定理
非齐次线性方程组 $(2.3.2)$ 有解当且仅当 $B$ 与 $(2.3.3)$ 的解空间正交
<a href="#p-t-2-2" id="end-t-2-2">$\Box$</a>
令 $V$ 为 $\mathbb{P}$ 上一 $n$ 维线性空间, $V_1<V,\zeta\notin V_1$, $f$ 为 $V$ 上一对称双线性函数, 证明:
$$ (\exists0\ne\eta\in V_1+G[\zeta]),(\forall\alpha\in V_1),~f(\eta,\alpha)=0 $$
即证 $\theta\ne\eta\in(V_1+G[\zeta])\cap V_1^\perp$
设 $\dim V_1=r$, 则 $\dim(V_1+G[\zeta])=r+1,~\dim V_1^\perp=n-r$
故 $\dim((V_1+G[\zeta])\cap V_1^\perp)\ne0$
<a href="#p-prob-2-1" id="end-prob-2-1">$\Box$</a>
定义 Euclidean 空间
令 $V$ 为实线性空间, 若其上一对称双线性函数 $f$ 满足正定性, 则称 $V$ 连同 $f$ 构成Euclidean 空间
称 $f$ 为内积, 记作 $(~,~)$, $f(\alpha,\beta)$ 可简记为 $(\alpha,\beta)$
显然 Euclidean 空间是伪 Euclidean 空间
例 - 1
定义 $f$ 如下:
$$ f(g(x),h(x))=\int_a^bf(x)g(x)\mathrm{d}x $$
易证 $f$ 是内积, $C[a,b]$ 连同 $f$ 构成 Euclidean 空间
Euclidean 空间有一个很好的性质, 就是我们可以在其上定义向量的长度, 夹角等在直观几何中的概念
这一点即使是在一般的伪 Euclidean 空间都是做不到的
定义 长度
令 $V$ 为一 Euclidean 空间, $\alpha\in V$, 称 $\sqrt{(\alpha,\alpha)}$ 为 $\alpha$ 的长度, 记作 $|\alpha|$
定义 单位向量
假设同上, 称 $\alpha$ 为单位向量, 若 $|\alpha|=1$
如果 $\alpha\ne\theta$, 则 $\displaystyle\frac{\alpha}{|\alpha|}:=\frac{1}{|\alpha|}\alpha$ 为单位向量
在定义夹角之前, 我们需要证明 $\displaystyle\frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1$
在高中数学中, 这个形式等价于 $\displaystyle\left|\sum_{i=1}^na_ibi\right|\leqslant\sqrt{\sum{i=1}^nai^2}\sqrt{\sum{i=1}^nb_i^2}$, 这就是大名鼎鼎的 Cauchy 不等式
到了 Euclidean 空间, 我们自然也会考虑是否能将 Cauchy 不等式推广过来
很幸运, 这是可行的
令 $V$ 为一 Euclidean 空间, 则对其上任意非零向量 $\alpha,\beta$, 均有
$$ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 $$
等号成立当且仅当 $\alpha,\beta$ 线性相关
若写成 $|(\alpha,\beta)|\leqslant|\alpha||\beta|$, 则不需限制 $\alpha,\beta$ 非零
考察 $\alpha-k\beta,~k\in\mathbb{R}$, 由内积的正定性可得
$$ k^2(\beta,\beta)-2k(\alpha,\beta)+(\alpha,\alpha)\leqslant0 $$
此式表明判别式非正, 即 $(\alpha,\beta)^2-(\alpha,\alpha)(\beta,\beta)\leqslant0$
亦即
$$ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 $$
当 $\alpha,\beta$ 线性相关时, 上式等号显然成立
反之, 若上式等号成立, 则 $(\exists t_0\in\mathbb{R}),~(\alpha-t_0\beta,\alpha-t_0\beta)=0$, 可得 $\alpha-t_0\beta=0$, 即 $\alpha,\beta$ 线性相关
<a href="#p-t-3-1" id="end-t-3-1">$\Box$</a>
Cauchy-Bunjakovski-Schwarz 不等式有两个著名的实例
接下来给出夹角的定义
定义 夹角
令 $V$ 为一 Euclidean 空间, $\alpha,\beta\in V/{\theta}$, 称 $\displaystyle\arccos\frac{(\alpha,\beta)}{|\alpha||\beta|}\in[0,\pi]$ 为 $\alpha$ 和 $\beta$ 的夹角, 记作 $\langle\alpha,\beta\rangle$
接下来我们可以尝试把我们熟知的, 与长度和角度相关的几何定理都推广到 Euclidean 空间了 (其实, 在 <a href="#ifr-3-2">推论 - 3-2</a> 的保障下, 我们可以更大胆些)
令 $V$ 为一 Euclidean 空间, $\alpha,\beta\in V$, 则
可推广为
$$ ((\forall1\leqslant i,j\leqslant m,i\ne j),~(\alpha_i,\alphaj)\ne0),~\left|\sum{i=1}^mai\right|^2=\sum{i=1}^m|\alpha_i|^2 $$
<a href="#p-t-3-2" id="end-t-3-2">$\Box$</a>
简单来说, 就是满足其所有基向量都是单位向量的一组正交基底
定义 标准正交基底
称 $n$ 维 Euclidean 空间上的一组基 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 是标准正交的, 若
- $|\epsilon_i|=1,~i=1,2,...,n$
- $(\epsilon_i,\epsilon_j)=0,~i,j=1,2,...,n,i\ne j$
容易验证, $n$ 维 Euclidean 空间存在标准正交基, 而且我们还可以将其上任意基底标准正交化
若 $(\alpha_0,\alpha_1,\dots,\alpha_n)$ 为 $n$ 维 Euclidean 空间上的一组基, 则其上存在标准正交基 $(\beta_0,\beta_1,\dots,\beta_n)$ 使得
$$ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta_0,\beta_1,\dots,\beta_i],~i=1,2,...,n $$
观察定理形式可知是用归纳法证的
该证法也是构造性的
令 $\beta'_2=\alpha_2+k\beta'_1$ 使得 $(\beta'_2,\beta'_1)=0$, 可推知当且仅当
$$ k=-\frac{(\alpha_2,\beta'_1)}{(\beta'_1,\beta'_1)} $$
时此式成立
由 $\beta'_2=\alpha_2+k\beta'_1=\alpha_2+k\alpha_1$ 可知 $\beta'_1,\beta'_2$ 线性无关, 故 $G[\beta'_1,\beta'_2]=G[\alpha_1,\alpha_2]$
假设已找到 $m<n$ 个两两正交的向量 $\beta'_0,\beta'_1,\dots,\beta'_m$ 满足条件
令
$$ \beta'{m+1}=\alpha{m+1}+\sum_{i=1}^mk_i\beta'_i $$
使得
$$ (\beta'_{m+1},\beta'_i)=0,~i=1,2,...,m $$
即
$$ (\alpha_{m+1},\beta'_i)+k_i(\beta'_i,\beta'_i)=0,~i=1,2,...,m $$
上式成立当且仅当
$$ ki=-{(\alpha{m+1},\beta'_i)\over(\beta'_i,\beta'_i)},~i=1,2,...,m $$
又可知 $\beta'_{m+1}$ 是 $\alpha_0,\alpha1,\dots,\alpha{m+1}$ 的线性组合, $\beta'_{m+1}\ne\theta$
因此 $G[\alpha_0,\alpha1,\dots,\alpha{m+1}]=G[\beta'_0,\beta'1,\dots,\beta'{m+1}]$
因此我们可以找到一组正交基 $(\beta'_0,\beta'_1,\dots,\beta'_n)$ 满足
$$ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta'_0,\beta'_1,\dots,\beta'_i],~i=1,2,...,n $$
上述过程即 Schmidt 正交化
又令 $\beta_i=\displaystyle\frac{1}{|\beta'_i|}\beta'_i,~i=1,2,...,n$, 命题即得证
<a href="#p-t-3-3" id="end-t-3-3">$\Box$</a>
应用 <a href="#t-3-3">定理 - 3-3</a> 的方法即可将任意基底标准正交化
此方法本质上还是矩阵乘法
令 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 为 $n$ 维 Euclidean 空间 $V$ 的一组标准正交基, 则
<a href="#ifr-3-1" id="end-ifr-3-1">$\Box$</a>
接下来是一个与内积证明和性质有关的定理
令 $V$ 为 $n$ 维实线性空间, $f$ 是 $V$ 上一双线性函数, 则下列命题等价:
$1\implies2:$
可知 $V$ 连同 $f$ 构成 Euclidean 空间
故由 <a href="#ifr-3-1">推论 - 3-1</a> 可知, 存在标准正交基 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 使得 $f$ 的度量矩阵为 $E$
任取 $V$ 上一组基底 $(\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Q$, 易知 $Q$ 可逆, 则 $f$ 在该基底下的度量矩阵 $A=Q^TEQ=Q^TQ$
$2\implies3:$ 显然
$3\implies1:$
不妨设该基底为 $(\eta_0,\eta_1,\dots,\eta_n)$
假设 $f$ 在该基底下的度量矩阵为 $A=Q^TQ=Q^TEQ$, 则 $E=(Q^{-1})^TAQ^{-1}$
故存在基底 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)=(\eta_0,\eta_1,\dots,\eta_n)Q^{-1}$ 使得 $f$ 的度量矩阵为 $E$
显然 $f$ 是对称正定双线性函数, 即 $f$ 为 $V$ 上的内积
<a href="#p-t-3-4" id="end-t-3-4">$\Box$</a>
定义 Euclidean 空间同构映射
令 $V,V'$ 为两个 Euclidean 空间, 称 $V$ 到 $V'$ 的同构映射 $f$ 是 $V$ 到 $V'$ 的Euclidean 空间同构映射, 若
$$ (\forall\alpha,\beta\in V),~(f(\alpha),f(\beta))=(\alpha,\beta) $$
此时, 称 $V$ 与 $V'$ 是同构的
显然这个同构也是等价关系
两有限维 Euclidean 空间 $V,V'$ 同构当且仅当 $\dim V=\dim V'$
$\implies$: 显然
$\impliedby$:
只需证 $n$ 维 Euclidean 空间 $V$ 同构于 $\mathbb{R}^n$
令 $(\epsilon_0,\epsilon_1,\dots,\epsilon_n)$ 为 $V$ 的一组标准正交基, 建立映射
$$ f_{{\epsiloni}{i=1}^n}:\alpha\mapsto(x_1,x_2,\dots,xn)^T\in\mathbb{R}^n,~\alpha=\sum{i=1}^nx_i\epsilon_i\in V $$
易知 $f_{{\epsiloni}{i=1}^n}$ 是 $V$ 到 $\mathbb{R}^n$ 的线性同构映射
任取 $\alpha=\sum_{i=1}^nx_i\epsiloni,\beta=\sum{i=1}^ny_i\epsilon_i$, 均有
$$ \begin{aligned} (\alpha,\beta)&=\sum_{i=1}^nx_iy_i\ &=((x_1,x_2,\dots,x_n)^T,(y_1,y_2,\dots,yn)^T)\ &=(f{{\epsiloni}{i=1}^n}(\alpha),f_{{\epsiloni}{i=1}^n}(\beta)) \end{aligned} $$
<a href="#p-t-3-5" id="end-t-3-5">$\Box$</a>
基于这个定理, 我们有一个重要且有用的推论
在 Euclidean 空间中, 所有关于两个或三个向量的命题均可在三维直观几何空间验证
在 Euclidean 空间中, 两个或三个向量可生成维数不超过 3 的 Euclidean 空间, 由 <a href="#t-3-5">定理 - 3-5</a> 可知其与三维直观几何空间或其子空间同构
而 Euclidean 空间中的命题均可只用空间说的加法, 实数乘和内积描述, 因此只需在三维直观几何空间中验证就行
<a href="#p-ifr-3-2" id="end-ifr-3-2">$\Box$</a>
在本章的最后, 我们另给出一组定理
令 $V$ 为一 $n$ 维 Euclidean 空间, $\alpha_0,\alpha_1,\dots,\alpha_m\in V$, 则有如下平行的事实
又在线性相关的角度, 我们可以注意到更深刻的事实
设 $\exists ki\in\mathbb{R},~i=1,2,...,m,~s.t.~\displaystyle\sum{i=1}^mk_i\alpha_i=\theta$
则
$$ k_j(\alpha_j,\alpha_j)=-(\alphaj,\sum{i=1,~i\ne j}^mk_i\alpha_i)=0,~j=1,2,...,m $$
而 $(\alpha_j,\alpha_j)>0$, 故 $k_j=0,~j=1,2,...,m$
因此 $\alpha_0,\alpha_1,\dots,\alpha_m$ 线性无关
因此 $m\leqslant n$
不妨设 $m=n+2$
则
$$ \exists ki\in\mathbb{R},~i=1,2,...,n+1,\sum{i=1}^{n+1}ki^2\ne0,~s.t.~\sum{i=1}^{n+1}k_i\alpha_i=\theta $$
此时 $(\alpha{n+2},\sum{i=1}^{n+1}k_i\alpha_i)=0$
此式说明 $k_0,k1,\dots,k{n+1}$ 中有正有负, 不妨设
$$ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant n+1 $$
则 $\sum_{i=1}^sk_i\alphai=-\sum{i=s+1}^tk_i\alpha_i$
而
$$ (\sum_{i=1}^sk_i\alphai,-\sum{i=s+1}^tk_i\alphai)=-\sum{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 $$
这与点积的正定性矛盾, 故 $m\leqslant n+1$
类似地, 我们可证明 $\alpha_0,\alpha_1,\dots,\alpha_m$ 的任意真子组线性无关
只需证 $\alpha_0,\alpha1,\dots,\alpha{m-1}$ 线性无关
设 $\exists ki\in\mathbb{R},~i=1,2,...,m-1,~s.t.~\displaystyle\sum{i=1}^{m-1}k_i\alpha_i=\theta$
此时 $(\alpham,\sum{i=1}^{m-1}k_i\alpha_i)=0$
此式说明要么 $k_0,k1,\dots,k{m-1}$ 中有正有负, 要么 $k_0,k1,\dots,k{m-1}$ 均为 $0$
若情况为前者, 不妨设
$$ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant m-1 $$
则 $\sum_{i=1}^sk_i\alphai=-\sum{i=s+1}^tk_i\alpha_i$
而
$$ (\sum_{i=1}^sk_i\alphai,-\sum{i=s+1}^tk_i\alphai)=-\sum{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 $$
这与点积的正定性矛盾, 故情况只能为后者
由条件知 $\alpha_i\ne\theta,i=1,2,...,m$
假设 $f$ 存在
当 $n=1$ 时, $\alpha_0,\alpha_1,\dots,\alpha_m$ 中任意两个向量均线性相关, 不妨设
$\alpha_i=k_i\alpha_1,~i=1,2,3,...m$, 显然 $k_1=1$
假设 $f(1)\in\mathbb{Z}^+$, 令 $m=f(1)$, $k\in\mathbb{Z}^+/{k_1,k_2,\dots,k_m}$, $\beta=k\alpha_1$
则 $(\beta,\alpha_i)=kk_i(\alpha_1,\alpha_1)>0,~i=1,2,...,m$
即满足条件的向量组长度至少为 $f(1)+1$, 与 $m\leqslant f(n)$ 矛盾!
因此 $1\notin D(f)$
当 $n\geqslant2$ 时, $\alpha_0,\alpha_1,\dots,\alpha_m$ 中存在两向量线性无关, 设其为 $\alpha'_1,\alpha'_2$
假设 $f(n)\in\mathbb{Z}^+$, 令 $m=f(n)$
令 $\beta_k=\alpha'_1+k\alpha'2,~k=1,2,...,m$, 则其中必有一向量 $\beta{k'}$ 满足 $\beta_{k'}\ne\alpha_i,~i=1,2,...,m$
此时有 $(\beta_{k'},\alpha_i)=(\alpha'_1,\alpha_i)+k'(\alpha'_2,\alpha_i)>0,~i=1,2,...,m$
即满足条件的向量组长度至少为 $f(n)+1$, 与 $m\leqslant f(n)$ 矛盾!
因此 $n\notin D(f)$
因此 $D(f)=\varnothing$, $f$ 不存在
<a href="#p-t-3-6" id="end-t-3-6">$\Box$</a>
令 $V$ 为一 $n$ 维 Euclidean 空间, $\alpha$ 为 $V$ 中一向量, 证明:
任取 $V$ 上一组基 $\epsilon_0,\epsilon_1,\dots,\epsilon_n$, 设 $f(\epsilon_i)=t_i,~i=1,2,...,n$
考虑方程组
$$ \begin{bmatrix} (\epsilon_1,\epsilon_1)&(\epsilon_1,\epsilon_2)&...&(\epsilon_1,\epsilon_n)\ (\epsilon_2,\epsilon_1)&(\epsilon_2,\epsilon_2)&...&(\epsilon_2,\epsilon_n)\ \vdots&\vdots&\ddots&\vdots\ (\epsilon_n,\epsilon_1)&(\epsilon_n,\epsilon_2)&...&(\epsilon_n,\epsilon_n)\ \end{bmatrix}\begin{bmatrix} k_1\k_2\\vdots\k_n \end{bmatrix}=\begin{bmatrix} t_1\t_2\\vdots\t_n \end{bmatrix} $$
由 $((\epsilon_i,\epsilonj)){n\times n}$ 的正定性可知方程组有唯一解, 令 $\alpha=\displaystyle\sum_{i=1}^nk_i\epsilon_i$
则 $(\epsilon_i,\alpha)=t_i=f(\epsilon_i)$
从而 $(\forall\eta\in V),~f(\eta)=(\eta,\alpha)$
<a href="#p-prob-3-1" id="end-prob-3-1">$\Box$</a>
若无明确说明, 本章内容均在有限维 Euclidean 空间内进行讨论
我们在 <a href="#t-2-1">定理 - 2-1</a> 得知 $\dim V_1+\dim V_1^\perp=\dim V$, 而如果 $V$ 是 $n$ 维 Euclidean 空间, 我们有更进一步的结论
令 $V$ 为一 $n$ 维 Euclidean 空间, 则 $\forall V_1\leqslant V$, 均有
$$ V=V_1\oplus V_1^\perp $$
设 $\alpha\in V_1\cap V_1^\perp$, 则 $(\alpha,\alpha)=0$, 由内积的正定性可得 $\alpha=\theta$, 因此 $V_1\cap V_1^\perp={\theta}$
又 $V_1+V_1^\perp\subseteq V$, $\dim V_1+\dim V_1^\perp=\dim V$
因此 $V=V_1\oplus V_1^\perp$
<a href="#p-t-4-1" id="end-t-4-1">$\Box$</a>
有了这个定理, 我们就可在 Euclidean 空间定义正射影了
定义 正射影
令 $V$ 为一 $n$ 维 Euclidean 空间, $V_1\leqslant V$, 则 $\forall\alpha\in V_1,~\alpha$ 均有唯一分解
$$ \alpha=\alpha_1+\alpha_2,~\alpha_1\in V_1,\alpha_2\in V_1^\perp $$
称 $\alpha_1$ 为 $\alpha$ 在 $V_1$ 上的正射影
定义 向量间距离
令 $V$ 为一 $n$ 维 Euclidean 空间, $\alpha,\beta\in V$, 称 $d(\alpha,\beta):=|\alpha-\beta|$ 为 $\alpha$ 与 $\beta$ 的距离
类似在直观几何空间中的距离, Euclidean 空间中的距离也有如下性质
在三维直观几何空间中, 一点到一平面的最短距离即是该点到垂足的连线, 在 Euclidean 空间中表现为
令 $V$ 为一 $n$ 维 Euclidean 空间, $V_1\leqslant V,\alpha\in V$, $\alpha_1\in V_1$ 为 $\alpha$ 在 $V_1$ 上的正射影, 则
$$ (\forall\beta\in V_1,\beta\ne\alpha_1),~d(\alpha,\alpha_1)<d(\alpha,\beta) $$
$\alpha-\beta=(\alpha-\alpha_1)+(\alpha_1-\beta),~\alpha_1-\beta\in V_1,\alpha-\alpha_1\in V_1^\perp$
故 $|\alpha-\beta|^2=|\alpha-\alpha_1|^2+|\alpha_1-\beta|^2$
由 $|\alpha_1-\beta|^2>0$ 可知 $|\alpha-\beta|^2>|\alpha-\alpha_1|^2$
因此 $d(\alpha,\alpha_1)<d(\alpha,\beta)$
<a href="#p-t-4-2" id="end-t-4-2">$\Box$</a>
因此, 我们可在 Euclidean 空间下定义向量到子空间的距离
定义 向量到子空间的距离
假设如 <a href="#t-4-2">定理 - 4-2</a>, 称 $d(\alpha,\alpha_1)$ 为 $\alpha$ 到 $V_1$ 的距离
我们要求向量到子空间的距离, 只需要求向量到正射影的距离即可
接下来将会给出正射影的求法
首先我们需要定义一个特殊矩阵
定义 Gram 矩阵
令 $V$ 为一 $n$ 维 Euclidean 空间, $\alpha_0,\alpha_1,\dots,\alpha_m\in V$, 称
$$ ((\alpha_i,\alphaj)){m\times m} $$
为 $\alpha_0,\alpha_1,\dots,\alpha_m$ 的Gram 矩阵, 记作 $G(\alpha_0,\alpha_1,\dots,\alpha_m)$
接下来我们就可以给出做法了
令 $V$ 为一 $n$ 维 Euclidean 空间, $V_1=G[\alpha_0,\alpha_1,\dots,\alpha_m]\leqslant V$, $\alpha\in V$, $X=(x_1,x_2,\dots,x_m)^T\in\mathbb{R}^m$
则
$$ \gamma=(\alpha_0,\alpha_1,\dots,\alpham)X=\sum{i=1}^mx_i\alpha_i\tag{4-3.1} $$
为 $\alpha$ 在 $V_1$ 上的正射影当且仅当
$$ G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T\tag{4-3.2} $$
显然 $\alpha$ 的正射影 $\gamma$ 一定存在, 则
$$ \begin{aligned} (\text{4-3.1})&\iff \left(\alpha-\sum_{i=1}^mx_i\alpha_i\right)\in V_1^\perp\ &\iff 0=(\alphaj,\alpha-\sum{i=1}^mx_i\alpha_i)=(\alpha,\alphaj)-\sum{i=1}^mx_i(\alpha_j,\alpha_i),~j=1,2,...,m\ &\iff G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T \end{aligned} $$
<a href="#p-t-4-3" id="end-t-4-3">$\Box$</a>
这里补充一点, <a href="#t-4-3">定理 - 4-3</a> 条件里并未限制 $\alpha_0,\alpha_1,\dots,\alpha_m$ 线性无关
这是个很有用的理论, 不过放到这有点突兀, 姑且当作前面内容的应用吧
在实际应用中, 线性方程组 $AX=B,~A\in\mathbb{R}^{m\times n}$ 由于测量精度等原因往往无解, 即
$$ \sum_{i=1}^n(b1-\sum{j=1}^na_{ij}x_j)^2\ne0\tag{4.1} $$
此时, 我们则需要寻找一组实数 $x_1,x_2,\dots,x_n$ 使得式 $(4.1)$ 左端的值最小
这样的 $x_1,x_2,\dots,x_n$ 即为 $AX=B$ 的最小二乘解
下面我们将在 $m$ 维 Euclidean 空间讨论该问题
将 $A$ 按列分块, $A=(\alpha_0,\alpha_1,\dots,\alpha_n),~\alpha_i\in\mathbb{R}^m,i=1,2,...,n$
有
$$ AX=\sum_{i=1}^nx_i\alpha_i\in G[\alpha_0,\alpha_1,\dots,\alpha_n]\leqslant\mathbb{R}^m $$
而式 $(4.1)$ 左端用内积的语言描述即为
$$ (B-\sum_{i=1}^nx_i\alphai,B-\sum{i=1}^nx_i\alphai)=|B-\sum{i=1}^nx_i\alpha_i|^2\tag{4.2} $$
要使式 $(4.2)$ 的值最小, 只需 $d(B,\sum_{i=1}^nx_i\alpha_i)$ 最小
此时取的 $x_1,x_2,\dots,xn$ 即要使 $\sum{i=1}^nx_i\alpha_i$ 为 $B$ 在 $G[\alpha_0,\alpha_1,\dots,\alpha_n]$ 的正射影
这样的 $x_1,x_2,\dots,x_n$ 是且仅是
$$ G(\alpha_0,\alpha_1,\dots,\alpha_n)X=((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T\tag{4.3} $$
的解
又
$$ G(\alpha_0,\alpha_1,\dots,\alpha_n)=A^TA $$
$$ ((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T=A^TB $$
因此式 $(4.3)$ 即为
$$ A^TAX=A^TB\tag{4.4} $$
由正射影的存在性可知该方程一定可解, 其解为 $X=(A^TA)^{-1}A^TB$
$(4.4)$ 的可解性也可通过 $\operatorname{rk}(A^TA)=\operatorname{rk}((A^TA,A^TB))$ 推得
(注意到 $\forall A\in\mathbb{R}^{m\times n},AX=0$ 与 $A^TAX=0$ 同解)
令 $V$ 为一 $n$ 维 Euclidean 空间, $\alpha_0,\alpha_1,\dots,\alpha_m\in V$, 证明:
$\alpha_0,\alpha_1,\dots,\alpha_m$ 线性无关当且仅当 $|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0$
$\impliedby$:
设 $\displaystyle\sum_{i=1}^nk_i\alpha_i=\theta$
则 $\displaystyle\sum_{i=1}^nk_i(\alpha_j,\alpha_i)=0,~j=1,2,...,n$
即
$$ G(\alpha_0,\alpha_1,\dots,\alpha_n)(k_1,k_2,\dots,k_n)^T=O\tag{4-1.1} $$
由 $|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0$ 知该方程只有零解
故 $\alpha_0,\alpha_1,\dots,\alpha_m$ 线性无关
$\implies$:
假设 $|G(\alpha_0,\alpha_1,\dots,\alpha_m)|=0$, 则方程 $(\text{4-1.1})$ 有非零解
即 $(\sum_{i=1}^nk_i\alpha_i,\alpha_j)=0,~j=1,2,...,n$
可得 $(\sum_{i=1}^nk_i\alphai,\sum{i=1}^nk_i\alpha_i)=0$
因此 $\sum_{i=1}^nk_i\alpha_i=0$, 与条件矛盾
<a href="#p-prob-4-1" id="end-prob-4-1">$\Box$</a>