解读特征向量Word格式文档下载.docx
- 文档编号:15915545
- 上传时间:2022-11-17
- 格式:DOCX
- 页数:8
- 大小:23.47KB
解读特征向量Word格式文档下载.docx
《解读特征向量Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《解读特征向量Word格式文档下载.docx(8页珍藏版)》请在冰豆网上搜索。
特征值的几何重次是相应特征空间的维数。
有限维向量空间上一个变换的谱是其所有特征值的集合。
例如,三维空间旋转的特征向量是沿着旋转轴的一个向量,相应的特征值是1,相应的特征空间包含所有和该轴平行的向量。
该特征空间是一个一维空间,因而特征值1的几何重次是1。
特征值1是旋转的谱当中唯一的实特征值。
参看:
特征平面
例子
随着地球的自转,每个从地心往外指的箭头都在旋转,除了在转轴上的那些箭头。
考虑地球在一小时自转后的变换:
地心指向地理南极的箭头是这个变换的一个特征向量,但是从地心指向赤道任何一处的箭头不会是一个特征向量。
因为指向极点的箭头没有被地球的自转拉伸,它的特征值是1。
另一个例子是,薄金属板关于一个固定点均匀伸展,使得板上每一个点到该固定点的距离翻倍。
这个伸展是一个有特征值2的变换。
从该固定点到板上任何一点的向量是一个特征向量,而相应的特征空间是所有这些向量的集合。
但是,三维几何空间不是唯一的向量空间。
例如,考虑两端固定的拉紧的绳子,就像弦乐器的振动弦那样(图2.)。
振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量,那个空间的维数就是弦上原子的个数。
如果考虑绳子随着时间流逝发生的变换,它的特征向量,或者说特征函数(如果将绳子假设为一个连续媒介),就是它的驻波—也就是那些通过空气的传播让人们听到弓弦和吉他的拨动声的振动。
驻波对应于弦的特定振动,它们使得弦的形状随着时间变化而伸缩一个因子(特征值)。
和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。
驻波的振幅(特征值)在考虑到阻尼的情况下逐渐减弱。
因此可以将每个特征向量对应于一个寿命,并将特征向量的概念和共振的概念联系起来。
特征值方程
从数学上看,如果向量v与变换满足
则称向量v是变换的一个特征向量,λ是相应的特征值。
其中是将变换作用于v得到的向量。
这一等式被称作“特征值方程”。
假设是一个线性变换,那么v可以由其所在向量空间的一组基表示为:
其中vi是向量在基向量上的投影(即坐标),这里假设向量空间为n维。
由此,可以直接以坐标向量表示。
利用基向量,线性变换也可以用一个简单的矩阵乘法表示。
上述的特征值方程可以表示为:
但是,有时候用矩阵形式写下特征值方程是不自然甚或不可能的。
例如在向量空间是无穷维的时候,上述的弦的情况就是一例。
取决于变换和它所作用的空间的性质,有时将特征值方程表示为一组微分方程更好
。
若是一个微分算子,其特征向量通常称为该微分算子的特征函数。
例如,微分本身是一个线性变换因为(若m和n是可微函数,而a和b是常数)
考虑对于时间t的微分。
其特征函数满足如下特征值方程:
其中λ是该函数所对应的特征值。
这样一个时间的函数,如果λ=0,它就不变,如果λ为正,它就按比例增长,如果λ是负的,它就按比例衰减。
例如,理想化的兔子的总数在兔子更多的地方繁殖更快,从而满足一个正λ的特征值方程。
该特征值方程的一个解是n=exp(λt),也即指数函数;
这样,该函数是微分算子d/dt的特征值为λ的特征函数。
若λ是负数,我们称n的演变为指数衰减;
若它是正数,则称指数增长。
λ的值可以是一个任意复数。
因此d/dt的谱是整个复平面。
在这个例子中,算子d/dt作用的空间是单变量可微函数的空间。
该空间有无穷维(因为不是每一个可微函数都可以用有限的基函数的线性组合来表达的)。
但是,每个特征值λ所对应的特征空间是一维的。
它就是所有形为n=n0exp(λt)的函数的集合。
n0是任意常数,也就在t=0的初始数量。
谱定理
关于此话题更进一步的细节,见谱定理。
谱定理在有限维的情况,将所有可对角化的矩阵作了分类:
它显示一个矩阵是可对角化的,当且仅当它是一个正规矩阵。
注意这包括自共轭(厄尔米特)的情况。
这很有用,因为对角化矩阵t的函数f(t)(譬如波莱尔函数f)的概念是清楚的。
在采用更一般的矩阵的函数的时候谱定理的作用就更明显了。
例如,若f是解析的,则它的形式幂级数,若用t取代x,可以看作在矩阵的巴拿赫空间中绝对收敛。
谱定理也允许方便地定义正算子的唯一的平方根。
谱定理可以推广到希尔伯特空间上的有界正规算子,或者无界自共轭算子的情况。
矩阵的特征值和特征向量
计算矩阵的特征值和特征向量
假设我们想要计算给定矩阵的特征值。
若矩阵很小,我们可以用特征多项式进行符号演算。
但是,对于大型矩阵这通常是不可行的,在那种情况我们必须采用数值方法。
符号演算
关于此话题更进一步的细节,见矩阵特征值的符号演算。
求特征值
描述正方形矩阵的特征值的重要工具是特征多项式:
说λ是a的特征值等价于说线性系统(a–λi)v=0(其中i是恒等矩阵)有非零解v(一个特征向量),因此等价于行列式:
函数p(λ)=det(a–λi)是λ的多项式,因为行列式定义为一些乘积的和。
这就是a的特征多项式:
矩阵的特征值也就是其特征多项式的零点。
一个矩阵a的特征值可以通过求解方程pa(λ)=0来得到。
若a是一个n×
n矩阵,则pa为n次多项式,因而a最多有n个特征值。
反过来,代数基本定理说这个方程刚好有n个根,如果重根也计算在内的话。
所有奇数次的多项式必有一个实数根,因此对于奇数n,每个实矩阵至少有一个实特征值。
在实矩阵的情形,对于偶数或奇数的n,非实数特征值成共轭对出现。
求特征向量
一旦找到特征值λ,相应的特征值可以通过求解如下方程得到:
没有实特征值的一个矩阵的例子实顺时针90度旋转:
其特征多项式是λ2+1,因此其特征值成复共轭对出现:
i,-i。
相应的特征向量也是非实数的。
数值计算
关于此话题更进一步的细节,见特征值算法。
在实践中,大型矩阵的特征值无法通过特征多项式计算。
计算该多项式本身相当费资源,而精确的“符号式”的根对于高次的多项式来说很难计算和表达:
阿贝尔-鲁费尼定理显示高次(5次或更高)多项式的根无法用n次方根来简单表达。
对于估算多项式的根的有效算法是有的,但特征值中的小误差可以导致特征向量的巨大误差。
因此,寻找特征多项式和特征值的一般算法,是迭代法。
最简单的方法是幂法:
取一个随机向量v,然后计算如下的一系列单位向量
,,...
这个序列几乎总是收敛于最大绝对值的特征值所对应的特征向量。
这个算法很简单,但是本身不是很有用。
但是,象qr算法这样的算法正是以此为基础的。
性质
代数重次
a的一个特征值λ的代数重次是λ作为a的特征多项式的零点的次数;
换句话说,若λ是一个该多项式的根,它是因子(t−λ)在特征多项式中在因式分解后中出现的次数。
一个n×
n矩阵有n个特征值,如果将代数重次计算在内的话,因为其特征多项式次数为n。
一个代数重次1的特征值为“单特征值”。
在关于矩阵理论的条目中,可能会遇到如下的命题:
"
一个矩阵a的特征值为4,4,3,3,3,2,2,1,"
表示4的代数重次为二,3的是三,2的是二,而1的是1。
这样的风格因为代数重次对于矩阵理论中的很多数学证明很重要而被大量使用。
回想一下,我们定义特征向量的几何重次为相应特征空间的维数,也就是λi−a的零空间。
代数重次也可以视为一种维数:
它是相应广义特征空间(第一种意义)的维数,也就是矩阵(λi−a)k对于任何足够大的k的零空间。
也就是说,它是“广义特征向量”(第一种意义)的空间,其中一个广义特征向量是任何一个如果λi−a作用连续作用足够多次就“最终”会变0的向量。
任何特征向量是一个广义特征向量,以此任一特征空间被包含于相应的广义特征空间。
这给了一个几何重次总是小于代数重次的简单证明。
这里的第一种意义不可和下面所说的广义特征值问题混淆。
例如:
它只有一个特征值,也就是λ=1。
其特征多项式是(λ−1)2,所以这个特征值代数重次为2。
但是,相应特征空间是通常称为x轴的数轴,由向量线性撑成,所以几何重次只是1。
广义特征向量可以用于计算一个矩阵的若当标准型(参看下面的讨论)。
若当块通常不是对角化而是幂零的这个事实与特征向量和广义特征向量之间的区别直接相关。
一般矩阵分解定理
如上所述,谱定理表明正方形矩阵可以对角化当且仅当它是正规的。
对于更一般的未必正规的矩阵,我们有类似的结果。
当然在一般的情况,有些要求必须放松,例如酉等价性或者最终的矩阵的对角性。
所有这些结果在一定程度上利用了特征值和特征向量。
下面列出了一些这样的结果:
舒尔三角形式表明任何矩阵酉等价于一个上三角矩阵;
奇异值分解定理,a=uσv*其中σ为对角阵,而u,v为酉矩阵。
a=uσv*的对角线上的元素非负,而正的项称为a的奇异值。
这对非正方形矩阵也成立;
若当标准型,其中a=uλu−1其中λ不是对角阵,但是分块对角阵,而u是酉矩阵。
若当块的大小和个数由特征值的几何和代数重次决定。
若当分解是一个基本的结果。
从它可以立即得到一个正方形矩阵可以完全用它的特征值包括重次来表述,最多只会相差一个酉等价。
这表示数学上特征值在矩阵的研究中有着极端重要的作用。
作为若当分解的直接结果,一个矩阵a可以“唯一”地写作a=s+n其中s可以对角化,n是幂零的(也即,对于某个q,nq=0),而s和n可交换(sn=ns)。
任何可逆矩阵a可以唯一地写作a=sj,其中s可对角化而j是么幂矩阵(也即,使得特征多项式是(λ-1)的幂,而s和j可交换)。
特征值的一些另外的属性
谱在相似变换下不变:
矩阵a和p-1ap有相同的特征值,这对任何矩阵a和任何可逆矩阵p都成立。
谱在转置之下也不变:
矩阵a和at有相同的特征值。
因为有限维空间上的线性变换是双射当且仅当它是单射,一个矩阵可逆当且仅当所有特征值都不是0。
若当分解的一些更多的结果如下:
一个矩阵是对角阵当且仅当代数和几何重次对于所有特征值都相等。
特别的有,一个n×
n矩阵如果有n不同特征值,则总是可以对角化的。
矩阵作用的向量空间可以视为其广义特征向量所撑成的不变子空间的直和。
对角线上的每个块对应于该直和的一个子空间。
若一个块是对角化的,其不变子空间是一个特征空间。
否则它是一个广义特征空间,如上面所定义;
因为迹,也就是矩阵主对角线元素之和,在酉等价下不变,若当标准型说明它等于所有特征值之和;
类似的有,因为三角矩阵的特征值就是主对角线上的项,其行列式等于等于特征值的乘积(按代数重次计算出现次数)。
正规矩阵的一些子类的谱的位置是:
一个厄尔米特矩阵(a=a*)的所有特征值是实数。
进一步的有,所有正定矩阵(v*av>
0forallvectorsv)的所有特征值是正数;
所有斜
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解读 特征向量