线性代数相关概念的几何意义

  • 更新时间: 2018-06-11
  • 来源: 原创或网络
  • 浏览数: 14次
  • 字数: 19685
  • 发表评论

线性代数存在的意义:将现实生活的事物用计算机来识别并可以进行相应的处理。

现实生活中我们常常可以通过人脑来识别别各种事物,但是如何用计算机来表示这些事物呢?比方说红色,人眼直接判断它是红色,将其让计算机表示的话就要转化成计算机语言——RGB向量。那如果要对颜色进行一下转换,加深或改变颜色的话怎么用计算机来表示呢?此时线性代数的作用就体现出来了,向量加法,数乘等。

1 线性代数主要内容

1、向量

2、矩阵

3、方程组(方程组是向量和矩阵的一个应用,所以和向量、矩阵都相关。)

2 N维空间

一个点(标量)存在于零维空间,一条线(向量)——一维空间,一个面(矩阵)——二维空间,一个物体(三维张量)——三维空间,一个物体加上时间维(四维张量)——四维空间……

意思一样的几个概念

①行列式不为0

②满秩

③线性无关

④两个向量可以形成一个平面或两个向量不平行

⑤齐次方程组只有零解

⑥非齐次方程组有唯一解

这几个概念都在阐述:在向量空间中两个向量并不平行可以形成平面,针对矩阵来说就是矩阵里几个行向量或列向量是线性无关的,不存在多余的一个,此时它的行列式不等于0且满秩。

3 标量

记住一个概念:在向量空间中,标量(数字)的一个重要作用就是缩放拉伸向量。

4 向量

1)是什么

物理上:一个箭头,起点为坐标系的原点,如:作用力可以用一个向量来表示,一个方向为Y=X,大小为根号2的力用向量表示为【1,1】。

数学(计算机)上:一个有序的数字列表,如:一部电影多个评分2,3,5,4,也可以用向量来表示【2,3,5,4

还要理解一个概念就是向量是可以存在于多维空间当中的,不仅仅是一维空间,比方说:一个评分序列【2,3,5,4】这是在一维空间中的,一个苹果的重量1g、价格1¥,向量表示【1,1,这就存在于二维空间中的向量了。

2)怎么用:

①向量的加法:点的运动,方向改变。

比方说从原点出发,先沿v走再沿着w走是等于直接从原点沿着v+w方向走,两者终点一致。向量加法可以看出原本向量v,要改变方向和大小,则加上一个向量w后将终点移到了v+w处。


②向量的数乘:向量的拉伸缩放,方向不变。


线性无关的两个向量通过加法和数乘的运算可以表示二维空间中所有的向量。(线性相关的话两个向量是在同一个方向上的,而二维空间需要两个方向才能形成。同理,三维空间向量需要三个线性无关的向量)

③向量的内积(数量积):

意义:在某个方向上,两个向量在上面的投影长度之和(可以看成将两个向量不同方向的能量忽略,考虑同方向所蕴含的能量,刚好和外积相反。)

举例:v=x1,y1Tw=x2,y2T(两个向量为列向量)

向量的内积=|v|*|w|*cos(向量vw上的投影*向量w的长度)

向量的内积=vT*w=x1*x2+y1*y2(向量v倒置后和向量w相乘)

上面两个式子为什么相等呢?原因:一个多维空间到一维空间的线性变换的对偶是多维空间的某个特定的向量。

一个多维空间到一维空间的线性变换:x1*x2+y1*y2这个其实是两个向量相乘:【x1,y1*x2,y2T,先清楚一个概念:一个一行二列向量是指将一个二维空间映射到一维空间中进行降维,如【x1,y1】。一个二行一列向量是指二维空间中的一个向量,如【x2,y2T,则用一个一行二列向量左乘一个二行一列的向量是将这个二行一列向量(本存在于二维空间)进行降维降到一维空间中【这个思想可以到矩阵详讲】,故两个向量相乘即是一个多维空间到一维空间的线性变换。

多维空间的某个特定的向量:两个向量所在的空间是一个二维空间,求两者的内积就是将两个向量同时投向同一个方向即二维空间上的一个特定向量【可以是v也可以是w,甚至可以是别的特定向量】,其长度为投影*特定向量的长度(模)。

④向量的外积(向量积)

意义:向量的外积同向量内积相反,其大小是两个向量不同方向所积累的长度相乘(或者可以说能量)。外积是一个矢量,方向与两个向量都正交,即两个向量形成的平面垂直的方向,用右手法则来判断。若两个向量线性相关就是两个向量不存在不同方向,则外积为0。→这里也表明了向量积的性质:α×β=0→α//β,α×α=0

外积的模:|α×β|=|α|*|β|*sin<α,β>sin是求两个向量不同方向上长度)

外积计算:


(这里就谈到了行列式的几何意义了,行列式是表示两个向量形成的面积)

两个向量不同方向上所获得的长度相乘(能量)可以说与两个向量形成的面积是相等的,因为计算方式一样。

⑤向量的空间关系(平面/直线)

这部分只需要记住一点就行,两个向量线性相关则两个向量平行,不能形成平面,两个向量线性无关则可形成平面。(也就是平行的线经过移动是形成不了一个平面,但两个相交的线无论怎么移动都能形成一个平面)。

5 矩阵

1)是什么

一句话,矩阵是一种线性变换。这个很重要,时刻要记住这点。

那什么是线性变换呢?线性变换就是“保持网格线平行且等距分布”的变换,即一个打满网格线的空间中经过某种变换后网格线还是平行且等距分布的变换就是线性变换。这个网格线只是一个辅助,我们通常讲的空间是不存在网格线的。

那为什么说矩阵是一种线性变换呢?这个说法其实是片面的,矩阵可以是线性变换,也可以起别的作用,但是很多情况下理解成线性变换较方便。比方说:原空间一个基[1,0;0,1],它要逆时针旋转90度,怎么让计算机做出这个变换呢?让它左乘一个22列矩阵[0,-1;1,0]即可。那么这个22列矩阵就是一个线性变换,起到的作用就是逆时针旋转90度。

在矩阵学习之前先记住几个点:

l 矩阵的列:坐标系中的一个轴或一个方向或者说是一个基等。(列的数量表示原始输入空间的维数)

l 矩阵的行:空间的维数(行的数量表示输出空间的维数量)

比方说:32列的矩阵是在三维空间中的两个轴/方向/基,如[1,0;0,1;0,0]表示三维空间的x轴和y轴表达方式,可以理解成将二维空间映射到三维空间上。23列的矩阵是在二维空间中的三个轴/方向/基,3列表明原来空间有三个基向量,2行表明三个基向量在变换后仅用两个坐标表示,可以理解成将三维空间映射到二维空间中。

l 矩阵左乘:换基或者说线性变换,主要对矩阵的行进行操作。

2)基础概念

①行列式:线性变换后改变面积/体积等的比例。

Eg:原本二维空间中所有基矩阵[1,0;0,1]面积为1,而[1,0;0,1]经过一个线性变换后变成[3,0;0,2],此时它的面积变成原来的6倍,则[3,0;0,2]行列式为6

为何行列式有负数的呢?因为空间是讲究方向的,进行线性变换之后会改变空间的定向,行列式就为负的,如翻转这种线性变换[-1,0;0,1],这个矩阵行列式就为负数。

这里就不难理解:不满秩的或存在行向量/列向量线性相关的行列式为0,想象一下,[4,2;2,1]一个方向为【4,2】,一个是【2,1】,它们都是指向同一个方向的,则变成在一个维度上了,面积变成0。则[4,2;2,1]的行列式为0

在三维空间中也一样,基矩阵[1,0,0;0,1,0;0,0,1]体积为1,空间线性变换后体积变换的比例这里空间的正向用右手定则来测。

②矩阵的秩:变换后空间实际的维数(也就是将线性相关的去掉)或者说列空间的维数

③矩阵的零空间/核(kernel:变换后压缩到原点,一些向量落在零向量上,而“零空间”这是这些零向量所构成的空间(如基础解系)。

④矩阵的特征值和特征向量:一个矩阵(即线性变换),在变换当中,有一个向量并没有发生方向的变化,仅发生拉伸缩放的变化比例,则该变化比例为特征值,该向量为特征向量。【一个矩阵要有特征向量,则需是满秩的】

如:Ax=λxA矩阵是一个线性变换,但是x进过A变换得到的结果仅仅进行了λ比例的拉伸缩放,方向没有改变,则说A的特征向量和特征值为xλ

(特征值和特征向量可以体现一个线性变换的主要特征,矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。例如An*m的矩阵(n>m),那么特征向量就是m(因为秩最大是m)n个行向量在每个特征向量x上面有投影,其特征值λ就是权重。由于这些投影的大小代表了A在特征空间各个分量的投影,那么我们可以使用最小二乘法,求出投影能量最大的那些分量,而把剩下的分量去掉,这样最大限度地保存了矩阵代表的信息,同时可以大大降低矩阵需要存储的维度)

那么特征值和特征向量的一个作用就是降维,像PCA方法、SVD分解都要运用到它们,简单来说就将矩阵进行降维,一个很大很大的矩阵若将它降维成一个小矩阵,特征值和特征向量就起到很大的作用了。)

⑤初等变换

基本初等矩阵(1):交换某两行的位置”【关于某一“标准轴(面)”的镜像反射(对称)变换】

基本初等矩阵(2):“把某一行乘以一个非零数”【在某一坐标轴方向的伸缩变换;】

基本初等矩阵(3):“把某一行的k倍加到另一行上”【在某一坐标轴方向的切变变换】

总的来说:初等变换就是做对称、伸缩、切变变换的复合。由于对称、伸缩、切变是不会改变空间的维数的(即秩),经常用来计算相关内容。

⑥相似、等价、合同、正交

l A~B相似:B=P-1APP可逆)

l 合同:B=PTAPP可逆)

l 等价:B=PAQPQ可逆)

l 正交:PTP=I/XATX>0

矩阵AB相似:AB是同一个线性变换,不过就是放在了不同基下面而已,则AB所有的性质应该是一样的。所以相似矩阵的秩是相等的,特征值是一样的,逆是一样的,行列式是相等的。当然,还有一种以前学过的一种相似变换的概念,相似就是图形的形状不变,大小改变,这样性质也是不改变的。

比方说翻转这个变换,在中国它叫翻转,在美国它叫“reverse”。那为何B=P-1AP这样写呢?先确定一下:A是在中文环境下的语言,叫翻转,B是在英文环境下的,叫“reverse”,P是英文转中文的一个转换,P-1就是反过来中文转英文了。【矩阵相乘的读法是从右往左从读的】最初状态是在美国这个基下,首先进行一下英文转中文变成中国基,即左乘一个P,然后进行一下A变换,(即翻转),就变成了AP,这个是中文基下的“翻转”,怎么变成美国基下的“reverse”呢?此时将AP再左乘一下P-1(即中文转英文),此时P-1AP就是变成了英文的“reverse”。可以看出AB都是指的同一种变换。

矩阵相似的必要条件是r(A)=r(B),r(A)=r(B)不是矩阵相似的充分条件。这个很容易理解了,r(A)=r(B)有好多种,说不定一个翻转变换A,旋转矩阵B的秩相等,但是它们并不是同一个东西。

矩阵AB合同:最直观的几何意义是,对A的行和列做同样的变换。矩阵左乘PT其实是对矩阵的列进行P变换。矩阵右乘是对矩阵的行进行P变换,【不理解可以想一下矩阵乘法的运算】。这个意义更深的讲,其实是对A进行线性变换,在改变过程中保持任意线段的长和像的长总相等,包括平移、旋转、轴对称等。

相似只是AB矩阵换基没有进行旋转等操作,而合同是A进行了平移/旋转等类似的操作之后形成的B。由此可见相似可以说是换基操作,它也是一种变换,变换后是A的线段长度和像的长可能改变,而A进过平移/旋转之后不一定是保持原有的所有性质,所以相似未必合同,合同也未必相似。但实对称矩阵就不一样了,相似的实对称矩阵一定是合同的,因为对称矩阵是一个很神奇的东西。

矩阵AB等价:A经过初等变换可得到BPQ可逆,也就是说PQ是通过初等变换来的。PAQ也就是A进行行和列初等变换后得到B前面提到初等变换主要是对称伸缩切变等变换,其不会改变矩阵的秩,故矩阵AB等价充要条件为秩相等。

换基(相似变换)、平移旋转轴对称等(合同变换)→都可经过初等变换(可逆)得到,故矩阵相似/合同可推出矩阵等价。

正交变换:正交其实是一个图形到另一个图形,在改变过程中保持图形形状和大小不变的变换,包括平移、旋转、轴对称、相似、合同等。

我来评分 :6
0

转载注明:转自5lulu技术库

本站遵循:署名-非商业性使用-禁止演绎 3.0 共享协议