线性代数的鸟类视图:为什么矩阵乘法会这样?

由于我们操纵高维矢量的方式主要是矩阵乘法,因此说这是现代AI革命的基石。首先出现在数据科学上。

来源:走向数据科学

关于线性代数的过程内书的一章,“线性代数的鸟类眼光”。目的表到目前为止:

请继续关注以后的章节。

在这里,我们将描述可以使用两个矩阵进行的操作,但是请记住它们只是线性地图的表示。

i)为什么要关心矩阵乘法?

几乎所有信息都可以嵌入矢量空间中。图像,视频,语言,语音,生物识别信息以及您可以想象的其他任何内容。机器学习和人工智能的所有应用(例如最近的聊天机器人,映像等文本等)都在这些矢量嵌入的顶部工作。由于线性代数是处理高维矢量空间的科学,因此它是必不可少的构件。

来自我们现实世界中的复杂概念,例如图像,文本,语音等,可以嵌入高维矢量空间中。向量空间的维度越高,它可以编码的越复杂信息。由Midjourney创建的图像。

许多技术涉及将一些输入向量从一个空间中取出,并将它们映射到其他一些空间中的其他矢量。

但是为什么当最有趣的功能是非线性时,为什么要关注“线性”?这是因为使我们的模型高维和使其非线性(一般足以捕获各种复杂关系)的问题彼此之间是正交的。 许多神经网络体系结构通过在它们之间使用简单的一维非线性线性线性层来起作用。 而且有一个定理说这种体系结构可以建模任何功能。

由于我们操纵高维矢量的方式主要是矩阵乘法,因此说这是现代AI革命的基岩并不是一个伸展。

ii)地图上的代数

在第2章中,我们学会了如何用决定因素量化线性图。现在,让我们与他们一起做一些代数。我们需要两个线性地图和一个基础。

第2章
线性图上的代数。 Midjourney的图像。

a+b = b+a

0