详细内容或原文请订阅后点击阅览
计算机如何“看到”分子
生成分子设计(第1部分):数据科学中的常见分子表示。帖子如何“看到”分子首先出现在数据科学上。
来源:走向数据科学一台计算机,Edvard Munch的TheScream不过是像素值的网格。它没有意识到为什么在暮光天空中旋转着线条传达出尖叫的痛苦。这是因为(现代数字)计算机从根本上处理二元信号[1,2];他们天生就不理解我们所感知的对象和情感。
thescream要模仿人类智能,我们首先需要一种中间形式(表示)将我们的感官世界“转化”到计算机可以处理的东西。对于尖叫,这可能意味着提取边缘,颜色,形状等。同样,在自然语言处理(NLP)中,计算机将人类语言视为必须将数字向量或其他结构化形式变成数字向量或其他结构化形式的非结构化符号流。只有这样,它才能开始将原始输入映射到高级概念(即建立模型)。
中间形式(表示) 尖叫 数字向量或其他结构化形式人类智能也取决于内部表示。
在心理学中,一种表示是指代表外界事物的内部精神符号或形象[3]。换句话说,一种表示是如何在大脑中编码信息:我们使用的符号(单词,图像,记忆,艺术描述等)代表对象和思想。
我们的感官不仅仅是将外部世界直接放入我们的大脑中;相反,他们将感觉输入转换为抽象的神经信号。例如,眼睛将光转换为视网膜上的电信号,耳朵将空气振动变成神经冲动。这些神经信号是大脑对外部世界的表现,用于重建我们对现实的看法,在我们的脑海中基本上建立了“模型”。
术前阶段没有我们的感官将物理信号转化为内部代码,我们无法感知任何东西[5]。
“垃圾进,垃圾”。表示形式的质量设定了上限的上限[6,7]。
compact 8 10 4