为什么机器人很难理解人类的面部表情 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

为什么机器人很难理解人类的面部表情

2026年6月10日 12:29 33 Comments

人工智能在理解周围世界方面变得越来越熟练，但新的研究表明它仍然有一个主要弱点：读取人类的面部表情。康奈尔大学的研究人员一直在探索赋予机器人更强的社交智能的方法，以便它们能够更有效地与人类一起工作。社交智能让人类能够解读面部表情 […]《为什么机器人难以理解人类面部表情》一文首先出现在 Knowridge Science Report 上。

来源:Knowridge科学报告

人工智能在理解周围世界方面变得越来越熟练，但新的研究表明它仍然有一个主要弱点：读取人类的面部表情。

康奈尔大学的研究人员一直在探索赋予机器人更强的社交智能的方法，以便它们能够更有效地与人类一起工作。

社交智能使人类能够解读面部表情、理解情绪并预测接下来可能发生的情况。

对于在家庭、医院、工作场所或公共场所运行的机器人来说，这些技能可能与身体能力一样重要。

在一项新研究中，研究人员测试了被称为视觉语言模型 (VLM) 的先进人工智能系统是否可以预测潜在风险情况将如何结束。

这些人工智能模型可以处理图像和语言，使它们能够理解视觉场景并描述他们所看到的内容。

团队向模型展示了结果不确定的情况的短视频。例如，一段视频显示一个幼儿拿着一个装满咖啡的杯子，而另一段视频则显示一名男子在割草机上超速行驶。有些视频安全结束，而另一些则糟糕地结束。

研究人员要求人工智能模型在结局揭晓之前预测结果。

结果出奇的好。一些模型能够在大约 70% 的情况下正确预测结果。性能最好的系统甚至超过了人类参与者的平均水平。这表明现代人工智能正在变得非常有能力分析视觉线索并识别可能出错的情况。

然而，研究人员想要测试一些更具挑战性的东西。他们没有向人工智能展示原始视频，而是只向人工智能展示正在观看这些视频的人的面部表情。

当人类看到危险、尴尬或可能失败的事情时，通常会本能地做出反应。担忧的表情、扬起的眉毛或做鬼脸都可以透露出即将发生的事情。

视觉场景失败的确定的工作场所预测最好的人工智能工作场模型结果能够表情研究人员参与者面部视频显示展示运行的原始视频视频可能超速行驶不确定的人类机器人情况

为什么机器人很难理解人类的面部表情

其他外部链接

Tags

XiaoMi-AI