详细内容或原文请订阅后点击阅览
在人工智能模型中测量感知
感知——通过感官体验世界的过程——是智能的重要组成部分。而构建具有人类水平的感知理解世界的代理是一项核心但具有挑战性的任务,这在机器人、自动驾驶汽车、个人助理、医学成像等领域变得越来越重要。所以今天,我们推出了感知测试,这是一个使用真实世界视频来帮助评估模型感知能力的多模式基准。
来源:DeepMind - 新闻与博客研究
测量 AI 模型中的感知
- 2022 年 10 月 12 日发布AutoryViorica Word、Arkush Gupta、Adria Recasens、Yi Yang、Sanda Coppula、Tatiana Matthew、Antoine Miech、Alex Frechedte、Junlin 张、Hanna Klimczak、Stephanie Winkler、Yusuf Aytar、Raphael Koster、Simon Osindero、Dima Damen。 ,安德鲁·齐瑟曼,若昂·卡雷拉。
Viorica Pătrăucean、Lucas Smaira、Ankush Gupta、Adria Recasens、Yi Yang、Mateusz Malinowski、Carl Doersch、Larisa Markeeva、Yury Sulsky、Dylan Banarse、Skanda Koppula、Tatiana Matejovicova、Antoine Miech、Alex Junchette、Klim Zhuangczak、Hanna Zhuangczak 、斯蒂芬妮·温克勒、优素福·阿伊塔尔、拉斐尔·科斯特、西蒙·奥辛德罗、迪马·达门、安德鲁·齐瑟曼、若昂·卡雷拉。
基于真实视频、音频和文本数据评估多模态系统的新基准
从图灵测试到 ImageNet,基准测试通过帮助定义研究目标并允许研究人员衡量实现这些目标的进展,在塑造人工智能 (AI) 方面发挥了重要作用。过去 10 年中令人难以置信的突破,例如计算机视觉领域的 AlexNet 和蛋白质折叠领域的 AlphaFold,都与使用基准数据集密切相关,使研究人员能够对模型设计和训练选择进行排名,并迭代改进模型。当我们致力于构建通用人工智能 (AGI) 的目标时,开发强大且有效的基准来扩展 AI 模型的功能与开发模型本身同样重要。
图灵测试