Loading...
机构名称:
¥ 1.0

无论人工智能代理有多少可用数据,代理在实际部署中都不可避免地会遇到以前从未见过的情况。通过从其他人那里获取新信息来应对新情况(即社交情境学习)是人类发展的核心能力。不幸的是,社交情境学习对人工智能代理来说仍然是一个开放的挑战,因为它们必须学会如何与人互动以寻找它们所缺乏的信息。在本文中,我们将社交情境人工智能的任务(代理通过与人的社交互动寻找新信息)形式化为强化学习问题,代理通过社交互动观察到的奖励来学习识别有意义且信息丰富的问题​​。我们将我们的框架表现为一个交互式代理,它在大型照片共享社交网络上拓展其视觉智能时,学习如何用自然语言询问有关照片的问题。与主动学习方法不同,主动学习方法隐含地假设人类是愿意回答任何问题的神谕,而我们的代理则根据观察到的规范来调整其行为,即人们有兴趣或不感兴趣回答哪些问题。通过为期 8 个月的部署,我们的代理与 236,000 名社交媒体用户进行了互动,我们的代理在识别新视觉信息方面的表现提高了 112%。受控现场实验证实,我们的代理的表现比主动学习基线高出 25.6%。这项工作为不断改进人工智能 (AI) 代理提供了机会,使其能够更好地遵守开放社交环境中的规范。

社会情境人工智能能够从人类互动中学习

社会情境人工智能能够从人类互动中学习PDF文件第1页

社会情境人工智能能够从人类互动中学习PDF文件第2页

社会情境人工智能能够从人类互动中学习PDF文件第3页

社会情境人工智能能够从人类互动中学习PDF文件第4页

社会情境人工智能能够从人类互动中学习PDF文件第5页

相关文件推荐

2022 年
¥1.0
2021 年
¥1.0
2023 年
¥2.0
2022 年
¥1.0