当人工智能发疯时

来源:曼哈顿政策研究所信息

2016年,OpenAI的工程师花了几个月的时间教人工智能系统玩视频游戏。或者,更确切地说,他们花了几个月的时间观看AI代理学习玩电子游戏。这是在人工智能是不间断炒作和焦虑的主题之前的日子。 Openai是由Elon Musk,Sam Altman和其他技术Savants创立的,并且在一年前,仍然像智囊团一样操作更像是一个智囊团。

学习

研究人员正在使用一个名为Coastrunners的视频游戏训练他们的系统,其中玩家控制了一辆摩托艇,该摩托艇在赛道上赛中其他船只,并在沿着路线的目标达到目标时获得了额外的积分。 OpenAI团队正在使用一种称为强化学习或RL的方法。研究人员没有像在传统的计算机程序中那样为代理提供完整的说明,而是让它通过反复试验来弄清楚游戏。 RL代理在AI列出中获得了单个总体激励或“奖励功能”:尽可能多地提高点。因此,每当它偶然发现产生点的动作时,它都会努力复制那些获胜的动作。研究人员认为,随着代理商在赛道上奔波,它将开始学习策略,最终将帮助其专业地缩小到终点线。

野外奖励功能有故障 不要试图赢得比赛

继续在这里阅读整个文章

继续在此处阅读整个作品 评论

______________________

James B. Meigs是曼哈顿研究所的高级研究员,也是《城市日报》的撰稿人。

James B. Meigs是曼哈顿研究所的高级研究员,也是《城市日报》撰写Edito James B. Meigs