当人工智能发疯时 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

当人工智能发疯时

2025年8月13日 09:08 33 Comments

无

来源:曼哈顿政策研究所信息

2016年，OpenAI的工程师花了几个月的时间教人工智能系统玩视频游戏。或者，更确切地说，他们花了几个月的时间观看AI代理学习玩电子游戏。这是在人工智能是不间断炒作和焦虑的主题之前的日子。 Openai是由Elon Musk，Sam Altman和其他技术Savants创立的，并且在一年前，仍然像智囊团一样操作更像是一个智囊团。

学习

研究人员正在使用一个名为Coastrunners的视频游戏训练他们的系统，其中玩家控制了一辆摩托艇，该摩托艇在赛道上赛中其他船只，并在沿着路线的目标达到目标时获得了额外的积分。 OpenAI团队正在使用一种称为强化学习或RL的方法。研究人员没有像在传统的计算机程序中那样为代理提供完整的说明，而是让它通过反复试验来弄清楚游戏。 RL代理在AI列出中获得了单个总体激励或“奖励功能”：尽可能多地提高点。因此，每当它偶然发现产生点的动作时，它都会努力复制那些获胜的动作。研究人员认为，随着代理商在赛道上奔波，它将开始学习策略，最终将帮助其专业地缩小到终点线。

野外奖励功能有故障 不要试图赢得比赛

继续在这里阅读整个文章

继续在此处阅读整个作品 评论

______________________

James B. Meigs是曼哈顿研究所的高级研究员，也是《城市日报》的撰稿人。

James B. Meigs是曼哈顿研究所的高级研究员，也是《城市日报》撰写Edito James B. Meigs

阅读 Meigs 反复试验计算机动作额外的 OpenAI James 人工智能使用弄清楚继续提高代理智囊团系统路线的代理商研究人员摩托艇 RL 赛道达到目标工程师完整的游戏学习研究员 AI 研究所传统的

当人工智能发疯时

其他外部链接

Tags

XiaoMi-AI