Loading...
机构名称:
¥ 1.0

纽约,纽约,2025年3月5日 - ACM,计算机协会,今天,Andrew G. Barto和Richard S. Sutton是2024 ACM A.M.的接受者图灵(Turing)因发展强化学习的概念和算法基础而奖。在从1980年代开始的一系列论文中,Barto和Sutton介绍了主要思想,构建了数学基础,并开发了强化学习的重要算法,这是创建智能系统的最重要方法之一。Barto是马萨诸塞大学阿默斯特大学的信息和计算机科学名誉教授。Sutton是艾伯塔大学(University of Alberta)的计算机科学教授,Keen Technologies的研究科学家,AMII的研究员(Alberta Machine Intelligence Institute)。ACM A.M.图灵奖,通常称为“计算机上的诺贝尔奖”,带有100万美元的奖金,并提供了Google,Inc.提供的财务支持。该奖项以英国数学家Alan M. Turing的名字命名,他阐明了计算机的数学基础。什么是强化学习?人工智能(AI)的领域通常与建造代理有关,即感知和行动的实体。更聪明的代理人是那些选择更好的行动方案的代理商。因此,某些行动方案比其他行动更好的概念是AI的核心。奖励 - 从心理学和神经科学中借来的一个术语 - 指示提供给与其行为质量相关的代理商的信号。强化学习(RL)是学习信号更成功地学习的过程。从奖励中学习的想法已经熟悉了数千年。后来,艾伦·图灵(Alan Turing)1950年的论文“计算机和智能”,解决了“ can can

ACM AM Turing奖授予了两名领导的研究人员

ACM AM Turing奖授予了两名领导的研究人员PDF文件第1页

ACM AM Turing奖授予了两名领导的研究人员PDF文件第2页

ACM AM Turing奖授予了两名领导的研究人员PDF文件第3页

ACM AM Turing奖授予了两名领导的研究人员PDF文件第4页