详细内容或原文请订阅后点击阅览
祝贺#ijcai2025杰出纸奖获奖者
国际人工智能会议(IJCAI)杰出的纸质奖项认可了每年会议上介绍的一些最佳论文。今年,在开幕式上,三篇文章被称为杰出论文。优胜者正在……将莫尔与限制螺栓结合在一起学习规范行为,艾弗尔·纳菲尔德(Agata Ciabattoni)[…]
来源:ΑΙhub国际人工智能会议(IJCAI)杰出的纸质奖项认可了每年会议上介绍的一些最佳论文。今年,在开幕式上,三篇文章被称为杰出论文。
国际人工智能会议(IJCAI) 三篇文章被称为杰出论文,获胜者是…
将Morl与限制螺栓结合在一起学习规范行为A. Neufeld,Agata Ciabattoni和Radu Florin Tulcan
将MORL与限制螺栓结合在一起以学习规范行为 Emery A. Neufeld,Agata Ciabattoni和Radu Florin Tulcan摘要:规范性限制螺栓(NRB)适应限制螺栓技术(最初是为了安全增强学习而开发的),以确保遵守社会,法律和道德规范。 NRB有效地依靠反复试验的调整,这阻碍了他们执行层次规范的能力。此外,规范更新需要重新培训。在本文中,我们将NRB作为多目标增强学习(MORL)问题重新制定学习,其中每个规范都被视为一个独特的目标。这使得引入有序的规范限制螺栓(ONRB),该螺栓支持算法权重选择,优先级规范,规范更新,并为最大程度地减少规范违规行为提供正式保证。案例研究表明,ONRB为RL-Agent提供了强大而有原则的基础,可以在实现目标的同时遵守广泛的规范。
摘要:在此处完整阅读论文。
在这里Boost带有强大压缩边界的AI模型,Tao Chen,Zhongxue gan
Boost具有强大压缩边界的AI模型 chong Yu,Tao Chen,Zhongxue gan使用马尔可夫链操作员选择以及唯一具有良好耐加入的操作员Abdrahim Bendahi,Benjamin Doerr,Adrien Fradin和Johannes F. Lutzeyer
d m n2m -1 2m -1 o nm+1 m+1 n3 3 n nk+1 k+1 k k = 2标签:
ijcai,
ijcai2025