Loading...
机构名称:
¥ 1.0

新颖的增强学习算法或对现有的算法进行的改善,通常通过评估其在基准环境上的性能来概括,并将其与不断变化的标准算法集进行比较。但是,尽管有许多需要改进的要求,但经验实践仍会产生误导或不支持的主张。进行不合标准的做法的一个原因是进行严格的基准测试实验需要基本计算时间。这项工作投资了严格的实验设计中计算成本增加的来源。我们表明,严格的性能基准可能会产生通常很重要的计算成本。因此,我们主张使用附加实验范式克服基准测试的局限性。

位置:基准测试在增强学习研究中受到限制

位置:基准测试在增强学习研究中受到限制PDF文件第1页

位置:基准测试在增强学习研究中受到限制PDF文件第2页

位置:基准测试在增强学习研究中受到限制PDF文件第3页

位置:基准测试在增强学习研究中受到限制PDF文件第4页

位置:基准测试在增强学习研究中受到限制PDF文件第5页