Loading...
机构名称:
¥ 1.0

将序列建模技术应用于决策问题,例如连续控制和黑框优化。对于连续控制,我们确定了决策变压器和拟议法案(AAAI'24接受)的潜在故障模式,以利用优势条件来实现强大的控制。进行黑盒优化,我们提出了通过安装行为算法的遗憾的学习历史来提炼和加强现有的黑框优化算法,从而使序列模型能够充当通用优化器(当前是提交)。bytedance,北京,中国07/2021 - 11/2021研究实习生

chen-xiao gao

chen-xiao gaoPDF文件第1页

chen-xiao gaoPDF文件第2页