Loading...
机构名称:
¥ 1.0

Roberta Reareanu是Meta的研究科学家,也是UCL的名誉讲师。她从纽约大学获得了计算机科学博士学位,在那里她从事深度强化学习的概括。目前,她通过培训反馈和与外部工具,环境和人类的互动来培训他们,从而增强基础模型,从而增强基础模型。罗伯塔(Roberta)先前已经在ICML 2021上的无监督RL(URL)的研讨会,开放式的代理人学习(芦荟)(芦荟)在ICLR 2022和Neurips 2023以及2023年NEURIPS 2023的社会负责语言模型研究工作室。

决策的生成模型ICLR'24研讨会建议

决策的生成模型ICLR'24研讨会建议PDF文件第1页

决策的生成模型ICLR'24研讨会建议PDF文件第2页

决策的生成模型ICLR'24研讨会建议PDF文件第3页

决策的生成模型ICLR'24研讨会建议PDF文件第4页

决策的生成模型ICLR'24研讨会建议PDF文件第5页

相关文件推荐