摘要:机器人培训通常在模拟环境中进行,尤其是在增强学习中。因此,使用域随机化生成多个培训环境,以确保转移到现实世界应用程序并弥补未知现实世界状态。我们建议通过在培训过程的各个阶段参与人类应用专家来改善域随机化。专家可以在模拟现实主义,确定遗漏的属性并验证机器人执行方面提供有价值的判断。我们的人类在循环工作流程中描述了它们如何在五个阶段增强过程:验证和改善现实世界扫描,纠正虚拟表示,指定特定于应用程序的对象属性,验证和影响模拟环境的产生和验证机器人培训。我们概述了示例并强调研究机会。此外,我们提出了一个案例研究,在该案例研究中,我们实施了不同的原型,证明了在给定阶段的人类专家的潜力。我们的早期见解表明,人类的投入可以使不同阶段的机器人培训受益。