机器学习中突破的加速速度对人工智能的未来能力提供了无与伦比的乐观。尽管取得了令人印象深刻的进展,但是现代机器学习方法仍然基于基本假设,即测试时间的数据是由收集培训示例的相同分布生成的。为了构建强大的智能系统 - 自动驾驶的车辆,机器人助手,智能电网 - 安全地与周围环境互动并控制周围环境,我们必须理解闭环中部署模型的反馈效果。我的研究应对使用机器学习来控制启用反馈系统的挑战,该系统基于机器人技术的背景。i使用控制理论,统计和优化中的工具来对基于现代数据驱动的控制管道的方法有原则的理解。表征我的贡献的密钥线程是:•从时间相关的数据中学习:反馈系统的区别特征是,数据在随着时间的流逝中变得相关,这打破了密钥独立性的基础机器学习方法。现有的文献表明,与依赖关系的学习要比没有依赖性更难,并且需要通常在实践中不存在的假设。在[11,12,17]中,我表明,对于许多问题,前景更加明亮:从依赖数据中学习是令人惊讶的效果,就好像数据实际上是独立的一样。
主要关键词