摘要:从大型多任务演示数据集中学习的模仿学习已成为构建普通能力的机器人的有前途的途径。结果,已经花费了1000个小时来在全球构建如此大规模的数据集上。尽管这种努力不断增长,但我们仍然缺乏对应收集哪些数据来改善机器人数据集的效用的系统性理解,并促进了下游政策学习。在这项工作中,我们进行了一项大规模的数据集组成研究,以回答这个问题。我们开发了一个数据生成框架,以在实际数据集(例如传感器放置,对象类型和安排)中模拟普通多样性,并使用它来生成具有控制组成的大规模机器人数据集,从而实现了在现实世界中会昂贵的数据集组成研究。我们专注于两个实际设置:(1)当未来的研究人员收集大规模的机器人数据集时,应强调哪种类型的多样性,以及(2)当前的从业人员如何从现有数据集中检索相关的演示以最大程度地提高关注任务的下游政策绩效。我们的研究产生了几个关键见解 - 例如,我们发现相机的姿势和空间排列是收集多样性和检索对齐方式的关键维度。在现实世界的机器人学习设置中,我们发现,不仅可以从模拟中进行洞察力,而且我们对现有数据集(例如Droid)的检索策略使我们能够始终如一地超过现有的培训策略高达70%。https://mimiclabs-iclr.github.io/
尾随 – 尾随功能可识别紧随其前行人员或车辆进入受控/限制出入区域的个人或车辆。它可检测并阻止通过安全网关的未经授权的访问,并通过准确的视觉验证记录潜在的不安全活动。此功能与所有领先的出入控制系统兼容,配置和部署非常简单。借助高级对象分类服务器,此功能可以可靠地检测和区分多种对象类型,并支持针对人员和车辆的可定制检测。它还带有灵活的输出触发器,可有效启动几乎所有应用要求的后续操作。尾随功能主要用于办公室、购物中心和封闭式社区,以阻止和防止未经授权的访问。深度学习:深度学习技术是人工智能的一个子集,它使机器接触大量标记数据。然后,机器被要求在新数据集中“学习”、“分析”和“检测”相同的信息,从而确保更熟练地检测和识别对象。由于深度学习技术也由强大的硬件基础设施提供支持,因此分析输出会更好、更快。深度学习在尾随检测中的应用:深度学习在尾随检测中的应用使其更接近人类感知。先进的深度学习方法可以评估大量移动和静止物体的数据集,分层过滤器可以考虑最细微的细节。这提高了生成尾随警报的准确度。得益于该技术改进的处理性能和卓越的物体分类能力,它可以有效地检测和识别多种物体类型,并且视觉偏差和误报率较低。
图1描绘了使用标记数据训练以预测材料特性的典型监督ML模型。此类ML模型的主要组成部分是(a)定义问题(b)数据采集并选择适当的特征空间,(c)数据处理或探索性数据分析(EDA)和(d)使用合适的算法培训和验证该模型。尽管有许多开源材料数据库,但与数据科学的其他领域相比,数据由不同的类别组成,每个类别的数据相对有限。在大多数实验数据中,研究是在不同的实验条件下进行的,因此数据取决于温度,时间,湿度,原始化学物质等各种对照参数。选择数据后,下一个关键挑战是选择材料的适当功能集(指纹),以用目标属性映射。诸如Pymatgen [12],Matminer [13],原子模拟环境(ASE)[14],DSCRIBE [15]等的开源库[13]等。对于分子和材料的不同位点,键和全局(晶格)特征非常有用。EDA包括验证任何异常值,将丢失的数据推出,将对象类型参数编码为数字类型,检查数据中的任何重复副本等。一旦数据准备就绪,为给定问题选择特定算法是另一个挑战,它应该考虑不同的因素,例如数据的大小,特征空间,问题的复杂性等。如果选择有限的数据点(例如深度学习算法)(高方差)模型(高方差)模型,则可能导致过度拟合。训练模型的解释性是了解最归因于总体预测的特征的另一个重要因素[16]。可以使用超参数调谐方法(如随机搜索交叉验证和网格搜索交叉验证)进一步调整模型的精度。