摘要 - 面对概括为新颖环境的挑战时,塔迪的机器人策略表现出低于标准的性能。人类纠正反馈是实现这种概括的一种至关重要的指导形式。但是,适应并从在线人类矫正中学习是一项非凡的努力:不仅机器人需要记住人类随着时间的推移的反馈,才能在新环境中检索正确的信息并降低干预率,而且还需要能够响应有关高级人类偏好对低级级别的高度调整的反馈,以响应对低级人士的高度调整。在这项工作中,我们介绍了基于大型语言模型(LLM)的在线校正(DROC)的蒸馏和检索,该系统可以响应语言反馈的任意形式,从校正中提取的可提取知识,以及基于文本和视觉相似性,从而在新颖设置中提高绩效。DROC能够响应一系列在线语言校正,这些校正解决了高级任务计划和低级技能原则中的失败。我们证明DROC有效地将相关信息从知识库中的在线更正顺序提取,并通过新任务或对象实例检索这些知识。DROC优于通过LLMS [1]直接生成机器人代码的其他技术,仅使用第一轮中所需的校正总数的一半,并且两次迭代后几乎不需要校正。我们在我们的项目网站上显示进一步的结果和视频:https://sites.google.com/stanford.edu/droc。
Aubry, S. (2019)。食品和农业植物遗传资源数字序列信息的未来。植物科学前沿,10,1046。https://doi.org/10.3389/fpls.2019.01046 Baurens, F.-C.、Martin, G.、Hervouet, C.、Salmon, F.、Yohomé, D.、Ricci, S.、Rouard, M.、Habas, R.、Lemainque, A.、Yahiaoui, N. 和 D'Hont, A. (2019)。重组和大型结构变异塑造了种间食用香蕉基因组。分子生物学与进化,36,97–111。 https://doi.org/10.1093/molbev/msy199 Carpentier, SC、Dens, K.、den Houwe, IV、Swennen, R. 和 Panis, B. (2007)。冻干是一种在蛋白质提取进行 2DE 分析之前储存和运输组织的实用方法吗?蛋白质组学,7,64-69。 https://doi.org/10.1002/pmic.200700529 Cenci, A.、Hueber, Y.、Zorrilla-Fontanesi, Y.、van Wesemael, J.、Kissel, E.、Gislard, M.、Sardos, J.、Swennen, R.、Roux, N.、Carpentier, SC 和 Rouard, M. (2019)。古多倍体和异源多倍体对香蕉基因表达的影响。 BMC Genomics , 20 , 244, https://doi. org/10.1186/s12864-019-5618-0 Cenci, A., Sardos, J., Hueber, Y., Martin, G., Breton, C., Roux, N., Swennen, R., Carpentier, SC, & Rouard, M. (2020). 揭秘 ABB 异源三倍体香蕉中基因组间重组的复杂故事。《植物学年鉴》, 127 , 7–20。 https://doi.org/10.1093/aob/ mcaa032 D'Hont, A.、Denoeud, F.、Aury, J.-M.、Baaurens, F.-C.、Carreel, F.、Garsmeur, O.、Noel, B.、Bocs, S.、Droc, G.、Rouard, M.、Da Silva, C.、Jabbari, K.、Cardi, C.、Poulain, J.、Souquet, M.、Labadie, K.、Jourda, C.、Lengellé, J.、Rodier-Goud, M.、……Wincker, P. (2012)。香蕉(Musa acuminata)基因组和单子叶植物的进化。 Nature , 488 , 213. https://doi.org/10.1038/nature11241 Davey, JW, Davey, JL, Blaxter, ML, & Blaxter, MW (2010). RADSeq:下一代群体遗传学。Briefingings in Functional Genomics , 9 , 416–423. https://doi.org/10.1093/bfgp/elq031 Droc, G.、Lariviere, D.、Guignon, V.、Yahiaoui, N.、This, D.、Garsmeur, O.、Dereeper, A.、Hamelin, C.、Argout, X.、Dufayard, J.-F.、Lengelle, J.、Baaurens, F.-C., Cenci, A.、Pitollat, B.、D'Hont, A.、Ruiz, M.、Rouard, M.,