摘要 - 多任务机器人学习在应对多样化和复杂方案方面具有重要的重要性。但是,在收集培训数据集的性能问题和困难中,当前的方法受到了阻碍。在本文中,我们提出了细菌(通才机器人模型)。我们利用离线加强学习来优化数据利用策略,以从演示和亚最佳数据中学习,从而超过了人类示范的局限性。此后,我们采用基于变压器的VLA网络来处理多模态输入和输出操作。通过引入Experts结构的混合物,细菌允许使用更高的整个模型容量的推理速度更快,从而解决了有限的RL参数的问题,从而在控制计算成本的同时增强了多任务学习中的模型性能。通过一系列实验,我们证明了细菌在所有任务中都优于其他方法,同时还验证了其在培训和推理过程中的效率。此外,我们发现了其获得新兴技能的潜力。此外,我们贡献了Quard-Auto数据集,该数据集自动收集以支持我们的培训方法并促进多任务四倍的机器人学习中的进步。这项工作提出了一种新的范式,用于降低收集机器人数据和推动多任务学习社区进度的成本。您可以通过链接:https://songwxuan.github.io/germ/到达我们的项目和视频。
fi g。 2。这种极化分解·基于印度的RGB图像·04 0 \ .. Vi5akhapatnam,印度。突出显示了独特的散射现象RED REPRE SMTS双重散射。蓝色指示单反射散射。和Grem表示,量扫描..- d = mt,
BUMN: State-Owned Enterprises Capex: Capital Expenditure COD: Commercial Operating Date EBT: New and Renewable Energy EBTKE: Directorate General of New and Renewable Energy and Energy Energy Conservation: Ministry of Energy and Mineral Resources Fit: feed-in Grem: Geothermal Resource Risk Mitigation HPT: IPB: Geothermal Permit IPP: Independent Power Producer IRR: Internal Rate of Return JOC: Joint Operation Contract KKPR: Cooperation Agreement for KLHK Spatial Use: Ministry of Environment and Forestry OPEX: Operational Expenditure Oss: Online Single Submission PBB: Agreement PISP: FINANCE OF INFRASTRUCTURE SECTOR SEARCH Sector PJBL: PLTP Electric Power Sale: PLN Geothermal Power Plant: State Electricity Company PMK: Minister of Finance Regulation PPh: PPI Income Tax: Producer Price Index PPKH: Approval of the use of Forest Areas VAT: Rukn增值税:通用电力计划Ruen:地热