语言模型正在蓬勃发展,为对话剂提供动力,这些对话代理有助于并授权人类解决许多任务。最近,这些模型被扩展为支持其他方式,包括视觉,音频和视频,展示了包括医疗保健在内的多个领域的令人印象深刻的功能。仍然,由于无法完全理解生物学序列,因此会话剂在生物学上仍然有限。另一方面,生物学序列的高性能基础模型是通过对测序数据的自学构建的,但是对于每个特定应用程序,必须对这些模型进行微调,以防止任务之间传递和概括。此外,这些模型不是对话式的,将其效用限制在具有编码功能的用户中。在本文中,我们建议通过引入CHATNT,这是对生物学序列具有深入了解的第一个多模式对话剂,来弥合生物学基础模型与对话剂之间的差距。chatnt在核苷酸变压器基准上实现了新的最新结果,同时能够一次以英语解决所有任务,并概括地看不到问题。此外,我们还策划了一组来自DNA,RNA和蛋白质的更具生物学相关的指令任务,这些任务涵盖了多种物种,组织和生物学过程。ChatNT与这些任务的最先进的专业方法达到表现。我们还提出了一种基于困惑的新技术,以帮助校准我们的模型预测的信心。结构,成像),使其成为生物学广泛适用的工具。我们的基因组学指导框架可以很容易地扩展到更多的任务和生物数据模式(例如chatnt是同类模型的第一个模型,它构成了迈向建立能力的代理的第一步,这些代理可以从第一原理中了解生物学,同时又可以被没有编码背景的用户访问。
摘要。本文的目的是研究在机械工程领域的Chatgpt和Bert模型的应用。在机器学习的背景下,ChatGPT和BERT模型可以应用于各种自然语言处理任务,例如根据文档的特定版本分析技术文档和构建说明,诊断出故障或客户服务。本文讨论了Bert和Chatgpt模型的基本特征,其起源,还研究了主要的建筑特征,并确定了模型的主要优势和缺点。论文分析并选择各种自然语言处理任务,以测试模型在机器学习中理解自然语言的能力。选定的标准任务分为语义组,以在三个领域的每个领域中识别Chatgpt和Bert模型的功能:逻辑推理任务,释义任务和文本相似性任务。本文还讨论了操作设计的概念,该概念涉及开发指导模型产生所需输出的输入。本文定量分析并比较了基于BERT和CHATGPT模型的性能。发现和研究了自然语言理解任务中Chatgpt模型瓶颈的原因。考虑使用Mivar方法对CHATGPT模型性能的可能改进。
摘要 - 离线目标条件的强化学习(GCRL)的目的是通过脱机数据集的稀疏重新解决目标解决目标任务。虽然先前的工作已经阐明了代理商学习近乎最佳策略的各种方法,但在处理复杂环境(例如安全限制)中处理各种约束时,这些方法会遇到限制。其中一些方法优先考虑目标,而无需考虑安全性,而其他方法则以牺牲培训效率为代价而过度关注安全性。在本文中,我们研究了限制离线GCRL的问题,并提出了一种称为基于恢复的监督学习(RBSL)的新方法,以完成具有各种目标的安全至关重要的任务。为了评估方法性能,我们基于具有随机定位的障碍物的机器人提取环境建立基准测试,并使用专家或随机策略来生成离线数据集。我们将RBSL与三种离线GCRL算法和一种离线安全RL算法进行比较。结果,我们的方法在很大程度上可以执行现有的最新方法。此外,我们通过将RBSL部署在真正的熊猫机械手上来验证RBSL的实用性和有效性。代码可在https://github.com/sunlighted/rbsl.git上找到。
摘要 - 植物材料对行星科学,建筑和制造业中许多机器人任务的关键兴趣。但是,颗粒材料的动力学很复杂,并且通常在计算上非常昂贵。我们提出了一组方法和一个用于快速模拟图形处理单元(GPU)的颗粒材料的系统,并表明该模拟足够快,可以通过增强学习算法进行基础培训,目前需要许多动力学样本才能实现可接受的性能。我们的方法模型使用隐式时间播放方法进行多体刚性接触的颗粒材料动力学,以及算法技术,用于在粒子对和任意形成的刚体之间和任意形状的刚体之间的有效并行碰撞检测,以及用于最小化Warp Divergence的编程技术,以最大程度地构建单层构造(构建多项)。我们在针对机器人任务的几个环境上展示了我们的仿真系统,并将模拟器作为开源工具发布。
摘要 - 从人类示威中学习在机器人操纵中取得了显着的成就。但是,挑战仍然是开发一种与人类的能力和数据效率相匹配的机器人系统,尤其是在复杂的,非结构化的现实世界情景中。我们提出了一个处理RGBD视频的系统,以将人类的动作转化为机器人的原语,并使用接地段的任何东西来识别与任务相关的对象的关键姿势。然后,我们考虑了运动学和碰撞几何形状的人类机器人差异,以解决机器人复制人类行为方面的挑战。为了测试系统的有效性,我们进行了专注于手动洗碗的实验。在模型厨房中记录了单个人类的示例,该系统在每个步骤中取得了50-100%的成功,并且在家庭厨房中使用不同对象的整个任务获得了40%的成功率。视频可从https://robot-dishwashing.github.io获得。索引术语 - 动作学习,操纵,从演示中学习
:KDW DZDUGV KDYH PRYLHV ZULWWHQ E\ SHRSOH ERUQ LQ ZRQ" VHOHFW >WH[W@ :KR ZHUH ERUQ LQ WKH \HDU " $ > *LJDIXQD @ SURMHFWBYDOXHVBIODWBXQLTXH >WDEOH@ :KDW PRYLHV KDV ZULWWHQ" $ > 3QHXPRGHQGURQ 3LSHVLD 5LIWHQ @ SURMHFWBYDOXHVBIODWBXQLTXH >WDEOH@ :KLFK DZDUGV ZHUH JLYHQ WR " $ > 3OXGJHO 'HVVLFDWLRQ 3LDQRJUDP @
1.2 挑战与影响 ARC 公开测试中,人类的平均表现准确率超过 60%[ 3 ]。相反,最有能力的模型利用 SOTA LLM[ 4 ] 也只能达到 50% 以下的准确率。考虑到大量的预训练数据,当前人工智能与人类之间的差距更加明显。对 ARC 竞赛解决方案的研究可以为我们对人类思维中的直觉和推理过程进行建模提供重要见解,促进新型人工智能范式的构建。同时,“[至少,解决 ARC-AGI 将产生一种新的编程范式[ 5 ]”,只需展示几个输入输出示例,就可以让没有编码经验的人进行程序合成。2 竞赛细节 数据集 ARC Prize 竞赛提供三个数据集:公共训练集、公共评估集和私有评估集。公共训练集和公共评估集均包含 400 个任务文件,而私有评估集包含 100 个任务文件。每个任务有 2 到 10 对(通常为 3 个)示例和 1 到 3 对(通常为 1 个)测试[2, 6]。指标 我们可以通过两种方法评估性能: 1)像素正确性 - 正确推断的像素占总数的百分比; 2)正确/不正确 - 推断的输出在形状、颜色和位置方面是否与任务的测试输出相匹配。竞赛使用第二种方法评估提交内容[6]。
为每个复杂任务从头开始训练大型模型会浪费大量资源和数据。为了帮助开发能够利用现有系统的模型,我们提出了一项新挑战:通过自然语言与现有代理(或模型)进行交流,学习解决复杂任务。我们设计了一个综合基准 C OMMA QA,其中包含三个复杂推理任务(显式、隐式、数字),旨在通过与现有 QA 代理进行交流来解决。例如,使用文本和表格 QA 代理来回答诸如“谁是美国投掷标枪最远的人?”之类的问题。我们表明,即使可以访问每个代理的知识和黄金事实监督,黑盒模型也很难从头开始学习这项任务(准确率低于 50%)。相比之下,学习与代理交流的模型表现优于黑盒模型,在黄金分解监督下,得分达到 100%。然而,我们表明,通过与现有代理进行通信而不依赖任何辅助监督或数据来学习解决复杂任务的挑战仍然难以实现。我们发布了 C OMMA QA 以及组合泛化测试拆分,以推进该方向的研究。1
摘要:近几十年来,脑机接口 (BCI) 已成为研究的前沿领域。特征选择对于降低数据集的维度、提高计算效率和增强 BCI 的性能至关重要。使用与活动相关的特征可以在所需任务中获得较高的分类率。本研究提出了一种基于包装器的元启发式特征选择框架,用于使用功能性近红外光谱 (fNIRS) 的 BCI 应用。在这里,从所有可用通道计算时间统计特征(即平均值、斜率、最大值、偏度和峰度)以形成训练向量。使用基于 k 最近邻的成本函数测试了七种元启发式优化算法的分类性能:粒子群优化、布谷鸟搜索优化、萤火虫算法、蝙蝠算法、花授粉优化、鲸鱼优化和灰狼优化 (GWO)。基于来自 29 名健康受试者的运动想象 (MI) 和心算 (MA) 任务的在线数据集,对所提出的方法进行了验证。结果表明,与从全套特征中获得的特征相比,利用从元启发式优化算法中选择的特征可以显著提高分类准确率。所有上述元启发式算法都提高了分类准确率并减小了特征向量大小。GWO 对 MA、MI 和四类(左手和右手 MI、MA 和基线)任务的平均分类率最高(p < 0.01),分别为 94.83 ± 5.5%、92.57 ± 6.9% 和 85.66 ± 7.3%。所提出的框架可能有助于在训练阶段为基于 fNIRS 的稳健 BCI 应用选择合适的特征。
摘要在过去的十年中,家用机器人技术取得了巨大进步,使机器人能够自主完成家庭任务。这些机器人通常用于特定任务和/或对象。我们假设可以通过基于知识的方法来克服实现新的临时任务请求方面缺乏灵活性,从而允许机器人推断如何解决新任务或在新对象上执行已知任务。朝向这个目标,我们提出了一种基于知识的方法,该方法利用网络上已经存在的知识来构建一个本体学支持机器人在推理参数的推理中,这些参数会影响操纵动作,以执行一系列对象的任务变化1。本体论包括对象和动作信息,涵盖了处置和负担以及特定于任务的属性。作为概念验证,我们通过从相关本体论中导入和链接知识来手动构建食物切割本体,此外还可以从非结构化的网络来源提取和语义增强知识。我们演示了机器人如何查询本体,并将包含的信息转化为动作参数。我们通过模拟访问本体的机器人来评估创建的本体论的可行性,以执行切割任务变化的操作参数化。