摘要 — 人工智能 (AI) 能力正在迅速发展。功能强大的 AI 可能会带来截然不同的未来,具体取决于其开发和部署方式。我们无法以可靠地指导 AI 行为的方式指定人类目标和社会价值观。除了非常有限的一组状态-动作-值之外,指定 AI 在特定世界状态下采取特定行动的可取性(价值)是非常困难的。机器学习的目的是针对一组状态进行训练,并让生成的代理概括出在未遇到的情况下选择高价值行动的能力。不可避免的是,在训练期间将价值归因于代理行为的函数是对人类价值观的不完整封装,并且训练过程是对所有可能的未来相关状态的稀疏探索。因此,经过训练后,AI 会部署在人类偏好领域的粗略地图上,并且通常会选择与我们偏好的路径不一致的行动。
多模式大型语言模型(MLLM)在视觉教学调整中取得了显着的成功,但由于大型语言模型(LLM)骨干的自动回归解码,它们的推论既耗时又耗时。传统的加速推理方法,包括模型压缩和从语言模型加速的迁移,通常会损害输出质量或有效整合多模式特征的face Challenges。为了解决这些问题,我们提出了AASD,这是一个新型的框架,用于加速使用精制的KV缓存并在MLLM中对准投机解码。我们的方法利用目标模型的缓存键值(KV)对提取生成草稿令牌的重要信息,从而有效地投机解码。为了减少与长多模式令牌序列相关的计算负担,我们会引入KV投影仪,以压缩KV缓存,同时保持代表性保真度。此外,我们设计了一种目标放射线注意机制,以优化草稿和目标模型之间的对齐方式,从而以最小的计算开销来实现真实推理情景的好处。主流MLLM的广泛实验表明,我们的方法在不牺牲准确性的情况下达到了2倍推理的速度。这项研究不仅为加速MLLM推断提供了有效且轻巧的解决方案,而且还引入了一种新颖的对齐策略,用于在多模式背景下进行投机解码,从而为未来的有效MLLM研究奠定了强大的基础。代码可在https://anonymon.4open.science/r/asd-f571上使用。
在未标记的蛋白质数据集上训练的生成模型表明,没有任何特定于任务的训练数据,可以预测某些生物学功能。但是,此功能并未扩展到所有相关功能,在许多情况下,无监督的模型仍然不足以特定于任务,监督的基线。我们假设这是由于基本的“一致性差距”所致,在该差距中,在无监督培训期间所学的规则不能保证与感兴趣的功能有关。在这里,我们演示了如何为蛋白质生成模型提供有用的特定任务信息,而不会失去训练期间学到的丰富的一般知识。使用称为直接偏好优化(DPO)的优化任务,我们通过鼓励模型希望稳定而不是稳定的变体,从而使结构调节的语言模型对齐,以生成稳定的蛋白质序列。我们所产生的模型ProteIndpo是第一个结构条件的语言模型偏好于实验数据。ProteIndpo实现了竞争性稳定性预测,并始终优于该模型的无监督和填充版本。值得注意的是,对齐模型在其训练数据之外的领域也表现良好,以实现大蛋白的绝对稳定性预测和多链复合物的结合亲和力预测,同时还可以实现多种骨干的单步稳定。这些结果表明,ProteIndpo从其生物物理对齐数据中学习了可推广的信息。
训练补偿动力不匹配的三角洲(残留)动作模型。然后用Delta动作模型集成到模拟器中,以ASAP微调进行预训练的策略,以有效地与现实世界动力学对齐。我们在三种转移方案中尽快评估了ISAACGYM到Isaacsim,Isaacgym到Genesis和Isaacgym,以及真实世界的G1人类人体机器人。我们的方法显着提高了各种动态运动的敏捷性和全身协调,与Sysid,DR和Delta动力学学习基准相比,跟踪误差减少了。尽快实现了以前难以实现的高度敏捷运动,这证明了在桥接模拟和现实世界动力学中的三角洲动作学习的潜力。这些结果表明,可以开发出更具表现力和敏捷的人形生物的有希望的SIM到真实方向。
大型语言模型(LLMS)通过利用其语言理解和文本生成功能来显示机器人应用,尤其是任务计划的重要潜力。然而,在诸如家用机器人技术之类的应用中,这些模型的个性化仍然存在着重要的差距。例如,LLM计划可能会发现执行需要个性化的任务,例如决定基于特定的家庭喜好将杯子放在厨房中的位置。我们介绍了LLM-Persyalize,这是一个新颖的框架,旨在个性化家庭机器人的LLM计划。llm-persyalize使用llm计划在多房间,部分观察的家庭环境中执行迭代计划,并利用从本地观察结果动态构建的场景图。要将LLM计划者个性化对用户偏好,我们的优化管道整合了模仿学习和加强自我训练。我们评估了LLM-个性化家政人员,这是一个具有挑战性的现实世界3D基准,用于家庭重排,表明,成功率比现有的LLM计划者增长了30%以上,这表明与人类偏好相符。
摘要要有效,医疗保健技术应适应特定的使用环境。本文探讨了在结核病和艾滋病毒诊断的全球创新实践中如何表达这种调整,以及如何影响。它研究了保健点(POC)诊断的开发(承诺是为实验室外部或资源约束设置中的用户设计的),以研究开发人员和实施者将诊断技术与POC保持一致。参与诊断发展的全球卫生参与者之间的实地调查,包括制造商,捐助者,行业顾问,国际组织,决策者,监管机构和研究人员,以及印度诊断用户之间的野外工作,包括决策者,非政府组织,计划官员,计划官员,实验室技术人员和护士。本文添加了STS的对齐和用户交互理论,在该理论中,全球健康诊断的开发人员和实施者都与之相处的设置和用户是多种,多样,出现的,并继续转移。本地用户设置的特征包括多个参与和想象的用户设置,以及开发人员的设置,全球中介机构,竞争对手和疾病的设置。因此,对齐方式正在跨多个维度和尺度进行,并且具有重要的时间维度。结果揭示了对齐方式在黑暗中如何在一定程度上发生,其特征是应对的元素不确定性。标准化的要素,政治和稀缺资源会导致对齐的时间和构成良好的诊断的摩擦。
项目团队成员谨向前亚太经合组织 EGEE&C 主席李鹏程先生和中国标准化研究院刘韧先生表示最诚挚的谢意,感谢他们在自费研讨会的筹备和举办过程中提供的宝贵支持。项目成员还感谢现任 EGEE&C 主席、机电工程署 VY Ek-Chin 先生及其团队在中国香港首次活动期间提供的强大本地支持。特别感谢联合效率组织 (U4E) 共同赞助两次研讨会,并与项目参与者分享高质量的信息和工具。还要特别感谢美国电气制造商协会 (Dan Delaney 先生和 Kirk Anderson 先生代表,感谢他们分享有关合格评定国际最佳实践的经验和知识。组织者还高度评价东盟能源中心 (ACE) 参加在中国台北举办的研讨会,这显然是对区域合作的鼓励。还必须特别提到中国台北当地 UL 团队的大力支持,特别是 Ray Sung 先生和 Nick Lee 先生,他们为研讨会和中国台北现场访问期间的内容和后勤安排提供了便利。此外,项目组织者还希望向两次研讨会的所有参与者表示最诚挚的谢意,感谢他们的积极贡献。
满足世界人口不断增长的粮食需求是全球农业政策和经济面临的主要挑战。粮食安全问题需要创新解决方案。现代生物技术对粮食安全、财富和可持续发展具有巨大贡献潜力。基因工程提供了改善营养、提高产量和增强作物抗逆性的工具。基因组编辑的新技术提供了充足的手段来克服传统植物育种固有的局限性,但它们的工业适用性取决于监管环境、决策和公众认知。科学和政策目标的协调有助于实现现代生物技术对粮食安全、财富和可持续发展的贡献潜力。
用大语言模型(LLM)推理和预测人类意见是必不可少的但具有挑战性的。当前的方法采用角色扮演的角色,但面对两个主要措施:LLMS甚至对一个无关的角色也很敏感,最多可以改变预期的30%; LLM无法战略性地推理人类。我们提出了开场链(COO 1),这是一种简单的四步解决方案建模,如何用personae推理,由价值 - 宽容 - 态度(VBN)the-Ory进行推理。COO将明确的人(人口统计学和意识形态)和卑鄙的人物(历史观点)区分了:(1)将无关的属性与显式人物过滤; (2)将隐式人物排名为选择top-k的优先列表; (3)提出新颖的VBN推理,以提取用户的环境和个人价值,信念和规范变量,以进行准确可靠的预测; (4)迭代VBN推理,并逐渐更大的隐式角色列表来处理潜在的角色不足。COO通过仅提示5个推论呼叫来有效地实现新的最新观点预测,从而将先前的技术提高了多达4%。值得注意的是,通过COO的数据进行微调LMS导致观点一致的模型明显高达23%。