尽管开源大型语言模型(LLM)(例如 LLaMA)取得了进步,但它们在工具使用能力方面仍然受到很大限制,即使用外部工具(API)来执行人类指令。原因是当前的指令调整主要侧重于基本语言任务,但忽略了工具使用领域。这与最先进(SOTA)闭源 LLM(例如 ChatGPT)的出色工具使用能力形成鲜明对比。为了弥补这一差距,我们引入了 ToolLLM,这是一个通用的工具使用框架,涵盖数据构建、模型训练和评估。我们首先介绍 ToolBench,这是一个用于工具使用的指令调整数据集,它是使用 ChatGPT 自动构建的。具体而言,构建可分为三个阶段:(i)API 收集:我们从 RapidAPI Hub 收集了 49 个类别的 16,464 个真实 RESTful API; (ii) 指令生成:我们提示 ChatGPT 生成涉及这些 API 的各种指令,涵盖单工具和多工具场景;(iii) 解决方案路径注释:我们使用 ChatGPT 为每条指令搜索有效的解决方案路径(API 调用链)。为了增强 LLM 的推理能力,我们开发了一种新颖的基于深度优先搜索的决策树算法。它使 LLM 能够评估多个推理轨迹并扩大搜索空间。此外,为了评估 LLM 的工具使用能力,我们开发了一个自动评估器:ToolEval。基于 ToolBench,我们对 LLaMA 进行微调以获得 LLM ToolLLaMA,并为其配备神经 API 检索器,为每条指令推荐合适的 API。实验表明,ToolLLaMA 表现出执行复杂指令和推广到未见过的 API 的卓越能力,并且表现出与 ChatGPT 相当的性能。我们的 ToolLLaMA 还在分布外工具使用数据集 APIBench 中展示了强大的零样本泛化能力。代码、训练模型和演示均可在 https://github.com/OpenBMB/ToolBench 上公开获取。
报告个人环境暴露数据已变得越来越普遍;然而,很少有工具可以评估报告是否会提高环境健康素养 (EHL)。我们在本研究中的目标是确定在收到个人空气监测结果后,社会人口或环境特征是否与 EHL 的定量和定性变化有关。这项研究是在纽约市的一个妊娠队列中进行的,在妊娠晚期对多环芳烃 (PAH) 进行了个人化学暴露监测。参与者 (n=168) 在监测 2-5 年后收到了他们的结果,随后一组参与者 (n = 47) 完成了一项调查,询问他们在收到结果后的想法和行动。根据调查回复,我们创建了一个 EHL 的定量量表,分数越高,EHL 就越高。我们发现,拥有大学学历的母亲比高中以下学历的母亲更容易对结果感到惊讶(OR = 5.60,p = 0.05),并且较高的萘水平与对收到结果感到惊讶的几率降低相关(OR = 0.37,p = 0.02)。没有观察到人口统计学或暴露特征与我们的二分 EHL 指标之间的关联;然而,受教育程度更高和收入更高的人往往有更高的 EHL 分数。此外,报告对收到结果感到惊讶或高兴的参与者的 EHL 分数更高。开放式文本回答表明,虽然一些参与者在收到结果后感到担忧,但语义分析表明他们有积极的感觉。我们发现,即使可能已经过去了几年,人们仍然很高兴收到报告。
我们的 FSO 通信项目由 CACI 的多学科光学和光子解决方案团队负责,该团队由物理学家和材料科学家以及光学、电气和机械工程师组成,他们在加利福尼亚、新泽西和佛罗里达的设施工作。该团队致力于为我们的客户构建最先进的弹性、可靠且低风险的光子解决方案 - 包括光调制解调器、光终端和用于通信的高功率源。该团队还研究和开发用于遥感应用的高功率光源和用于太空探索的光学系统。
如需了解更多信息,请联系特别重点项目经理 Lacy Harris(lacey.d.harris2.mil@health.mil)或积极就业项目经理 George D. Romero(802FSS.AEPM.SpecialObservance@us.af.mil),或致电 210-466-8966。
3. 士兵和文职雇员的表现不佳或行为不当应作为潜在药物滥用问题的早期识别。及早转诊有酒精或其他药物滥用问题的个人是康复的关键。根据事件或指挥问题确定的士兵必须在记录事件发生后 5 天内尽快转诊。如果士兵对自己的个人行为有顾虑并且没有发生过取消资格的药物滥用相关事件,他们可以自行转诊。文职雇员可以由主管转诊,也可以尽快自行转诊给员工援助专业人员 (EAP)。家庭成员和退役军人也可以通过 EAP 寻求药物滥用、工作相关问题或个人问题服务。韦恩赖特堡社区可用的其他预防/康复工具包括:
F540 非常适合静态和动态应用,这些应用需要大量详细的点云来定位和识别室内和室外物体的存在与否:• 视野范围:110° ×90° • 每秒高达 1080 万个点 • 精确的物体检测 • 精细的角度分辨率低至 0.14° • 可编程的视野和分辨率,以优化数据速率和机器学习。• 3D 传感器可带或不带 RGB 摄像头使用
*BAAS是独特的零售金融产品。每公里的电池租金适用于各自财务合作伙伴提供的不同优惠。车辆应在各自金融家的假设下。所有适用税,附加费和其他费用(如果有),购买,购买,注册等。应由客户承担。电池租赁应不包括客户在为车辆充电时承担的费用。财务根据信用政策和各自的财政规范全权酌情决定。有关更多详细信息,请与各自的融资者/网站联系。如果由于客户的过错而导致电池损坏,则客户应承担电池费用。仅适用于私人注册车。条款和条件可能会根据适用的法律和政策改变。#回购计划的价格变化了车辆的年龄和运行。出于任何疑问或澄清,请与您最近的MG经销商联系以了解适用的条款和条件。**首先注册所有者。仅适用于私人注册。如果拥有所有权变更,则HV电池的保修将为8年或1,60,000公里,这是从有史以来第一个车辆交付日期开始的。请参阅所有者手册以获取更多详细信息。轮胎的12V电池保修覆盖范围有效期为1年,而信息娱乐系统的有效期为3年。T&C申请。T&C申请。
a) DOD 5000.02,国防采购系统操作,2008 年 12 月 8 日 b) 挣值管理实施指南 (EVMIG),2006 年 10 月 c) NAVSEAINST 7000.4G,挣值管理,2005 年 1 月 31 日 d) ANSI/EIA-748,挣值管理系统 e) DCMA EVMS 标准监视操作手册,2008 年 1 月 f) OUSD (AT&L) 备忘录,2007 年 7 月 3 日,国防部挣值管理 (EVM) 的使用 g) DFARS 252.234-7002,挣值管理系统 h) DFARS 252.234-7001,挣值管理系统通知 i) OUSD (AT&L) 备忘录,2007 年 4 月 23 日,DCMA EVM 角色和职责 j) SECNAVINST 5223.2,海军成本分析部,2008 年 12 月 16 日 k) SUPSHIP 操作手册 (SOM) 第 2 版,2008 年 10 月 27 日