Salesforce 凭借小巧但强大的 xLAM-1B 和 7B 模型挑战 AI 趋势

企业软件公司 Salesforce 推出了两个紧凑型 AI 模型,挑战了 AI 中的“越大越好”范式。尽管体积小巧,但 10 亿和 70 亿参数的 xLAM 模型在函数调用任务中的表现优于许多更大的模型。这些任务涉及 AI 系统将自然语言请求解释和翻译成特定的函数调用或 API 请求。例如,如果您要求 AI 系统“查找下周末飞往纽约的 500 美元以下航班”,则模型需要理解此请求,识别相关函数(例如 search_flights、filter_by_price),并使用正确的参数执行它们。“我们展示了 Salesforce 用小巧但强大的 xLAM-1B 和 7B 模型挑战 AI 趋势的帖子首先出现在 DailyAI 上。

来源:DailyAI | 探索人工智能的世界

企业软件公司 Salesforce 推出了两种紧凑型 AI 模型,挑战了 AI 中“越大越好”的范式。

企业软件公司 Salesforce 推出了两种紧凑型 AI 模型,挑战了 AI 中“越大越好”的范式。

尽管体积小巧,但 10 亿和 70 亿参数的 xLAM 模型在函数调用任务中的表现优于许多较大的模型。

这些任务涉及 AI 系统将自然语言请求解释和翻译成特定的函数调用或 API 请求。

这些任务涉及 AI 系统将自然语言请求解释和翻译成特定的函数调用或 API 请求。

例如,如果您要求 AI 系统“找到下周末飞往纽约的 500 美元以下的航班”,该模型需要理解此请求,识别相关功能(例如 search_flights、filter_by_price),并使用正确的参数执行它们。

例如,如果您要求 AI 系统“找到下周末飞往纽约的 500 美元以下航班”,则模型需要理解此请求,识别相关功能(例如 search_flights、filter_by_price),并使用正确的参数执行它们。

研究人员在论文中写道:“我们证明,使用我们精选的数据集训练的模型,即使只有 7B 个参数,也可以在伯克利函数调用基准测试中实现最先进的性能,超越多个 GPT-4 模型。”

研究人员在论文中写道:“我们证明,使用我们精选的数据集训练的模型,即使只有 7B 个参数,也可以在伯克利函数调用基准测试中实现最先进的性能,超越多个 GPT-4 模型。”

“此外,我们的 1B 模型实现了卓越的性能,超越了 GPT-3.5-Turbo 和 Claude-3 Haiku。”

“此外,我们的 1B 模型实现了卓越的性能,超越了 GPT-3.5-Turbo 和 Claude-3 Haiku。” Berkeley 函数调用基准 Berkeley 函数调用基准

研究中的关键统计数据包括:

GPT-3