SLM关键词检索结果

训练小规模大型语言模型的计算瓶颈

Computational Bottlenecks of Training Small-Scale Large Language Models

这篇论文被 NeurIPS Workshop 2024 的高效自然语言和语音处理 (ENLSP) 研讨会接受。虽然大型语言模型 (LLM) 主导着人工智能领域,但由于消费者对成本和效率的要求,小规模大型语言模型 (SLM) 正受到关注。然而,对 SLM 的训练行为和计算要求的研究有限。在本研究中,我们通过检查各种超参数和配置(包括 GPU 类型、批量大小等)的影响,探索了训练 SLM(最多 2B 个参数)的计算瓶颈…

CAMPHOR:用于设备上多输入规划和高阶推理的协作代理

CAMPHOR: Collaborative Agents for Multi-Input Planning and High-Order Reasoning On Device

虽然服务器端大型语言模型 (LLM) 在工具集成和复杂推理方面表现出色,但直接在设备上部署小型语言模型 (SLM) 带来了改善延迟和隐私的机会,但也带来了准确性和内存方面的独特挑战。我们推出了 CAMPHOR,这是一种创新的设备 SLM 多代理框架,旨在处理多个用户输入并在本地推理个人背景,确保隐私得到维护。 CAMPHOR 采用分层架构,其中高阶推理代理分解复杂任务并协调专家……

航空新闻:每日行情 (07.05.24)

Aero-News: Quote of the Day (07.05.24)

“这些 Block III SLM 喷气式飞机的首次交付是我们持续努力确保超级大黄蜂飞机的能力、可靠性、可用性和可维护性的一个重要里程碑。我们期待与波音公司继续合作,为舰队提供这一关键的作战能力。”来源:F/A-18 和 EA-18G 项目办公室项目经理迈克尔·伯克斯上尉在波音项目成功提前一个月交付首对改进型 Block III 超级大黄蜂时发表评论。

波音公司完成 F/A-18超级大黄蜂提前升级

Boeing Completes F/A-18 Super Hornet Upgrade Ahead of Schedule

– 波音公司从两个地点(圣路易斯和圣安东尼奥)交付首批两架服役寿命修改 (SLM) Block III 战斗机 – 公私合作协议……

Microsoft 的 Phi Silica:最紧凑的型号及其强大的功能

Phi Silica от Microsoft: самая компактная модель и ее огромные возможности

新的 SLM 将把 PC 工作的效率提升到一个新的水平。