模型关键词检索结果

搜索增强大型语言模型中的过度搜索

Over-Searching in Search-Augmented Large Language Models

搜索增强型大语言模型(LLM)通过集成外部检索,擅长知识密集型任务。然而,它们经常过度搜索——不必要地调用搜索工具,即使它不能提高响应质量,这会导致计算效率低下,并因合并不相关的上下文而产生幻觉。在这项工作中,我们对跨多个维度的过度搜索进行了系统评估,包括查询类型、模型类别、检索条件和多轮对话。我们的发现表明:(i) 搜索通常可以提高……的答案准确性

Omada Health 如何通过在 Amazon SageMaker AI 上微调 Llama 模型来扩大患者护理规模

How Omada Health scaled patient care by fine-tuning Llama models on Amazon SageMaker AI

本文由 Omada Health 的 AI/ML 产品经理 Sunaina Kavi 共同撰写。 Omada Health 是虚拟医疗服务领域的长期创新者,于 2025 年推出了新的营养体验,其特色是 OmadaSpark,这是一款接受过强大临床输入训练的人工智能代理,可提供实时动机访谈和营养教育。它是在 AWS 上构建的。 OmadaSpark 的设计 [...]

对哪个模型进行哪个评估?语音模型评估的分类法

Which Evaluation for Which Model? A Taxonomy for Speech Model Assessment

语音基础模型最近在广泛的任务中取得了非凡的能力。然而,他们的评估在任务和模型类型之间仍然脱节。不同的模型擅长语音处理的不同方面,因此需要不同的评估协议。本文提出了一个统一的分类法来解决以下问题:哪种评估适合哪种模型?该分类法定义了三个正交轴:正在测量的评估方面、尝试任务所需的模型能力以及执行任务或协议要求......

MANZANO:具有混合视觉分词器的简单且可扩展的统一多模态模型

MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer

能够理解和生成视觉内容的统一多模式大语言模型 (LLM) 拥有巨大的潜力。然而,现有的开源模型通常会受到这些功能之间性能权衡的影响。我们提出了 Manzano,一个简单且可扩展的统一框架,通过将混合图像标记器与精心策划的训练方案相结合,大大减少了这种紧张。单个共享视觉编码器为两个轻量级适配器提供数据,这些适配器在公共…内生成用于图像到文本理解的连续嵌入和用于文本到图像生成的离散标记。

天空去中心化:解决印度航空混乱的快速区域模型

Decentralize the Skies: A Swift Regional Model to Fix India’s Aviation Mess

美国并不是唯一一个因国家管制而导致空中交通管制系统瘫痪的国家。印度的体制也陷入了集权主义的混乱之中。解决方案是让政府退出 ATC 业务。

联邦学习,第 1 部分:数据所在的训练模型的基础知识

Federated Learning, Part 1: The Basics of Training Models Where the Data Lives

了解联邦学习的基础联邦学习后,第 1 部分:数据所在的训练模型的基础知识首先出现在《走向数据科学》上。

超越平板:在 Power BI 中构建企业级财务模型

Beyond the Flat Table: Building an Enterprise-Grade Financial Model in Power BI

逐步完成数据转换、星型模式建模和 DAX 方差分析,并从中汲取经验教训。文章《超越平面表:在 Power BI 中构建企业级财务模型》首先出现在《走向数据科学》上。

海军模型在 5 个月的 DOT Chain Defense 中获得了 225,000 枚弹药 - Shmyhal - Interfax-Ukraine

Navy models obtain 225,000 munitions in 5 months of DOT Chain Defence – Shmyhal – Interfax-Ukraine

海军模型在 5 个月的 DOT 链式防御 - Shmyhal Interfax-Ukraine 供应中获得 225,000 件弹药 供应链接海军模型在 5 个月的 DOT 链式防御 - Shmyhal - Interfax-Ukraine 中获得 225,000 件弹药首先出现在《特种部队新闻》上。

直接教学动机,第 4 部分:动机模型

Direct Instruction Motivation, Part 4: Motivational Models

我最近开始了这个关于动机和直接/显式指导的系列。到目前为止,它已经研究了关键的交付和设计考虑因素,例如快节奏、赞扬和获得高成功率。这些对于个别教师来说是有用的目标,但就其本身而言,他们错过了最好的学校在激励整个群体方面所做的事情……继续阅读直接教学动机,第 4 部分:激励模型

更准确测量天然气温室气体排放的新模型

New model that more accurately measures greenhouse gas emissions from natural gas

地表气温趋势、气候模型与观测,1979-2025

Surface Air Temperature Trends, Climate Models vs Observations, 1979-2025

这只是关于全球地表气温 (Tsfc) 趋势如何跟踪 34 个 CMIP6 气候模型到 2025 年的简短更新。下图显示了 1979-2025 年的 Tsfc 趋势,按从最热到最冷的顺序排列。

Curtiss XP-71 风洞模型和枪照片

Curtiss XP-71 Wind Tunnel Model and Gun Photos

Curtiss XP-71 风洞模型和枪照片的副本。柯蒂斯 XP-71 是柯蒂斯莱特公司 1941 年为美国设计的一款超大型重型战斗机。它的目的是充当远程拦截机和护航战斗机​​。虽然设计阶段取得了重大进展,但从未制造出任何原型,该设计于 1943 年被放弃。在此处或此处或此处下载 (111.6 Megs)

黑鹰直升机、奇努克直升机:特朗普考虑额外任务之际,美国军用飞机、精英模型降落在英国 - 金融场合

Black hawk helicopters, Chinook: US army plane, elite models land in UK as Trump mulls extra missions – The Financial Occasions

黑鹰直升机、奇努克:特朗普考虑额外任务时,美国军用飞机、精英模型降落在英国 财经场合供应超链接 特朗普考虑额外任务时,黑鹰直升机、奇努克:美国军用飞机、精英模型降落在英国 – 财经场合首先出现在特种部队新闻上。

人工智能模型似乎在如何编码现实方面趋同

AI Models Seem to Converge on How They Encode Reality

Ben Brubaker,Quanta 读一个关于狗的故事,下次当你看到一只狗在公园里跳跃时,你可能会记住它。这是可能的,因为你有一个统一的“狗”概念......

NarrativeTrack:评估框架之外的视频语言模型

NarrativeTrack: Evaluating Video Language Models Beyond the Frame

多模态大语言模型 (MLLM) 在视觉语言推理方面取得了令人瞩目的进展,但它们理解视频中暂时展开的叙述的能力仍未得到充分探索。真正的叙事理解需要以谁在做什么、何时何地为基础,在动态视觉和时间上下文中保持连贯的实体表示。我们引入了 NarrativeTrack,这是第一个通过细粒度的以实体为中心的推理来评估 MLLM 中叙事理解的基准。与仅限于短剪辑或粗略场景级语义的现有基准不同......

根据设计师反馈改进用户界面生成模型

Improving User Interface Generation Models from Designer Feedback

尽管接受过大量数据的培训,大多数法学硕士仍无法可靠地生成设计良好的 UI。设计师的反馈对于提高 UI 生成的性能至关重要;然而,我们发现现有的基于评级或排名的 RLHF 方法与设计师的工作流程并不一致,并且忽略了用于批评和改进 UI 设计的丰富原理。在本文中,我们研究了设计师使用评论、草图和直接操作等熟悉的交互方式向 UI 生成模型提供反馈的几种方法。我们首先对 21 进行了一项研究...

Yollo AI 聊天机器人功能和定价模型

Yollo AI Chatbot Features and Pricing Model

Yolo AI 为那些重视对话自由和及时响应而不是大量脚本化交互的用户提供了一种选择。对于那些对激烈对话感兴趣的人来说,这种定位可能很符合他们的期望。工作原理 当您打开屏幕时,对话就已经确定。聊天区域显示角色的照片,以及角色的名字和简短的引导消息,让您知道您正在与谁交谈以及正在发生什么。要发起对话,用户只需前往屏幕底部的消息框即可。简单地说 [...]

实施基于技能的学习策略的 5 阶段模型

A 5-stage model for implementing a skills-based learning strategy

认识我的人都知道我是基于技能的学习策略的倡导者。然而,我发现我的一些同事在 L&D 或更广泛的人才管理领域工作……继续阅读实施基于技能的学习策略的 5 阶段模型