微调关键词检索结果

停止为不使用的人工智能付费:微调模型的案例

Stop Paying for AI You Don't Use: The Case for Fine-Tuned Models

通过 GPT 或 Claude 每天处理 10,000 个文档,每年的成本为 5 万美元。微调模型:5K 美元。相同的精度。更快的延迟。数据永远不会脱离您的控制。但大多数团队并没有意识到这现在是可行的。这是前沿模型有意义的时候,也是你付出过高代价的时候。

在 Amazon SageMaker AI 和 Amazon Bedrock 上使用 vLLM 高效地服务数十个微调模型

Efficiently serve dozens of fine-tuned models with vLLM on Amazon SageMaker AI and Amazon Bedrock

在这篇文章中,我们将解释如何在 vLLM 中为专家混合 (MoE) 模型实现多 LoRA 推理,描述我们执行的内核级优化,并向您展示如何从这项工作中受益。我们在这篇文章中使用 GPT-OSS 20B 作为我们的主要示例。

Shield AI 与新科工程联手微调无人机群

Shield AI, ST Engineering join forces on fine-tuning drone swarms

两家公司将利用人工智能来优化无人机与无人机以及无人机与人类的交互。

十大 LLM 评估工具

The Top 10 LLM Evaluation Tools

LLM 评估工具可帮助团队衡量模型在各种任务中的执行情况,包括推理、总结、检索、编码和指令遵循。他们分析性能趋势,检测幻觉,根据实际情况验证输出,并在微调或即时工程期间对改进进行基准测试。如果没有强大的评估框架,组织就会面临部署不可预测或有害人工智能的风险……阅读更多»“十大法学硕士评估工具”一文首先出现在《大数据分析新闻》上。

扩展搜索相关性:利用 LLM 生成的判断提高应用商店排名

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

大型商业搜索系统优化相关性以推动成功的会话,帮助用户找到他们正在寻找的内容。为了最大化相关性,我们利用两个互补的目标:行为相关性(用户倾向于点击或下载的结果)和文本相关性(结果的语义适合查询)。一个持续存在的挑战是相对于丰富的行为相关性标签而言,专家提供的文本相关性标签的稀缺。我们首先通过系统地评估 LLM 配置来解决这个问题,发现一个专门的、经过微调的模型显着......

NASA Artemis II 火箭返回 VAB 进行必要维修

NASA Artemis II Rocket Returns to VAB for Essential Repairs

NASA 的阿耳忒弥斯 II 火箭已返回车辆装配大楼 (VAB),但这一次不是为了发射准备,而是为了维修。将 VAB 视为 NASA 的巨型车库,有史以来最强大的火箭在进入太空之前都会在这里进行微调。工程师们发现了需要解决的问题,然后火箭才能安全地搭载宇航员执行其历史性的绕月任务。虽然挫折永远不会是理想的,但这次回归凸显了 NASA 对安全和精确度的承诺。阿尔忒弥斯二号不仅仅是另一次试飞,它是阿尔忒弥斯计划中的首次载人飞行任务,为人类重返月球表面铺平了道路。每一次修复都让我们离这一大胆的旅程更近了一步。美国宇航局阿耳忒弥斯二号于黄昏返回VAB。美国宇航局阿耳忒弥斯二号火箭返回VAB:月球之路上

建设性电路放大:通过有针对性的子网络更新改进法学硕士的数学推理

Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates

之前对法学硕士内部运作的研究发现了稀疏子网络,通常称为电路,负责执行特定任务。此外,研究表明,通过微调来提高模型性能通常来自于模型中现有电路的强化。总而言之,这些发现表明直接干预此类电路以进行精确的、针对任务的更新的可能性。受这些发现的启发,我们提出了一种称为“结构性电路放大”的新方法,它可以识别关键令牌……

将生成式 AI 与物理相结合,创建可在现实世界中使用的个人物品

Mixing generative AI with physics to create personal items that work in the real world

为了帮助生成式 AI 模型创建耐用、真实的配件和装饰,PhysiOpt 系统运行物理模拟并对其 3D 蓝图进行细微调整。

这一蓝光铁的突破可以使药物生产变得更便宜

This Blue-Light Iron Breakthrough Could Make Drug Production Cheaper

蓝光驱动的铁催化剂刚刚取代了稀有金属,并开启了精准药物合成的里程碑。光催化剂是暴露在光下时引发化学反应的材料。在现代有机化学中,金属基光催化剂特别有价值,因为它们很稳定,并且可以通过调整连接到中心金属原子的配体进行微调。 [...]

一种用于自回归程序合成的小型系统,可实现受控实验

A Small-Scale System for Autoregressive Program Synthesis Enabling Controlled Experimentation

使用经过训练来完成真实程序的小型模型可以进行哪些研究?通常,研究人员通过大型语言模型(LLM)研究程序合成,这会带来一些问题,例如了解分布内或分布外的内容、了解微调效果、理解标记化的效果以及对进行实验的计算和存储提出更高的要求。我们提出了一个名为 Cadmus 的系统,其中包括一个整数虚拟机 (VM)、一个由不同任务的真实程序组成的数据集,以及一个经过 200 美元以下计算训练的自回归变压器模型……

物理学中最节能的反应是什么?

What are the most energy-efficient reactions in physics?

只要太空中的物体之间仍然存在相互作用,包括引力塌缩、核跃迁、恒星灾难以及任何发出任何类型辐射的物体,我们的宇宙就不会处于最低能量、最大熵的平衡状态。然而,在遥远的未来,如果某些假设继续成立,我们最终将实现这一目标。 (图片来源:mozZz / Adob​​e Stock)许多反应都会释放能量,而且通常量很大,但宇宙效率完全是另一个指标。以下是如何最大化你的产出。就使事情发生而言,能量是不可或缺的考虑因素。当我们看到像一个球一样不稳定地平衡在山顶上时,这似乎就是我们所说的微调状态,或不稳定平衡状态。更稳定的位置是球落在山谷底部的某个地方。我们目前所设想的宇宙零点能量实际上可能并不是最低能量状态,

为什么高海拔可以预防糖尿病?科学家解释

Why Does High Altitude Protect Against Diabetes? Scientists Explain

生活在山里可以保护您免受糖尿病 — 这就是为什么高海拔生活总是带着一种神秘感——稀薄的空气、令人惊叹的景色,以及令人惊讶的健康益处。生活在高海拔地区可能会自然降低血糖,因为当氧气水平下降时,红细胞开始吸收多余的葡萄糖。科学家们正在揭示为什么山区居民的糖尿病发病率似乎较低,而答案不仅仅是新鲜空气和风景优美的徒步旅行。事实证明,高海拔地区氧气水平降低可能会引发新陈代谢的独特变化,帮助身体更有效地调节血糖。想象一下,您的系统像天然健身教练一样进行调整,以预防疾病的方式微调能量使用。让我们探讨一下海拔高度如何成为预防糖尿病的天然屏障。高海拔背后的科学及其与降低血糖水平的惊人联系。科学家发现生活在高海拔

斑点灯笼蝇正在入侵美国。他们可能在中国的城市中获得了进化的超能力。

Spotted lanternflies are invading the US. They may have gotten their evolutionary superpowers in China's cities.

斑点灯笼蝇在美国惊人的传播之所以成为可能,是因为城市充当了进化孵化器,对昆虫进行了微调,使它们能够繁衍生息。