A better method for identifying overconfident large language models
这种用于测量不确定性的新指标可以标记幻觉并帮助用户知道是否信任人工智能模型。
Introducing Nova Forge SDK, a seamless way to customize Nova models for enterprise AI
今天,我们推出 Nova Forge SDK,使 LLM 定制变得容易,使团队能够充分利用语言模型的潜力,而无需面对依赖管理、图像选择和配方配置的挑战,并最终降低进入门槛。
Studying the properties of large language models: an interview with Maxime Meyer
在本访谈系列中,我们将与 AAAI/SIGAI 博士联盟的一些参与者会面,以了解有关他们研究的更多信息。我们与马克西姆·迈耶 (Maxime Meyer) 坐下来聊了聊他当前的研究、未来的计划以及他如何找到博士联盟的经历。您能否先自我介绍一下,您在哪里学习以及 [...]
Yann LeCun AMI Labs And The Rise Of AI World Models
为什么重要:Yann LeCun AMI 实验室和人工智能世界模型的兴起探索为自主、代理人工智能系统提供动力的世界模型。
GenCtrl -- A Formal Controllability Toolkit for Generative Models
随着生成模型变得无处不在,迫切需要对生成过程进行细粒度控制。然而,虽然从提示到微调的受控生成方法激增,但一个基本问题仍未得到解答:这些模型首先真的是可控的吗?在这项工作中,我们提供了一个理论框架来正式回答这个问题。将人类模型交互视为一个控制过程,我们提出了一种新颖的算法来估计对话设置中的可控模型集。值得注意的是,我们对估计误差提供正式保证......
Stop Paying for AI You Don't Use: The Case for Fine-Tuned Models
通过 GPT 或 Claude 每天处理 10,000 个文档,每年的成本为 5 万美元。微调模型:5K 美元。相同的精度。更快的延迟。数据永远不会脱离您的控制。但大多数团队并没有意识到这现在是可行的。这是前沿模型有意义的时候,也是你付出过高代价的时候。
🚨🇬🇧🇮🇷 英国海事当局警告称,霍尔木兹海峡和阿曼湾将进行“重要的军事演习”。他们说,由于该地区有所有海军存在,接近陆军模型的误判可能性太大。有关海峡关闭的说法 x.com 供应链接帖子 🚨🇬🇧🇮🇷 英国海事当局警告称,霍尔木兹海峡和阿曼湾将进行“重要的军事演习”。他们说,由于该地区有所有海军存在,接近陆军模型的误判可能性太大。有关海峡被关闭的说法 – x.com 首先出现在《特种部队新闻》上。
How to Define the Modeling Scope of an Internal Credit Risk Model
基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。
Open the Black Box of Faculty Salary Models
打开教师薪资模型的黑匣子 Elizabeth ReddenWed, 02/25/2026 - 03:00 AMA 透明、可预测的教师薪资模型可以围绕机构使命建立信任和一致性。作者 Priya Kohli
Cloud vs. Local vs. Hybrid for AI Models: A Practitioner’s Guide (Sponsored)
对于大多数中小型企业领导者来说,有关人工智能的问题已经发生了转变。过去的问题是“我们应该使用人工智能吗?”,但现在的问题是“我们应该在哪里运行它?”
GAO 的发现《2018 年水资源开发法案》(2022 年修订)(《2022 年法案》)授权美国陆军工程兵团使用其他交易 (OT) 协议开展某些项目,以支持其土木工程计划的研究活动。 OT 协议通常不受与采购合同、合作协议和赠款相同的联邦法律和法规的约束。 OT 协议使各机构具有更大的灵活性,有助于更快地推进新技术的开发和使用,这可以帮助各机构满足任务需求和项目要求。军团的第一个土建工程 OT 协议是针对航道原型模型的设计。组装完成后,该模型将允许对水工结构进行研究,例如测试闸门的操作以及它们如何失效。海军陆战队向 GAO 报告称,截至 2025 年 10 月,设计已完成约 20%。如果海军陆
Run NVIDIA Nemotron 3 Super on Amazon Bedrock
本文探讨了 Nemotron 3 Super 模型的技术特征并讨论了潜在的应用用例。它还提供了技术指导,帮助您开始在 Amazon Bedrock 环境中将此模型用于生成 AI 应用程序。
A Gentle Introduction to Nonlinear Constrained Optimization with Piecewise Linear Approximations
分段线性逼近是使用 Gurobi 等 LP/MIP 求解器处理非线性约束模型的实用方法。这篇文章《使用分段线性逼近的非线性约束优化的温和介绍》首先出现在《走向数据科学》上。
ChatGPT Statistics 2025: Usage, Demographics, Revenue, and Market Share
ChatGPT 用了两年半的时间才从“本月热门话题”发展成为互联网上最受欢迎的服务之一。当它于 2022 年 11 月首次发布时,作为大型语言模型的前端,没有人能预测到到 2025 年中期,它将成为几乎所有职业和几乎每个互联网用户每天都会使用的东西。在本文中,我们将查看最新的 ChatGPT 统计数据以及有关该平台的受众、流量、收入和人口统计的一般数据。我们还将讨论最新的 [...]
Goldilocks RL: Tuning Task Difficulty to Escape Sparse Rewards for Reasoning
强化学习已成为解锁大型语言模型推理能力的强大范例。然而,依赖稀疏的奖励使得这个过程的样本效率非常低,因为模型必须以最少的反馈来导航巨大的搜索空间。虽然经典课程学习的目的是通过根据复杂性对数据进行排序来缓解这种情况,但特定模型的正确排序通常是不清楚的。为了解决这个问题,我们提出了 Goldilocks,这是一种新颖的教师驱动的数据采样策略,旨在预测学生模型的每个问题的难度。教师模型...
The Pentagon is planning for AI companies to train on classified data, defense official says
据《麻省理工科技评论》获悉,五角大楼正在讨论为生成型人工智能公司建立安全环境的计划,以根据机密数据训练其模型的军事专用版本。像 Anthropic 的 Claude 这样的人工智能模型已经被用来回答机密环境中的问题;应用包括分析伊朗的目标。但允许模型训练......
OpenAI's GPT-5.4 mini and nano launch - with near flagship performance at much lower cost
最新的 GPT-5.4 迷你模型提供的基准测试结果与完整的 GPT-5.4 模型惊人地接近,同时运行速度更快,这标志着向为实际应用程序提供支持的更小型 AI 模型的转变。
mAceReason-Math: A Dataset of High-Quality Multilingual Math Problems Ready For RLVR
带可验证奖励的强化学习 (RLVR) 已成功应用于显着提升预训练大型语言模型的能力,特别是在数学和逻辑问题领域。然而,当前的研究和可用的训练数据集仍然以英语为中心。虽然过去已经创建了多语言训练数据和基准,但它们在创建时并未考虑到 RLVR 和当前模型的功能,而且它们的难度通常太低,无法为当前模型提供适当的训练信号。为了解决这一差距,我们提供了 mAceReason-Math,...