深入关键词检索结果

数据质量错觉:重新思考 LLM 预训练中基于分类器的质量过滤

The Data-Quality Illusion: Rethinking Classifier-Based Quality Filtering for LLM Pretraining

大型模型是在包含混合质量文档的大量网络爬行数据集上进行预训练的,因此数据过滤至关重要。一种流行的方法是基于分类器的质量过滤 (CQF),它训练二元分类器来区分预训练数据和小型高质量数据集。它为每个预训练文档分配一个定义为分类器分数的质量分数,并仅保留得分最高的分数。我们对 CQF 进行了深入分析。我们表明,虽然 CQF 提高了下游任务性能,但它不一定能增强高质量的语言建模......

2026 年值得关注的十大冲突 |查塔姆研究所活动

Ten Conflicts to Watch in 2026 | Chatham House Event

在这次现场活动中,危机组织总裁兼首席执行官 Comfort Ero 博士和查塔姆研究所国际安全项目主任 Marion Messmer 博士深入探讨了我们的年度旗舰出版物“2026 年值得关注的 10 个冲突”。

美国诉杰罗姆·鲍威尔

The United States v. Jerome Powell

在本期《权力与市场》节目中,瑞安、康纳和托讨论了报道中针对美联储主席杰罗姆·鲍威尔的调查。这是对渎职行为的实际责任,还是DC自我意识的小规模斗争?归根结底,差异重要吗?鲍威尔是否应该因世界各国央行与他站在一起而感到鼓舞?该小组深入探讨了这些问题以及更多问题。

现实世界中的生成式人工智能:Aurimas Griciūnas 谈人工智能团队和可靠的人工智能系统

Generative AI in the Real World: Aurimas Griciūnas on AI Teams and Reliable AI Systems

SwirlAI 创始人 Aurimas Griciūnas 帮助技术专业人士过渡到人工智能角色,并与组织合作制定人工智能战略和开发人工智能系统。 Aurimas 与 Ben 一起讨论了他在过去几年中看到的随着生成式人工智能的兴起而发生的变化,以及我们代理的发展方向。 Aurimas 和 Ben 深入研究一些 [...]

没有 Nvidia,没问题:一家中国人工智能公司如何悄然实现硬件权力转移

No Nvidia, No Problem: How a Chinese AI Firm Quietly Pulled Off a Hardware Power Move

中国的人工智能领域刚刚发生了一些有趣的事情,它并没有伴随着烟火或令人振奋的新闻发布会。相反,它几乎是偶然到达的——这在某种程度上让它更令人印象深刻。中国知名人工智能公司智浦AI表示,它已经完全在华为国产芯片上训练了尖端的图像生成模型。没有 Nvidia GPU。没有西方硬件安全网。只需本地芯片即可完成繁重的工作。仅这一点就让人们停止滚动并问:等等,这是怎么发生的?您可以通过本周早些时候在 InfoWorld 上发布的报告来深入了解技术细节。该模型称为 GLM-Image,[...]

我使用 Microsoft 的免费 Windows 11 电池健康工具来诊断我的电脑 - 并获得了有用的结果

I used Microsoft's free Windows 11 battery health tool to diagnose my PC - and got helpful results

Windows 11 有一个内置报告,可让您深入了解笔记本电脑的电池状态,包括是否确实需要更换。

新经济学播客阅读列表

The New Economics Podcast reading list

深入探讨我们在最新播客系列中讨论的一些问题