PewDiePie har byggt sitt eget AI-system ChatOS
PewDiePie 在本地多 GPU 机架上构建了一个名为 ChatOS 的自托管 AI 系统,无需云服务即可运行大型开放模型。这是瑞典人 Felix Kjellberg (PewDiePie) 设计的一个很酷且令人印象深刻的人工智能项目或迷你实验室。 ChatOS 是一个定制的 Web 界面,PewDiePie 在本地托管开放的 LLM,以实现隐私、控制和低延迟,而不是 […]PewDiePie 构建了自己的 AI 系统 ChatOS 的帖子首次出现在 AI 新闻中。
“Systems thinking helps me put the big picture front and center”
郭帅谈深度研究代理、分析型人工智能与基于 LLM 的代理以及系统思维“系统思维帮助我将大局置于中心位置”首先出现在《走向数据科学》上。
推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......
IBMs släpper öppen källkod Granite 4.0 Nano – kompakt LLM för laptop och mobil
令人惊讶的是,IBM 向更易于使用的 AI 迈出了大胆的一步,发布了开源 Granite 4.0 Nano,这是一个由四种紧凑语言模型组成的系列,实际上可以在笔记本电脑或手机上运行。 Granite 4.0 模型:这些模型足够小,可以直接在浏览器中运行,而无需 […]IBM 发布开源 Granite 4.0 Nano – 适用于笔记本电脑和移动设备的紧凑型 LLM 的帖子首次出现在 AI 新闻中。
实体链接 (EL) 传统上依赖于大型注释数据集和广泛的模型微调。虽然最近的小样本方法通过提示来利用大型语言模型 (LLM) 来减少训练要求,但由于昂贵的基于 LLM 的推理,它们常常效率低下。 ARTER(自适应路由和目标实体推理)提出了一种结构化管道,通过策略性地结合候选生成、基于上下文的评分、自适应路由和选择性推理,无需深度微调即可实现高性能。 ARTER 计算一小组...
Breaking Down Video LLM Benchmarks: Knowledge, Spatial Perception, or True Temporal Understanding?
本文在 NeurIPS 2025 的 Evaluating the Evolving LLM Lifecycle Workshop 上被接受。现有的视频理解基准通常将基于知识的问题和纯粹基于图像的问题混为一谈,而不是明确隔离模型的时间推理能力,而这是区分视频理解与其他模态的关键方面。我们发现了两个主要限制,这些限制掩盖了较高的分数是否真正表明对视频中的动态内容有更强的理解:(1)强大的语言先验,模型可以在不观看视频的情况下回答问题;和(2)...
ODKE+: Ontology-Guided Open-Domain Knowledge Extraction with LLMs
知识图 (KG) 是许多人工智能应用的基础,但保持其新鲜度和完整性仍然成本高昂。我们推出 ODKE+,这是一个生产级系统,可以自动从网络资源中高精度地提取和摄取数百万个开放域事实。 ODKE+ 将模块化组件组合成可扩展的管道:(1) 提取启动器检测丢失或过时的事实,(2) 证据检索器收集支持文档,(3) 混合知识提取器对大型语言模型 (LLM) 应用基于模式的规则和本体引导提示,(4) ...
Bias after Prompting: Persistent Discrimination in Large Language Models
从偏见转移假设 (BTH) 的先前工作中可以得出的一个危险假设是,偏见不会从预先训练的大型语言模型 (LLM) 转移到适应模型。我们通过研究提示适应下因果模型中的 BTH 来验证这一假设,因为提示是现实世界应用中非常流行且易于使用的适应策略。与之前的工作相比,我们发现偏见可以通过提示转移,而流行的基于提示的缓解方法并不能始终阻止偏见的转移。具体来说,相关性......
米連邦地裁、Googleへの是正措置を公表~一般検索サービス市場における独占排除
■摘要 2025 年 9 月 2 日,美国哥伦比亚特区地方法院就 Google 通用搜索服务中的反竞争行为发布了一项命令。本判决(以下简称判决)是应原告(美国和各州)在判决(责任审判)认定 Google 的行为具有反竞争行为后寻求补救(补救措施)的请求而发布的。该判决否定了采取出售部分业务等结构性补救措施,也不批准出售Chrome和Android。这是因为原告无法证明反竞争行为与结构性补救措施之间存在“实质性因果关系”,也因为原告无法证明“不太严重的补救措施”是不够的。另一方面,除了单纯的禁令之外,法院还要求向竞争对手提供信息。首先,它暂停了谷歌与合同制造商之间的合同,这些合同使谷歌搜索成为默
Agentic AI in Finance: Opportunities and Challenges for Indonesia
人工智能的兴起几乎触及每个行业,包括金融业。事实上,金融行业长期以来一直采用我们现在所说的“传统机器学习”,将其用于预测建模、信用评分和风险分析。但随着当前围绕大型语言模型 (LLM) 和 Agentic AI 的炒作,我开始 […]金融领域的 Agentic AI:印度尼西亚的机遇和挑战首先出现在《走向数据科学》上。
ODW Logistics expects to improve pick rates by 42 percent with Zebra Technologies
仓库自动化技术提供商 Zebra Technologies 表示,ODW Logistics 已采用 Zebra Symmetry Fulfillment 来优化其电子商务运营。通过此实施,ODW Logistics 预计拣选率将提高 42%,从而增强其扩展能力,同时保持成本效率。 ODW Logistics 选择 Zebra Symmetry Fulfillment 来提高效率和灵活性 [...]
‘Sycophantic’ LLMs like GPT fail to challenge illogical medical queries
大型语言模型 (LLM) 旨在提供帮助,但不能以牺牲诚实为代价。他们生成的信息必须事实准确、逻辑合理并与既定知识相符。这在医学等高风险领域尤其重要,因此可能不具备临床知识的患者在他们的[...]
10 月 1 日至 3 日,一年一度的信息安全论坛 GIS Days 举行。该论坛由网络安全领域最大的集成商之一 Gazinformservice 主办。会上,专家、监管机构、企业、集成商和开发人员共同探讨了信息安全的现状和未来。 UCSB专家做了演讲:“用于监控确保CII和ISPD安全领域联邦立法要求合规性的工具”:如何自动化和简化CII领域法律法规合规性的内部审计——CheckU产品经理Gleb Dvornikov; “使用LLM代理自动生成静态分析规则”:LLM上的多代理系统如何影响响应的速度和质量——高级应用安全平台专家Viktor Timashkov; “渗透测试不是作秀:如何从
Google ersätter Google assistant med Gemini for Home
谷歌现在正在迈入智能家居的新时代,用 Gemini for Home 取代 Google Assistant,Gemini for Home 是一款基于人工智能的语音助手,承诺让您与家庭的互动更加自然和智能。只有一个潜在的障碍或问号,因为它是一款基于 LLM 的设备,因此它可以简单地 [...] 谷歌用 Gemini 取代 Google Assistant 首次出现在 Ai News 上。
A vampire novel that smells of garlic? Well, if it gets people reading … | Carys Afoko
Jennifer L Armentrout 的新“浪漫小说”特别版将在任何书架上脱颖而出,即使您闭着眼睛也是如此。我拒绝对此嗤之以鼻你想要一本大蒜味的书吗?不这么认为。但这并没有阻止作家 Jennifer L Armentrout 使用注入大蒜的墨水打印 1,000 份她的新小说《血与骨的原始》。看起来很奇怪吗?如果我解释一下这本书是以 Vampry(吸血鬼)和 Craven(某种僵尸吸血鬼)为主角的“浪漫幻想”系列的最新部分,那么情况可能就不那么严重了。即便如此,大蒜生意还是不太靠谱。在阿门特劳特的六本书传奇故事中(不包括四本书前传),实际上没有提到大蒜可以驱除吸血鬼。只有当你打开 TikT
Electromate Adds Kollmorgen Essentials™ Servo Motion System to Its Product Lineup
Kollmorgen Essentials 系列将伺服电机、驱动器和单电缆连接整合到专为工业自动化、包装、物料搬运和仓库系统设计的优化套件中。通过预先配置关键轴配置和标准化接口,Essentials 解决方案有助于缩短开发时间、简化采购并缩短部署时间。
Thinking About Thinking in the Age of AI
算法捕获的必然性人工智能,尤其是大型语言模型 (LLM) 的兴起,很可能是人类长期操纵和利用的顶峰。对我来说,即将到来的人工智能危机主要不在于人工智能和机器人抢走工作(我确实担心这一点);这是关于被用来颠覆我们自主权的算法。这里的危险在于法学硕士的算法语言流畅性——一种完美的、个性化的能力,用于实现基本上看不见的心理影响,使我们越来越被动地参与外部编程引导的生活。我的观点是,我们对这种危险的最终防御是培养元认知,即思考思考。这种能力不是与生俱来的,而是与生俱来的。在复杂的世界中管理我们古老的冲动一直需要刻意的智力掌握。这要求我们面对一个令人不安的事实,即我们的思想本质上并不是理性的机器。它们是
Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks
大型语言模型 (LLM) 在现代自然语言处理中无处不在。然而,之前的研究表明,代表性不足的英语方言的法学硕士成绩有所下降。我们分析了将“标准”美式英语问题典型化为非“标准”方言变体对多项选择题回答任务的影响,发现准确率降低了 20%。此外,我们还调查了非“标准”英语问题中表现不佳的语法基础。我们发现各个语法规则对性能有不同的影响,但有些更……