IBMs släpper öppen källkod Granite 4.0 Nano – kompakt LLM för laptop och mobil
令人惊讶的是,IBM 向更易于使用的 AI 迈出了大胆的一步,发布了开源 Granite 4.0 Nano,这是一个由四种紧凑语言模型组成的系列,实际上可以在笔记本电脑或手机上运行。 Granite 4.0 模型:这些模型足够小,可以直接在浏览器中运行,而无需 […]IBM 发布开源 Granite 4.0 Nano – 适用于笔记本电脑和移动设备的紧凑型 LLM 的帖子首次出现在 AI 新闻中。
Water Cooler Small Talk, Ep. 9: What “Thinking” and “Reasoning” Really Mean in AI and LLMs
理解人工智能如何模拟“理性”,以及为什么它不是人类在思考时所做的事情The post Water Cooler Small Talk,Ep. 9:人工智能和法学硕士中“思考”和“推理”的真正含义首先出现在《走向数据科学》上。
Breaking Down Video LLM Benchmarks: Knowledge, Spatial Perception, or True Temporal Understanding?
本文在 NeurIPS 2025 的 Evaluating the Evolving LLM Lifecycle Workshop 上被接受。现有的视频理解基准通常将基于知识的问题和纯粹基于图像的问题混为一谈,而不是明确隔离模型的时间推理能力,而这是区分视频理解与其他模态的关键方面。我们发现了两个主要限制,这些限制掩盖了较高的分数是否真正表明对视频中的动态内容有更强的理解:(1)强大的语言先验,模型可以在不观看视频的情况下回答问题;和(2)...
ODKE+: Ontology-Guided Open-Domain Knowledge Extraction with LLMs
知识图 (KG) 是许多人工智能应用的基础,但保持其新鲜度和完整性仍然成本高昂。我们推出 ODKE+,这是一个生产级系统,可以自动从网络资源中高精度地提取和摄取数百万个开放域事实。 ODKE+ 将模块化组件组合成可扩展的管道:(1) 提取启动器检测丢失或过时的事实,(2) 证据检索器收集支持文档,(3) 混合知识提取器对大型语言模型 (LLM) 应用基于模式的规则和本体引导提示,(4) ...
Choosing the Best Model Size and Dataset Size under a Fixed Budget for LLMs
使用 Tiny Transformers 进行小规模探索《为法学硕士选择固定预算下的最佳模型大小和数据集大小》一文首先出现在《走向数据科学》上。
Are We Stochastic Parrots, Too? What LLMs Teach Us About Intelligence And Understanding
现在已经与 ChatGPT 5 互动了几个月,无论是针对工作相关问题还是私人/自学任务,我觉得我可以在这里分享一些关于这些大型模型可以告诉我们自己的思维过程的想法。上面的句子基本上泄露了我的底线,但我想我可以对这个概念进行更多的阐述。法学硕士在短短三四年内就彻底改变了广泛的信息处理任务。回顾过去,我能记得的唯一类似的突破是 20 世纪 90 年代初互联网搜索引擎的出现。但这一突破令人兴奋且令人敬畏,它更激发我思考这如何可能。让我来解压这个。阅读更多内容
How to Use Frontier Vision LLMs: Qwen3-VL
了解如何将 VLM 应用于高级文档理解任务《如何使用 Frontier Vision LLM:Qwen3-VL》一文首先出现在 Towards Data Science 上。
Beyond vibes: How to properly select the right LLM for the right task
在这篇文章中,我们讨论了一种方法,可以指导您建立全面的、以经验为驱动的评估,帮助您在为您的任务选择正确的模型时做出更好的决策。
‘Sycophantic’ LLMs like GPT fail to challenge illogical medical queries
大型语言模型 (LLM) 旨在提供帮助,但不能以牺牲诚实为代价。他们生成的信息必须事实准确、逻辑合理并与既定知识相符。这在医学等高风险领域尤其重要,因此可能不具备临床知识的患者在他们的[...]
Prompt Engineering Templates That Work: 7 Copy-Paste Recipes for LLMs
这7个提示模板将使LLM成为您最有用的助手。
Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks
大型语言模型 (LLM) 在现代自然语言处理中无处不在。然而,之前的研究表明,代表性不足的英语方言的法学硕士成绩有所下降。我们分析了将“标准”美式英语问题典型化为非“标准”方言变体对多项选择题回答任务的影响,发现准确率降低了 20%。此外,我们还调查了非“标准”英语问题中表现不佳的语法基础。我们发现各个语法规则对性能有不同的影响,但有些更……
随着人工智能和自动化重新定义商业格局,各公司正在努力解决如何有效地整合这些技术,同时平衡创新、治理和可扩展性。微软首席架构师 Shankar Narayanan SGS 在人工智能、云平台和企业自动化方面拥有深厚的专业知识。在这次对话中,Shankar 探讨了从基于规则的自动化到 Agentic AI 的转变,即不断发展的 […]
AGI Is Not Here: LLMs Lack True Intelligence
为什么重要:通用人工智能尚未出现:法学硕士缺乏真正的智能。了解法学硕士为何缺乏真正的类人认知和推理能力。
Choosing the Right LLMs for You: An Insightful Guide
我们讨论 AGI 的进展已经有一段时间了。然而,我们几乎忘记了实际上起到了重要作用的黑暗骑士。就我们的日常工作流程、产生结果和生产力而言,选择合适的 LLM 已经变得至关重要,对吧?想想看,在推出 ChatGPT 后,用户毫不含糊地接受了 […] 这篇文章《选择适合您的 LLM:一份有见地的指南》首先出现在 Weam - AI For Digital Agency 上。
Addressing Current Issues Within LLMs & Looking Forward to What’s Next
如今,有数十种公开可用的大型语言模型 (LLM),例如 GPT-3、GPT-4、LaMDA 或 Bard,随着新模型的发布,数量还在不断增加。LLM 彻底改变了人工智能,彻底改变了我们在各个行业与技术互动的方式。这些模型使我们能够从许多人类语言数据集中学习 […] 文章《解决 LLM 中的当前问题并展望下一步》首先出现在 Unite.AI 上。
Saturday Citations: Chicxulub meteorite found guilty; Good news and bad news for LLMs
这是圣诞节前的最后一周,但没有任何生物活动,甚至没有一只为体内研究中枢神经系统兴奋剂而培育的表现出多动症特征的小鼠模型。本周,我们报道了世界上已知最古老的哺乳动物祖先的发现;对阿塞拜疆西部 1,300 个墓葬的勘测;以及存在于所有磁性材料中的准粒子。此外,研究人员还推翻了关于恐龙末日的另一种替代理论;一项研究表明,法学硕士正变得越来越像大脑,但另一项研究表明它们表现出认知能力下降的迹象:
我们是游戏 AI 的先驱:更新 0.3.0a 引入了本地 LLM 支持,使 AI NPC 能够直接在您的 PC 上运行。AI People 是第一款实现由本地 LLM 驱动的 AI NPC 的游戏。现在,整个 AI People 游戏都可以在您的 PC 上离线运行(在游戏选项中配置)本地 LLM 集成AI People 的 NPC 通过大型语言模型运行,该模型处理他们的对话、理解和交互。这些交互会消耗令牌 - AI People 中的信用额度所涵盖的处理单位。以前,这需要云处理并消耗信用额度。更新 0.3.0a 添加了在 PC 上本地运行 LLM 的选项,而不是使用云服务。这对玩家意味着什么成
The Failure of LLMs in Math and How to Solve For It
数学一直是 AI 模型面临的重大挑战。掌握数学需要复杂的推理技能,而对于 AI 来说,这项任务绝非易事。鉴于数学能力对于职业、个人和学术成功的重要性,这带来了巨大的问题。尽管大型语言模型 (LLM) 能力非凡,但它们往往难以应对复杂的数学问题 […] 文章《LLM 在数学方面的失败及其解决方法》首次出现在 Unite.AI 上。