EncQA: Benchmarking Vision-Language Models on Visual Encodings for Charts
多模态视觉语言模型 (VLM) 在图表理解基准上的得分不断提高。然而,我们发现这一进展并没有完全体现解释图表所必需的视觉推理能力的广度。我们引入了 EncQA,这是一种基于可视化文献的新颖基准,旨在提供对图表理解至关重要的视觉编码和分析任务的系统覆盖。 EncQA 提供 2,076 个合成问答对,实现六个视觉编码通道的均衡覆盖(位置、长度、面积、颜色……
FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models
自回归语言模型 (ARM) 提供了很强的可能性,但本质上是串行的:它们每次前向传递生成一个令牌,这限制了吞吐量并增加了长序列的延迟。扩散语言模型 (DLM) 跨位置并行,因此对于语言生成来说似乎很有前景,但标准离散扩散通常需要数百到数千次模型评估才能达到高质量,以串行深度换取迭代广度。我们引入 FS-DFM,即少步离散流匹配。离散流量匹配模型,专为提高速度而设计,且不牺牲……
Chatbots work best when you speak to them with formal language
在与人工智能聊天机器人交谈时,您是否简洁、非正式?如果是这样,您可能会得到比使用更正式的语言更糟糕的答案
本文由 Vincent Everett 友情撰写,他是诺福克一所综合学校六年级的语言主任。他在博客中的名字是“教语言的好人”。在第 1 部分中,我研究了 GCSE 语言的低分成绩——比学生其他科目的成绩还要低 [...]这篇文章《人为制造的“失败”叙事如何分散我们对解决阻碍现代语言学习的系统性问题的注意力——第 2 部分》首先出现在 HEPI 上。
From barks to words: Researchers aim to translate dog sounds with AI
有没有想过你的狗想说什么?德克萨斯大学阿灵顿分校的一位研究人员正致力于将人类最好朋友的吠叫、嚎叫和呜咽转化为可理解的语言——一种汪汪叫声中的罗塞塔石碑。
ExpertLens: Activation Steering Features Are Highly Interpretable
本文在 NeurIPS 2025 的统一神经模型表示研讨会 (UniReps) 上被接受。大语言模型 (LLM) 中的激活引导方法已成为执行有针对性的更新以增强生成语言的有效方法,而无需大量适应数据。我们询问激活引导方法发现的特征是否可以解释。我们使用激活控制研究中的“寻找专家”方法来识别负责特定概念(例如“猫”)的神经元,并表明 ExpertLens,即检查这些......
What exactly does word2vec learn?
word2vec 到底学习什么以及如何学习?回答这个问题相当于在一个最小但有趣的语言建模任务中理解表示学习。尽管 word2vec 是众所周知的现代语言模型的先驱,但多年来,研究人员缺乏描述其学习过程的定量和预测理论。在我们的新论文中,我们最终提供了这样一个理论。我们证明存在现实的、实用的机制,其中学习问题可以简化为未加权的最小二乘矩阵分解。我们以封闭形式求解梯度流动动力学;最终学习到的表示由 PCA 简单给出。word2vec 的学习动态。当从小初始化开始训练时,word2vec 以离散、连续的步骤进行学习。左:权重矩阵中的排名递增学习步骤,每个步骤都会减少损失。右图:潜在嵌入空间的三个时间
IEEE Transactions on Artificial Intelligence, Volume 6, Issue 11, November 2025
1) 基于 DNN 和 GAN 的鲁棒实时视听语音增强作者:Mandar Gogate、Kia Dashtipour、Amir Hussain 页数:2860 - 28692) 优化神经网络训练:资源节约的马尔可夫链方法作者:Ke Wang、Xianting Huang、Cong Tan、Siu-Ming Yiu、Zicong Chen、雷小林页数:2870 - 28833) LibriSQA:大型语言模型口语问答的新颖数据集和框架作者:赵子涵、江一阳、刘鹤阳、王宇、王彦峰页数:2884 - 28954) 从常规到反思:高效通信联邦学习中的修剪神经网络作者:裴家明、魏Li, Shahid Mu
上周我在 Twitter 上发布的一些有趣链接(我还在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):提示注入是 AI 浏览器实现的新攻击媒介:https://www.theregister.com/2025/10/28/ai_browsers_prompt_injection/使用 AI 正在改变我们的大脑使用语言的方式: https://www.rnz.co.nz/life/wellbeing/how-generative-ai-could-change-how-we-think-and-speakAI正在让富人和强者变得更富有、更强大:htt
Centre plans AI-driven consumer law overhaul to speed up case resolution
拟议的改革包括人工智能辅助案件追踪、虚拟听证会和通过翻译工具进行多语言访问
Industrial Policy Since the Great Financial Crisis
国际货币基金组织经济学家的大型团队跟踪自 2008 年金融危机以来的产业政策:本文通过采用大型语言模型技术来识别政策动机,将新产业政策观察站 (NIPO) 数据集从 2009 年扩展至 2023 年。我们记录了自金融危机以来发达经济体和新兴市场经济体广泛采用的产业政策,[...]
Speaking of debt: Framing, guilt, and economic choices
在许多日耳曼语言(英语、德语、荷兰语、瑞典语和冰岛语)中,债务意味着罪恶。 Cevat Giray Aksoy、Mathias Dolls、Justyna Klejdysz、Andreas Peichl 和 Lisa Windsteiger 调查了人们厌恶债务是否是因为这个含义:在许多日耳曼语言中,常用的“债务”一词也意味着“罪恶”,它带有强烈的道德内涵。评论员 [...]
又一个周一留言板。对任何主题发表评论。请进行文明讨论,不要使用粗俗语言。请对沙坑进行边际讨论和想法修复。我现在使用 Substack 作为博客平台和每月的电子邮件通讯。目前,我将在此博客和 Substack 上发布。您还可以关注 [...]
Szymon Kulmaszewskit,波兰和美国诉美国军事司法系统的比较分析。大多数作者都认为“军事司法”没有明确的规范性定义。然而,该术语植根于军事组织(武装部队)的制度化活动领域,因此它在法律科学和军事科学的语言中发挥作用。文本综合概述了波兰和美国的军事司法历史,从中可以看出军事司法制度的假设,例如需要对军人行使管辖权,以及需要在不同的框架内处理军事案件,但可以看出共同的特征。由于军事法的制定和适用问题扩大了规范术语的范围,将军事司法系统的概念以及随之而来的军事案件的概念包括在内,本研究对这些概念进行了广泛的解释,结果产生了一些令人惊讶的结果。其一,在许多法律体系中,军事法的执行方式与
Schools Turn to AI Translation Tools to Support English Learners
教师和学校管理人员正在转向人工智能工具来帮助弥合与英语学习者的语言差距,但专家警告其使用。
California Rethinks How to Identify 4-Year-Olds Who Need Extra Help Learning English
加州教育官员在接下来的几个月里肩负着一项艰巨的任务——找到最好的方法来找出哪些 4 岁的孩子在学习英语方面需要额外的帮助。这是一个挑战,因为这个年龄段的孩子仍在发展语言技能,他们还不习惯测试。在过去的评估中,儿童 [...]