How social media encourages the worst of AI boosterism
谷歌 DeepMind 首席执行官 Demis Hassabis 用三个词来总结:“这很尴尬。” Hassabis 在 X 上回复了竞争对手 OpenAI 的研究科学家 Sébastien Bubeck 的一篇令人兴奋的帖子,宣布两位数学家已经使用 OpenAI 最新的大型语言模型 GPT-5,找到了 10 个未解决问题的解决方案......
Feeding the Nation: The Indo-Pacific Politics of Care
米瑞尔·奥古斯丁 | Mirielle Augustin |印度太平洋研究员 图片来自印度尼西亚共和国内阁秘书处公共关系 Rahmat,通过维基共享资源。印度尼西亚总统普拉博沃的旗舰免费膳食计划旨在为数百万学童、幼儿和孕妇提供营养。相反,数千人因食用受污染的食物而入院。这项失败的政策体现了一种区域模式:在整个印度-太平洋地区,关怀语言已成为一种政治……
BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design
我们提出了一种通用方法,用于提高大型语言模型 (LLM) 使用顺序贝叶斯实验设计 (BED) 框架智能、自适应地从用户或其他外部源收集信息的能力。这使得法学硕士能够充当有效的多轮会话代理并与外部环境进行交互。我们的方法称为 BED-LLM(大型语言模型的贝叶斯实验设计),基于迭代选择问题或查询,最大化关于任务的预期信息增益 (EIG)
本增刊是 GAO 题为“医疗保健可及性:需要进一步努力解决残疾人障碍”的报告的姊妹篇,GAO-26-107120。本补充文件的目的是提供报告的“易读”版本。轻松阅读是一些团体使其书面信息更易于理解的一种方式。例如,Easy Read 文件使用简短的句子和简单的语言。在这份报告中,GAO 发现残疾人在医疗保健无障碍方面面临障碍。潜在的障碍包括医疗环境和设备的设计、技术、与提供者的沟通以及缺乏培训。美国卫生与公众服务部 (HHS) 不会从残疾人那里收集有关与残疾相关的医疗保健障碍的国家级数据,而该数据可用于帮助改善无障碍环境。 HHS 检查无障碍的某些方面并进行不同类型的审查,以确保医疗保健组织遵
八年前,我开始做这个定期专题,分享一些来自网络的与 ESL/EFL 或引起我注意的一般语言相关的帖子和资源。您可能还对我所有关于 ELL 教学的最佳列表感兴趣。另外,请查看我最好的资源集合 [...]
IEEE Transactions on Games, Volume 17, Issue 4, December 2025
1) 以人为中心的格斗游戏人工代理开发调查作者:Martinho Tavares、João M. Carvalho、Armando J. Pinho 页数:839 - 8582) 重新发现过去:考古学的严肃游戏作者:Vittorio Murtas、Vincenzo Lombardo 页数:859 - 8723) 综合视频游戏中的多智能体强化学习综述作者:Zhengyang Li、Qijin Ji、Xinghong Ling、Quan Liu页数:873 - 8924) 游戏化文化沉浸:城市遗产中的虚拟现实和混合现实作者:Filippo Sanfilippo、Marius Tataru、Minh
Identifying patterns in insect scents using machine learning
气味在自然界中发挥着核心作用,因为嗅觉相互作用是生命的语言。在 UvA 分子和材料设计技术中心的一个新研究项目中,科学家将利用机器学习来预测哪些类型的嗅觉分子与昆虫嗅觉受体相互作用。这些信息对于开发安全设计分子非常重要,[...]
AgREE: Agentic Reasoning for Knowledge Graph Completion on Emerging Entities
开放领域知识图谱补全(KGC)在不断变化的世界中面临着重大挑战,特别是考虑到每日新闻中不断出现新实体时。现有的 KGC 方法主要依赖于预训练语言模型的参数知识、预构建的查询或单步检索,通常需要大量的监督和训练数据。即便如此,他们通常无法捕获有关不受欢迎和/或新兴实体的全面且最新的信息。为此,我们介绍了新兴实体的代理推理(AgREE),这是一本小说……
The brewing GenAI data science revolution
如果您现在领导一个企业数据科学团队或定量研究部门,您可能会感觉自己生活在两个平行的宇宙中。在一个宇宙中,你会看到“GenAI”爆炸。聊天机器人现在可以编写代码并创造艺术,而董事会则痴迷于大型语言模型(LLM)将如何改变世界。正在酝酿中的 GenAI 数据科学革命首先出现在 DataRobot 上。
IEEE Transactions on Cognitive and Developmental Systems, Volume 17, Issue 6, December 2025
1) CLARE:多模态数据实时认知负荷评估作者:Anubhav Bhatti、Prithila Angkan、Behnam Behinaein、Zunayed Mahmud、Dirk Rodenburg、Heather Braund、P. James Mclellan、Aaron Ruberto、Geoffery Harrison、Daryl Wilson、Adam Szulewski、Dan Howes、Ali Etemad、Paul Hungler页数:1337 - 13492) 基于脑电图的统一方法使用连续多元变分模式分解检测儿童多种神经发育障碍作者:Ujjawal Chandela、
To Boomers, An AI Relationship Is Not Cheating
最近的一项调查发现,超过 28% 的成年人声称他们与 LLM(大语言模型)保持着亲密甚至浪漫的关系,俗称人工智能 - “AI”。(1)这似乎是合理的,因为 41% 的人相信通灵和鬼魂。令人惊讶的是接受这项新技术的人群的人口统计数据。这不是年轻人,他们知道这不是真实的,而是婴儿潮一代。他们不仅对人工智能关系感到满意,超过 50% 的人表示他们可以毫无愧疚地与人工智能建立浪漫关系。阅读更多
Synthetic Bootstrapped Pretraining
我们介绍了合成引导预训练(SBP),这是一种语言模型(LM)预训练过程,它首先从预训练数据集中学习文档之间的关系模型,然后利用它来合成一个巨大的新语料库以进行联合训练。虽然标准预训练教会 LM 学习单个文档中标记之间的因果相关性,但它并不是为了有效地建模丰富的、可学习的文档间相关性而设计的,而这种相关性可能会带来更好的性能。我们通过设计计算匹配的预训练设置并预训练 3B 参数来验证 SBP……
GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing
使用自然语言指令编辑图像已成为一种自然且富有表现力的修改视觉内容的方式;然而,评估此类模型的性能仍然具有挑战性。现有的评估方法通常依赖于 CLIP 等图像文本相似度度量,但缺乏精度。在这项工作中,我们引入了一个新的基准,旨在以更扎实的方式评估文本引导图像编辑模型,沿着两个关键维度:(i)功能正确性,通过自动生成的多项选择题进行评估,以验证预期的更改是否成功......
我们推出 UniGen-1.5,这是一种用于高级图像理解、生成和编辑的统一多模态大语言模型 (MLLM)。在UniGen的基础上,我们全面增强了模型架构和训练流程,以增强图像理解和生成能力,同时释放强大的图像编辑能力。特别是,我们提出了一种统一的强化学习(RL)策略,通过共享奖励模型共同改进图像生成和图像编辑。为了进一步增强图像编辑性能,我们提出了一个轻型编辑指令对齐阶段......
3 Questions: Using computation to study the world’s best single-celled chemists
助理教授 Yunha Hwang 利用微生物基因组来检查生物学语言。她的任命反映了麻省理工学院致力于探索遗传学研究和人工智能的交叉点。
Did AI write that? 5 ways to distinguish chatbots from human authors
聊天机器人在模仿人类语言方面做得越来越好,但它们仍然存在缺陷。