Researchers Discover Lost 3,000-Year-Old Babylonian Hymn
慕尼黑大学 (LMU) 教授恩里克·希门尼斯 (Enrique Jiménez) 使用人工智能识别了 30 份相关手稿,发现了一首前所未知的赞美诗,其历史可追溯至公元前 1000 年左右。在与巴格达大学的一个联合项目中,慕尼黑大学教授恩里克·希门尼斯发现了一段失踪了一千年的文本。 “这是一首迷人的赞美诗,描述了 [...]
Improving Language Model Personas via Rationalization with Psychological Scaffolds
使用用户描述或角色提示的语言模型用于预测用户的偏好和意见。然而,现有的构建角色的方法主要依赖于用户的人口统计属性和/或先前的判断,而不依赖于用户判断背后的任何潜在推理。我们引入了 PB&J(行为和判断心理学),这是一个框架,通过纳入用户可能做出某种判断的潜在理由来改进 LM 角色。我们的基本原理是由语言模型生成的,用于明确推理用户在……上的行为
Reimagining Assessment for the Age of AI with Amit Sevak, CEO of ETS
全球教育和工作格局正在快速变化,需要全新的衡量方法。教育趋势主持人迈克·帕尔默 (Mike Palmer) 欢迎负责全球数百万次评估的 ETS(教育考试服务机构)首席执行官阿米特·塞瓦克 (Amit Sevak) 讨论我们如何识别人才的高风险转变。我们探讨价值数万亿美元的教育行业如何努力衡量成果,以及为什么可靠的数据对于推动进步至关重要。阿米特详细介绍了 ETS 在 K-12、高等教育和劳动力领域所做的基础工作,以将重点从传统测试转向基于能力的学习和工作准备技能。我们深入探讨了建立人工智能素养框架的紧迫性,以及技术如何推动“无测试”绩效评估的新时代。为什么你现在应该听:人工智能人才之战:阿米特
捕猎蜘蛛的黄蜂,Priocnemis perturbator (Harris, 1780)(膜翅目:Pompilidae)的基因组序列摘要我们展示了来自雌性 Priocnemis perturbator(蜘蛛狩猎黄蜂;节肢动物门;昆虫纲;膜翅目;Pompilidae)个体的基因组组装。基因组序列总长度为391.62兆碱基。大部分组装 (67.88%) 被搭建成 15 个染色体假分子。线粒体基因组也已组装完毕,长度为28.93 kb。 Ensembl 上该组装体的基因注释识别出 24 581 个蛋白质编码基因。该程序集是作为达尔文生命之树项目的一部分生成的,该项目为英国和爱尔兰发现的真核物种生成
对来自阿根廷北部的 Theraphosidae 蜘蛛(Mygalomorphae:Plseiopelma、Tmesiphantes)未描述的性别的描述摘要以前未知的雌性来自两种阿根廷狼蛛(Theraphosidae),Plesiopelma paganoi Ferretti & Barneche,2014 和 Tmesiphantes crassifemur(Gerschman & Schiapelli, 1960)首次被描述。两个标本都是在模式产地或非常接近模式产地采集的,以确保是同种的。 Paganoi 的雌性可以通过大量的唇和上颌尖以及具有非常短且非螺旋管的受精囊形状来与同类区别开来。
“How NOT to Invest” with Bruce Mehlman
布鲁斯·梅尔曼 (Bruce Mehlman) 是一位有趣的人,他在华盛顿特区经营一家两党咨询店。布鲁斯·梅尔曼 (Bruce Mehlman) 的帖子“如何不投资”首先出现在《大图片》(The Big Picture) 上。
蜘蛛的静息代谢率与生态行会或极端栖息地条件的相关性更强吗?摘要具有较低维护成本和更广泛环境耐受性的变温动物通常在人类改变的景观和当前气候变化下具有更强的适应能力,从而提高了它们的生存和殖民机会。在这项研究中,我们探讨了栖息地利用和觅食策略与蜘蛛的静息代谢率 (RMR) 之间的关系,这些栖息地因人为干扰而具有显着的温度变化:原生森林和幼松种植园,均位于南大西洋森林。我们在 25°C 下使用开放式呼吸呼吸测定法测量了不动蜘蛛的二氧化碳产生量,以计算它们的 RMR。主要发现包括:(1)所有蜘蛛的 RMR 比标准代谢方程预测的低 22%–57%; (2) 在所有情况下都观察到了连续的气体交换模式,这是
实体链接 (EL) 传统上依赖于大型注释数据集和广泛的模型微调。虽然最近的小样本方法通过提示来利用大型语言模型 (LLM) 来减少训练要求,但由于昂贵的基于 LLM 的推理,它们常常效率低下。 ARTER(自适应路由和目标实体推理)提出了一种结构化管道,通过策略性地结合候选生成、基于上下文的评分、自适应路由和选择性推理,无需深度微调即可实现高性能。 ARTER 计算一小组...
Breaking Down Video LLM Benchmarks: Knowledge, Spatial Perception, or True Temporal Understanding?
本文在 NeurIPS 2025 的 Evaluating the Evolving LLM Lifecycle Workshop 上被接受。现有的视频理解基准通常将基于知识的问题和纯粹基于图像的问题混为一谈,而不是明确隔离模型的时间推理能力,而这是区分视频理解与其他模态的关键方面。我们发现了两个主要限制,这些限制掩盖了较高的分数是否真正表明对视频中的动态内容有更强的理解:(1)强大的语言先验,模型可以在不观看视频的情况下回答问题;和(2)...
ODKE+: Ontology-Guided Open-Domain Knowledge Extraction with LLMs
知识图 (KG) 是许多人工智能应用的基础,但保持其新鲜度和完整性仍然成本高昂。我们推出 ODKE+,这是一个生产级系统,可以自动从网络资源中高精度地提取和摄取数百万个开放域事实。 ODKE+ 将模块化组件组合成可扩展的管道:(1) 提取启动器检测丢失或过时的事实,(2) 证据检索器收集支持文档,(3) 混合知识提取器对大型语言模型 (LLM) 应用基于模式的规则和本体引导提示,(4) ...
Bias after Prompting: Persistent Discrimination in Large Language Models
从偏见转移假设 (BTH) 的先前工作中可以得出的一个危险假设是,偏见不会从预先训练的大型语言模型 (LLM) 转移到适应模型。我们通过研究提示适应下因果模型中的 BTH 来验证这一假设,因为提示是现实世界应用中非常流行且易于使用的适应策略。与之前的工作相比,我们发现偏见可以通过提示转移,而流行的基于提示的缓解方法并不能始终阻止偏见的转移。具体来说,相关性......
Winners of 2025 Philip Leverhulme Prize Announced
Leverhulme Trust 向 30 名杰出研究人员授予了 300 万英镑,其中 6 名研究人员是经济学研究人员。
Why PHANTOMHAWK Drones Are a Should Have for Trendy Militaries
来认识一下 PHANTOMHAWK — EDGE Group 的下一代无人机,专为当前高风险战场上的持久性、隐身性和精确性而设计。凭借 12 小时的飞行时间、垂直起降功能和实时情报供应,它正在重新定义战术无人机战争。它的设计初衷是在别人失败的地方蓬勃发展,它不仅仅是一架无人机,还是一个动力倍增器。这就是军队监控的前进方向吗?立即观看并做出决定——不要忽视喜爱并订阅更多内容! 00:35 – 为时尚战场构建目标 02:23 – 随时随地做好任务来源:https://pastebin.com/PGsUshjS 立即订阅:https://www.youtube.com/channel/UC0IlEu
Forensics’ “Holy Grail”: New Test Recovers Fingerprints From Ammunition Casing
一种新的电化学测试可以从发射的弹药中恢复指纹,即使在极端高温下也是如此。该方法可以极大地扩展法医能力。爱尔兰的两位科学家发明了一种突破性技术,可以从发射的弹药壳中恢复指纹,这长期以来被认为几乎是不可能的。 Eithne Dempsey 博士和她以前的博士生 Colm McKeever 博士,[...]
ERA Gen. Assembly: Regionals suffering ‘simply unbearable’ price increases
Jesper Rungholm,ERA 主席(欧洲地区协会)。ERA 大会后:地区性价格上涨“简直难以忍受”首先出现在《航空商业新闻》上。
米連邦地裁、Googleへの是正措置を公表~一般検索サービス市場における独占排除
■摘要 2025 年 9 月 2 日,美国哥伦比亚特区地方法院就 Google 通用搜索服务中的反竞争行为发布了一项命令。本判决(以下简称判决)是应原告(美国和各州)在判决(责任审判)认定 Google 的行为具有反竞争行为后寻求补救(补救措施)的请求而发布的。该判决否定了采取出售部分业务等结构性补救措施,也不批准出售Chrome和Android。这是因为原告无法证明反竞争行为与结构性补救措施之间存在“实质性因果关系”,也因为原告无法证明“不太严重的补救措施”是不够的。另一方面,除了单纯的禁令之外,法院还要求向竞争对手提供信息。首先,它暂停了谷歌与合同制造商之间的合同,这些合同使谷歌搜索成为默
Agentic AI in Finance: Opportunities and Challenges for Indonesia
人工智能的兴起几乎触及每个行业,包括金融业。事实上,金融行业长期以来一直采用我们现在所说的“传统机器学习”,将其用于预测建模、信用评分和风险分析。但随着当前围绕大型语言模型 (LLM) 和 Agentic AI 的炒作,我开始 […]金融领域的 Agentic AI:印度尼西亚的机遇和挑战首先出现在《走向数据科学》上。
Lloyds finance boss refuses to rule out motor finance legal challenge
劳埃德银行集团 (Lloyds Banking Group) 的财务负责人拒绝排除对金融监管机构的汽车金融补救计划提出法律质疑的可能性,因为该银行根据该计划提供的支出条款对其利润造成了打击。劳埃德银行 (Lloyds) 首席财务官威廉·查默斯 (William Chalmers) 表示,这家富时 100 指数巨头“担心”[...]