系统研究关键词检索结果

推理的剃刀:推理提高了准确性,但会损害安全和幻觉检测中关键操作点的回忆

Reasoning’s Razor: Reasoning Improves Accuracy but Can Hurt Recall at Critical Operating Points in Safety and Hallucination Detection

推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......

[古生物学 • 2025] Chiloconger aflorens, Dasyscopelus inopinatus, ... • 巴拿马加勒比地区上中新世 Chagres 地层中菌类耳石的显着优势

[Paleontology • 2025] Chiloconger aflorens, Dasyscopelus inopinatus, ... • Remarkable Dominance of myctophid otoliths in Upper Miocene Chagres Formation, Caribbean Panama

皮纳组合代表了中上层鱼类主导的生态系统的罕见化石记录,该生态系统与晚中新世期间沿海上升流有关巴拿马加勒比地区晚中新世中层鱼类主导的生态系统的重建。艺术作品由 Yun-Kae Kiang.in Lin​ et O’Dea,2025 年创作。DOI:doi.org/10.7717/peerj.20155 x.com/otolith_lin 摘要 巴拿马北部上中新世 Chagres 地层的海洋化石为了解大西洋与太平洋被该地层分离之前的古环境条件和生态反应提供了重要的见解。 巴拿马地峡。在这里,我们基于从科隆皮纳镇附近的沿海地区收集的 6,200 多个耳石进行了系统研究。该组合因 Myctophida