The Ancient Maya Used The Dresden Codex to Predict Solar Eclipses with Impressive Accuracy
了解有关玛雅守日者以及他们如何创建农历表来预测天体事件的更多信息。
推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......
Being mean to ChatGPT increases its accuracy — but you may end up regretting it, scientists warn
一项新的研究表明,简短或彻头彻尾的刻薄可能会让新的人工智能模型更加准确,这与之前关于人工智能礼貌的研究结果相悖。
New blood test can predict risk of postpartum depression with more than 80% accuracy
科学家们正在更多地了解这种分娩的主要并发症。治疗方法正在改进,医生可以测试标记风险升高的生物标记。
How the Mayans were able to accurately predict solar eclipses for centuries
玛雅文明源自中美洲,是最先进的古代文明之一,以其在天文学和数学方面的重大成就而闻名。这包括准确的日历和详细的天体记录,但科学家们并不完全理解他们计算的所有细节。然而,新的研究揭示了他们如何以惊人的准确性预测未来的日食。
New forecasting tool improves accuracy of epidemic peak and hospital demand predictions
在疫情期间,医疗保健决策者面临的一些最关键也是最难回答的问题:疫情何时达到顶峰、一次需要多少人接受治疗以及医疗需求高峰会持续多久?及时的答案可以帮助医院管理人员、社区领导和诊所决定如何最有效地部署员工和其他资源。不幸的是,许多流行病学预测模型往往难以准确预测高峰期的病例和住院情况。
“Astounding” – 70% of Americans Have Obesity by New, More Accurate Definition
麻省总医院的研究人员研究了一种超越 BMI 的肥胖定义新方法,同时还考虑了身体脂肪的分布方式。根据柳叶刀糖尿病和内分泌委员会今年早些时候推出的新定义,美国的肥胖率可能会急剧上升。麻省总医院布里格姆分校的研究人员发现 [...]
Blood pressure measurement methods in different clinics show major differences in accuracy
一项新研究表明,测量血压 (BP) 的方式和地点会对结果产生很大影响。发表在《内科医学年鉴》上的评论发现,使用不同方法获得的读数可能会有很大差异,足以影响医疗决策。这项研究由 Jiunn-Tyng Yeh 博士领导,[…]不同诊所的血压测量方法在准确性上存在重大差异,这一结果首先出现在 Knowridge Science Report 上。
Temperature corrections boost accuracy of coastal ocean color satellites
海洋颜色卫星通过估算叶绿素、悬浮物和溶解的有机物质,提供对水质和生态系统动态的重要见解。大气校正是消除卫星信号散射和吸收的过程,是这些分析的核心。
Supervisor Accuracy in Subjective Evaluations and Employee Careers
KANAYAMA Hayato (早稻田大学) / KAWATA Yuji (早稻田大学) / KITAGAWA Ritsu (哥伦比亚大学)
Российские ученые разработали систему прогнозирования просадки грунта с точностью 99%
彼尔姆理工学院的专家开发了一种解决方案,可以使用单个参数 - 粘土流动性指数来预测物体整个使用寿命期间的沉降,准确率超过 99%
FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models
自回归语言模型 (ARM) 提供了很强的可能性,但本质上是串行的:它们每次前向传递生成一个令牌,这限制了吞吐量并增加了长序列的延迟。扩散语言模型 (DLM) 跨位置并行,因此对于语言生成来说似乎很有前景,但标准离散扩散通常需要数百到数千次模型评估才能达到高质量,以串行深度换取迭代广度。我们引入 FS-DFM,即少步离散流匹配。离散流量匹配模型,专为提高速度而设计,且不牺牲……
New blood test detects chronic fatigue syndrome with 96% accuracy
慢性疲劳综合症(CFS),也称为肌痛性脑脊髓炎(ME)的诊断取得了重大突破。东安格利亚大学和牛津生物动力公司的科学家们开发出了一种血液检测方法,可以以 96% 的准确率识别这种疾病。这一期待已久的进展可能会给全世界数以百万计的人带来真正的希望……新的血液测试检测慢性疲劳综合症的准确率高达 96%,首次出现在 Knowridge Science Report 上。
Carbon monitoring: Modeling effort helps to quickly and accurately estimate forest biomass
一棵树可以封存相当多的碳,森林可以封存和储存更多的碳,但由于从规划和管理决策到评估森林健康状况等多种原因,准确了解多少碳非常重要。然而,估计森林景观中储存了多少碳是一个乏味且耗时的过程。
Scientists develop first ‘accurate blood test’ to detect chronic fatigue syndrome
研究可能为肌痛性脑脊髓炎患者带来希望,但一些专家敦促谨慎行事,并表示需要进行更多研究。科学家表示,他们已经开发出世界上第一种血液检测方法来诊断肌痛性脑脊髓炎,也称为慢性疲劳综合症 (ME/CFS)。目前尚无针对这种疾病的检测方法,患者往往根据症状进行诊断,这意味着许多人可能多年未得到诊断。继续阅读...
Air Force Experiments With AI, Boosts Battle Management Speed, Accuracy
空军结束了第二个决策优势的人类机器团队(称为Dash 2),这是一个快节奏的实验,探讨了人工智能如何帮助操作员在拉斯维加斯的复杂战斗空间中更快,更明智的决策。