OpenAI:s nya AI-modeller hallucinerar mer än tidigare
OpenAI的最新AI型号,尤其是O3和O4-Mini,比其前辈更具幻觉。 “幻觉”是指AI建模创造性信息或提供错误的答案。这种现象使用户和研究人员造成了混乱,因为通常预计较新的模型比较旧的模型更可靠。研究人员发现的是,Clissuce Research Group最近对[…] Openai的新AI模型进行了深入的调查,比以前最初出现在AI新闻中的幻觉更具幻觉。
BMI is not a good guide to obesity in male athletes
体重指数(BMI)的截止点在全球范围内用来表明超重和肥胖症高估了男运动员的这些条件,这是根据今年欧洲肥胖大会上提出的意大利和黎巴嫩研究。作者说,BMI并不能区分体内脂肪和瘦质量,包括肌肉,因此,低体脂的肌肉运动员可以将其归类为超重或肥胖。该小组研究了622名男运动员的BMI,发现超过25%的人根据该措施被归类为超重或肥胖。但是,当更准确地测量体内脂肪时,只有不到4%的运动员被发现超重或肥胖。因此,团队使用计算机建模为该组找到了更合适的BMI截止值。接下来,他们希望为女运动员和特定运动开发新的临界。 新的澳大利亚优先研究发现,每笔投资于澳大利亚监狱针和注射器计划的计划可以节省超过两美元的丙型肝
Cracking the Code of Megaquakes: Inside the 3D Simulation That Changes Everything
研究人员建立了一个强大的新3D地震模拟,揭示了像2023年Turkiye灾难这样的巨大地震,以恐怖的细节展现出来。通过不仅建模故障,而且对周围的地球结构进行建模,他们能够捕获毁灭性的双打震颤一拳 - 快速连续的两个重大破裂 - [...]
好吧,这不是彼得·贝克(Peter Beck)的实际L-39信天翁,而是一个非常大的模型喷射。我们偶然发现的是新西兰喷气机协会(https://www.nzjma.com/)的每月蝇林:L-39大于一个第三比例,由whangaparaoa的Colin Austen建造。它的全部增加重量约为70公斤。还有其他一些壮观的模型,包括我看到的第一个涡轮道具模型:这是由沃克沃思(Warkworth)的保罗·康纳(Paul Connor)拥有的皇家沙特空军Pilatus PC 21的模型。沃克沃思(Warkworth)的保罗·康纳(Paul Connor)拥有令人印象深刻的令人印象深刻的!甚至是烟雾!然后
Prehistoric Sunscreen and Clothing May Have Given Homo sapiens an Evolutionary Advantage
对地球的大气层和41,000年前的磁场进行建模表明,智人的抗光策略如何帮助他们作为一种物种维持。
AerFin and Acumen Aviation launch ‘AerFinity’ to drive digital transformation
Aerfin与都柏林的Acumen Aviation合作,启动了“ Aerfinity”项目,这是一项旨在提高运营速度,洞察力和效率的全公司数字化转型计划。该项目将通过下一代预测平台整合实时供应链数据,方案建模和市场分析。 Aerfin首席执行官西蒙·古德森(Simon Goodson)强调了该倡议的目标是使团队能够使[…]
Grace Wahba awarded the 2025 International Prize in Statistics
格蕾丝·瓦赫巴(Grace Wahba)。戴维·卡兰(David Callan)的照片,2025年。国际统计奖基金会(Grace Wahba)颁发了2025年的奖项,以“她在平滑光谱方面的开创性工作,这改变了数据分析和机器学习”。 Wahba教授是最早使用非参数回归建模的人之一。计算和可用性的最新进展[…]
Exercise before bed is linked with disrupted sleep
实验室实验证实了数值建模在模拟珊瑚漂白方面的准确性。该研究发表在保护生理学上,评估了珊瑚漂白模型(EREEFS的一个组成部分)的技能,代表了在珊瑚曲霉中观察到的实验性漂白。研究人员比较了先前在海洋科学领域发表的实验性漂白结果,并比较了模型预测的漂白。该模型的输出与实验实验中观察到的光合作用性能的最初下降紧密一致,旨在表示珊瑚在大屏障礁上的漂白事件中可能遇到的条件。锻炼太接近就寝时间可能会影响睡眠时间,时机和质量。更艰苦的锻炼更接近就寝时间,与睡眠和夜间心脏活动的干扰更大。
Universities should embrace the benefits of married and parenting students
意见:已婚和育儿学生可以为年轻同龄人建模健康的关系和良好的工作习惯。
Bananas Over Salt? New Research Rewrites Blood Pressure Advice
如果控制血压更多的是增强钾,而不是切盐怎么办?新的研究表明,转移这两种电解质之间的平衡,尤其是增加钾的食物(如香蕉和西兰花)可能是一个更有效的策略。向我们的进化根和现代饮食致敬,科学家使用了数学建模[...]
Scaling Diffusion Language Models via Adaptation from Autoregressive Models
扩散语言模型(DLM)已成为文本生成建模的有希望的新范式,有可能解决自回归(AR)模型的局限性。但是,与AR同行相比,当前的DLM的规模较小,并且缺乏对语言建模基准测试的公平比较。此外,从头开始的训练扩散模型仍然具有挑战性。鉴于开源AR语言模型的流行率,我们建议适应这些模型来构建文本扩散模型。我们演示了AR和扩散建模目标之间的联系以及…
今天我们考虑“热点”;在这款Eli A毡尖笔和一张卡片中建模板的移动。用于建模构造板在地球地幔中的固定热源上移动的证据。可以在我们的地球能量 /过程中的“板构造”中找到许多相关的活动。
Can AI Think Like Us? New Research Mimics Human Memory for Smarter Machines
一个受人体记忆启发的新的AI框架可以使机器更有效,适应性和能够推理。最近发表在《工程》杂志上的一篇论文通过对人工记忆的运作方式进行建模,提出了一种新颖的人工智能方法。该研究旨在克服当前大规模模型等当前大型模型的关键局限性,设置[...]
Alien Fermentation on Saturn’s Moon? Tiny Microbes May Lurk in Titan’s Deep, Icy Ocean
泰坦似乎是外星人生活的主要候选人,其有机表面和深度地下海洋,但新的研究表明,那里的任何生活都将非常有限。科学家对微生物如何使用发酵方式建模了微生物的生存,这是一种基本的代谢过程,不需要氧气。尽管泰坦有巨大的有机物,但只有很小的部分[...]
Army Unveils New Fitness Assessment for Ranger Students
陆军公布了游骑兵学生的新健身评估,20125年4月9日 - 17:24在对功能性战斗健身训练上的新关注,美国陆军步兵学校已修改了为游骑兵的学生的身体健身评估,以表现出来的学生,不再需要表现出来的六个人,并且不再需要表现出来的六个范围,并且不再表现出来的训练,并且不再表现出来,但不再表现出5人的范围。根据机动卓越新闻新闻稿的说法,仰卧起坐和俯卧撑。此前,Ranger课程的物理评估包括49次俯卧撑,59个坐姿,在40分钟不到40分钟和6次中下调。现在,以获得专业步兵徽章的身体健康要求进行了建模,升级的评估将与4月21日开始的课程实施。美国陆军步兵学校指挥官菲尔·基尼尔利(Phil Kiniery
TiC-LM: A Web-Scale Benchmark for Time-Continual LLM Pretraining
在Neurips 2024的终身基础模型(SCLLFM)讲习班的可伸缩持续学习中接受了本文。LARGE语言模型(LLMS)受过历史网络数据的培训不可避免地会过时。随着新数据的可用,我们调查了LLMS的评估策略和更新方法。我们引入了一个网络尺度数据集,以用于从114个常见爬网(CC)垃圾场得出的LLMS的时间预处理 - 比以前的持续语言建模基准测试的数量级。我们还设计了一般CC数据和特定域的时间分层评估……
AI helps decode horses' body language for better veterinary care
研究人员正在使用AI来弥合马与人之间的沟通差距。结合3D运动捕获和机器学习,一个新的建模系统将为兽医提供强大的视觉工具来解释马肢体语言,这是检测物理甚至行为问题的关键。