LLM 很难回答这个非常基本的经济学问题:提示:“这在事实上准确吗?正相关的价格-数量对表明需求曲线发生了变化。” LLM 会说这可能是错误的,但总是不提供反例,甚至不提及反例可以作为这种答案的基础。OpenAI 的 o1 模型有时是个例外,它跌跌撞撞地意识到在通常的供需斜率假设下不存在反例。如果只给出一点使用逻辑的提示,OpenAI 的所有模型都会提供一个很好的答案。提示:“这在事实上准确吗?正相关的价格-数量对表明需求曲线发生了变化。[提示:考虑反证法]” Grok2 和 Deepseek 的答案并没有随着提示而改善。Grok2 对什么是反证法表现出很大的困惑。 Deepseek 是最糟糕
Extremely cold atoms can selectively defy entropy
当它们的量子特性得到精确控制时,一些超冷原子可以抵抗表明一切都趋向于无序的物理定律
Optimizing LLM test-time compute involves solving a meta-RL problem
TL;DR:训练模型以优化测试时间计算并学习“如何发现”正确答案,而不是学习“输出什么答案”的传统学习范式,这可以使模型更好地利用数据。迄今为止,改进大型语言模型 (LLM) 的主要策略是使用越来越多的高质量数据进行监督微调 (SFT) 或强化学习 (RL)。不幸的是,这种扩展形式似乎很快就会遇到障碍,预训练的扩展定律会趋于稳定,并且有报告称,用于训练的高质量文本数据可能在 2028 年耗尽,特别是对于更困难的任务,例如解决推理问题,这似乎需要将当前数据扩展约 100 倍才能看到任何显着的改进。LLM 在这些困难任务中的问题上的当前表现仍然令人失望(见示例)。因此,迫切需要数据高效的方法来训练
From Artificial to Extraterrestrial: Scientists Reveal the Fundamental Limits of Life
一项跨越科幻小说和科学定律界限的研究探索了我们所知生命及更广阔领域的潜在极限。它借鉴了各种科学学科,提出了地球和其他地方生命可能采取的形式的基本限制。探索外星生命和人工生命外星生命和人工生命一直 [...]
Nvidia CEO Insights: AI Chips Surpass Moore’s Law
它很重要:NVIDIA AI芯片超过了摩尔的定律,通过更智能,更快,更可持续的创新来改变技术。
Trump Is on a Collision Course With the US Budget
无论唐纳德·特朗普和他的寡头同伙对减税有多么坚定,算术定律都无法废除。如果只有少数共和党议员信守不增加美国预算赤字的承诺,新政府就不可能实施其经济议程并维持政府运转。
More Reasons for Cautious Optimism About the Demise of The Green Energy Fantasy
当我回顾选举以来的发展时,我看到了许多其他理由来加强我的谨慎乐观态度。或许是因为政治环境发生了变化,或许是因为有些人开始意识到你无法超越物理定律;或许两者兼而有之。以下是一些例子:
OpenAI’s New Scaling Law Impresses Audiences
它很重要:发现Openai的新规模定律如何以提高效率,可预测性和成本效益的提高给观众留下深刻的印象。
Mathematician Reveals Strange New Enigmas for Time Travelers
根据一项新研究,物理定律意味着时间旅行者的记忆将被抹去。
时光飞逝,今年只剩下大约10天了。在我们匆匆度日的同时,岁末又将至,新年也即将到来。确实感觉时间过得很快。这种感觉似乎随着年龄的增长而变得更加强烈。例如,对于一个5岁的孩子来说,一年代表了他们迄今为止生命的20%。你会经常在生活中有新的发现和遇到前所未有的事件,让每一天都感到新鲜,时间似乎过得很慢。相比之下,对于一个 50 岁的成年人来说,一年仅占其迄今为止生命的 2%。在我们的日常生活中,很少有我们从未经历过的事情,而且我们往往感觉每一天都过得很快。这种“随着年龄增长,时间似乎过得更快”的现象,是由法国哲学家保罗·詹尼塞提出的“詹尼塞定律”,被认为是由于大脑活动随着年龄增长而减少。它也被称为
当选总统唐纳德·特朗普和他的共和党盟友决心延长他第一任期内 2017 年实施的企业减税政策。许多共和党人一直在淡化此举对美国联邦赤字的影响。但据《华盛顿邮报》专栏作家凯瑟琳·兰佩尔 (Catherine Rampell) 称,他们忽视了其中涉及的数学问题。阅读更多:'只有高收入国家才没有数学':华盛顿内部人士解释美国人为何如此悲惨兰佩尔在 12 月 10 日的专栏中指出:“共和党的首要任务是摆脱数学。如今,难以驾驭的共和党几乎无法就几件事达成一致。但其中之一就是几乎一致对烦人的算术定律感到沮丧。例如,削减未来的税收将减少未来的税收收入,这让他们永远感到不满。”据兰佩尔称,支持延长企业减税的共和
Breaking the Scaling Code: How AI Models Are Redefining the Rules
近年来,人工智能取得了长足进步。曾经在基本任务上举步维艰的模型现在擅长解决数学问题、生成代码和回答复杂问题。这一进步的核心是扩展定律的概念——这些规则解释了人工智能模型在成长、接受更多数据训练或获得支持时如何改进 […] 打破扩展代码:人工智能模型如何重新定义规则一文首先出现在 Unite.AI 上。
VC Head Reveals "Most Important Graph Ever Conceived"
VC 负责人揭示“有史以来最重要的图表” 美国商人和风险投资家 Stephen Jurvetson 在 X 上的一篇文章中阐述了摩尔定律在计算能力进步方面超过一个世纪的历史。Jurvetson 是 Future Ventures 的创始人,曾为 Skype、SpaceX、Tesla、Zoox、Boring Company 和其他初创公司提供资金,他用颜色标记了从机械到继电器到真空管到晶体管再到集成电路的转变。他指出,“摩尔定律最近从 GPU(绿点)过渡到 ASIC(黄点和橙点),而 NVIDIA Hopper 架构本身就是一个过渡物种——从 GPU 到 ASIC,8 位性能针对 AI 模型进行
The Coldest Place in the Universe Is Unlocking Antimatter Mysteries
在一个寒冷的意大利实验室里,科学家们利用极冷和古老的材料来挑战现有的物理定律。他们的研究旨在探测无中微子双重贝塔衰变等现象,可能会重新定义人们对宇宙中物质和反物质的理解,让学生参与开创性的实验。探索宇宙的奥秘:意大利实验室 位于 [...] 的地下实验室
New “Quantum Spin Liquid” Discovery Opens Doors to Uncharted Magnetic Realms
科学家们率先研发出一种基于钌的新材料,这种材料表现出复杂、无序的磁性,类似于量子自旋液体(一种难以捉摸的物质状态)所预测的磁性。这项研究的突破表明,开发超越经典物理定律的量子材料具有巨大的潜力,为量子 [...]
Is the Universe Defying Einstein? New Discoveries Challenge Relativity
科学家通过计算时间和空间的扭曲来测试这位著名物理学家的预测。宇宙的膨胀为什么会加速?即使在发现 25 年后,这仍然是科学界最深奥的谜团之一。要解开这个谜团,需要仔细研究物理学的基本定律,包括阿尔伯特·爱因斯坦的广义相对论。来自大学的研究人员 [...]