文章关键词检索结果

没有 TD 学习的 RL

RL without TD learning

在这篇文章中,我将介绍一种基于“另类”范式的强化学习 (RL) 算法:分而治之。与传统方法不同,该算法不是基于时间差(TD)学习(存在可扩展性挑战),并且可以很好地扩展到长视野任务。我们可以基于分而治之进行强化学习(RL),而不是时间差(TD)学习。问题设置:离策略RL我们的问题设置是离策略RL。让我们简单回顾一下这意味着什么。强化学习中有两类算法:在策略强化学习和离策略强化学习。同策略 RL 意味着我们只能使用当前策略收集的新数据。换句话说,每次更新策略时我们都必须丢弃旧数据。像 PPO 和 GRPO 这样的算法(以及一般的策略梯度方法)就属于这一类。离策略 RL 意味着我们没有这个限制:我

合同 AI 障碍:经济学、推理 + 即时工程

Contract AI Barriers: Economics, Reasoning + Prompt Engineering

作者:Pedram Abrari,Pramata 首席技术官。在本系列的前两篇文章中,我们介绍了从...实现价值的前六大技术挑战

美联储对大流行期间行动的责任

Federal Reserve Accountability for Actions During the Pandemic

我总体上支持央行“独立”,但这种独立是以约束和问责为代价的。因此,当中央银行美联储未能实现其目标,或者特别积极和创新地使用其权力而最终付出高昂成本时,那么美联储需要对这些负责……继续阅读美联储对大流行期间行动的责任这篇文章《美联储对大流行期间行动的责任》首先出现在《对话经济学家》上。

2025 年秋季经济展望期刊可在线免费获取

Fall 2025 Journal of Economic Perspectives Freely Available Online

自 1987 年夏季第一期以来,我一直担任《经济展望杂志》的总编辑。JEP 由美国经济协会出版,令我高兴的是,该协会早在 2011 年就决定该杂志将在网上免费提供,从当前一期一直到第一期。您可以下载个人... 继续阅读 2025 年秋季经济观点杂志可在线免费获取2025 年秋季经济观点杂志可免费在线获取,该文章首次出现在 Conversable Economist 上。

高技术移民案例

The Case for High-Skilled Immigration

李光耀于1959年至1990年间担任新加坡首任总理,为新加坡成为高收入国家奠定了基础,他曾被政治学家约瑟夫·奈问及美国与中国之间竞争的未来。正如奈在 2011 年的一篇文章中所写:有些……继续阅读高技能移民案例高技能移民案例一文首次出现在《Conversable Economist》杂志上。

赚钱:自动化您的投资

At the Money: Automate Your Investing

At The Money:与晨星公司的 Jeffrey Ptak 一起实现投资自动化(2025 年 11 月 6 日)您是否充分利用了投资自动化?只需让您的投资处于自动驾驶状态,您就可以提高回报,减少情绪化决策,并且通常会获得更好的结果。完整文字记录如下。 ~~~ 关于本周的嘉宾:...阅读更多 金钱上的文章:自动化您的投资首先出现在大图片上。

新的国民账户指南有用吗? 6. 劳工。

Are the new national accounts guidelines any good? 6. Labour.

本博客是讨论国民账户新准则的系列文章的一部分。另请参阅此处(引言)、此处(国民账户是政治账户)、此处(评估资源消耗)、此处(家庭)和此处((不那么)非正规经济)。劳工统计数据是关键的宏观经济数据集之一。它们也是 [...]

国际货币基金组织迟到了,但后来又不敢承认

IMF comes late to the party but then cannot quite admit it

在早期的博客文章 – 通货膨胀目标意味着糟糕的财政政策(2009 年 10 月 15 日) – 我概述了我之前就通货膨胀目标 (IT) 问题所做的研究。在我 2008 年与 Joan Muysken 合着的书《放弃充分就业》中,我们对这个问题进行了进一步的分析。我们发现有......

退伍军人政府在特朗普领导下失去了数千名“核心”医务人员

Veteran’s Administration has Lost Thousands of ‘Core’ Medical Staff under Trump

这篇文章已有两个多月了。它仍然与当前退伍军人管理局人手不足的问题相关,并且仍然具有相关性。退伍军人事务部的问题多年来一直存在。这不是什么新鲜事。然而,在特鲁普政府的领导下,情况变得更加恶化,因为他们采取了更积极的行动……退伍军人政府失去了特朗普领导下的数千名“核心”医务人员,这首先出现在愤怒的熊上。

吉姆·沃森安息吧

Jim Watson RIP

我看到吉姆·沃森(Jim Watson)去世的地方,他因 DNA 的沃森-克里克双螺旋结构而闻名。从传统衡量标准来看,沃森确实非常聪明。 15 岁时,他获得奖学金进入芝加哥大学,19 岁毕业,三年后在印第安纳大学获得动物学博士学位。他和克里克发表了 […] 文章《吉姆·沃森安息吧》首先出现在《愤怒的熊》上。

在具有多种农产品的模型中,在给定利润率下,效率顺序是否唯一?

Is The Order Of Efficiency Unique At A Given Rate Of Profits In Models With Multiple Agricultural Commodities?

1.0 简介这篇文章提出了两个我认为我永远无法解决的研究问题。它提出了我已经开始讨论的一个问题。2.0 多种农产品的效率顺序是否明确定义?我已经通过一个绝对地租、粗放地租和集约地租的例子进行了研究。在此示例中,效率和可出租性的顺序被唯一定义。该示例有一种工业生产的商品和一种土地生产的商品“玉米”。假设存在多种农业商品。例如,玉米和大麦都可以在陆地上生产。但假设除了土地使用之外不存在联合生产。在给定的利润率下,效率顺序是否仍然是唯一定义的?它会取决于净产出中玉米和大麦的构成,以及净产出水平吗?即使在我的例子中,我也看到哪些技术是可行的取决于净产出中铁和玉米的数量。但是多种农产品会在定义效率顺序时

一种新颖的肯定性防御

A novel affirmative defense

您是否考虑过在军事法庭上以“我对慢速驾驶过敏”为危险驾驶指控进行辩护?奇怪的是,根据英国《电讯报》的新闻报道,一名皇家海军军官在布尔福德军事法庭的审判中似乎就是这么做的。他的律师还暗示乘客的指控是捏造的,或者是类似的说法。另请参阅《每日邮报》(英国)中的一篇文章。“30203611 Lt T J GALLAGHER,HMS RALEIGH”案件似乎已于 2025 年 10 月 27 日开始,并可能持续至 11 月 14 日。与美国军事法庭不同,可以发布驾驶资格取消令,以使案件结果与考虑同一罪行的民事法院的结果保持一致。

重新开始并不平等:加拿大新移民就业市场上的歧视

Starting Over Isn’t Equal: Discrimination in the Job Market for Newcomers in Canada

来自阿富汗和哥伦比亚的两名新移民分享了他们抵达加拿大后克服就业障碍的经验。文章《重新开始并不平等:加拿大新移民就业市场中的歧视》首先出现在《影响力范围》上。

课程和评估审查

The Curriculum and Assessment Review

本博客由 Christopher Husbands 爵士教授友情撰写,他是 Higher Futures 的董事兼 HEPI 受托人。他曾担任谢菲尔德哈勒姆大学副校长。由贝基·弗朗西斯 (Becky Francis) 领导的课程和评估审查最终报告已发布。这篇文章共 196 页,其中有 16 页的建议,[…]《课程和评估审查》一文首先出现在 HEPI 上。

改变的时刻就在:降低92后大学养老金成本

The time for change is now: reducing pension costs in post-92 universities

本博客由诺森比亚大学首席人事官 Jane Embley 和副校长兼教务长 Tom Lawson 友情撰写。值得欢迎的是,政府最近的白皮书承认大学部门面临非常现实的资金压力,并概述了一些解决这些压力的措施。然而,令人相当失望的是,HEPI 上最先出现了一篇文章《改变的时刻到了:降低 92 后大学养老金成本》。

真正重要的指标:顶尖学习团队如何衡量成功

Metrics That Really Matter: How Top Learning Teams Measure Success

许多学习和发展团队对数据充满信心,但只有少数团队能够证明培训如何提高收入、保留率或质量。了解哪些指标真正能引起领导者的共鸣,如何从第一天起就将它们与 KPI 保持一致,以及为什么基线和控制组会改变 ROI 对话。这篇文章首先发表在 eLearning Industry 上。

了解您的受众:按客户类型选择电子学习内容提供商

Know Your Audience: Choosing eLearning Content Providers By Customer Type

选择正确的电子学习内容提供商首先要了解您的客户。学术机构、K-12 学校、中小企业和大型企业都有独特的目标、挑战和学习期望。通过确定这些需求,您可以选择一个提供正确内容并带来有意义结果的提供商。这篇文章首先发表在电子学习行业上。

从培训到转型:如何让学习坚持下去

From Training To Transformation: What It Takes To Make Learning Stick

大多数学习计划的重点是传授知识,但真正的转变只有当人们真正改变他们的思维和工作方式时才会发生。这种转变需要的不仅仅是精彩的内容,还需要背景、强化和领导力。这篇文章首先发表在电子学习行业上。