错误报告关键词检索结果

每周回顾 2024 年 12 月 20 日

Weekly Review 20 December 2024

我上周在 Twitter 上发布的一些有趣的链接(我也在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):如果人们一直说他们已经实现了通用人工智能,那么最终这可能是真的:https://futurism.com/openai-employee-claims-agi 看起来 OpenAI 还没有学会使用受版权保护的数据来训练其人工智能:https://www.extremetech.com/gaming/openai-appears-to-have-trained-sora-on-game-content 微软希望在澳大利亚和新西兰培训一百万人掌握人工

战略线性上下文老虎机

Strategic Linear Contextual Bandits

受战略代理操纵推荐系统以最大化向用户推荐的次数这一现象的启发,我们研究了线性上下文强盗问题的一个战略变体,其中手臂战略性地向学习者错误报告私下观察到的上下文。% 在战略背景操纵下。我们将算法设计问题视为不确定性下的 \emph{机制设计} 问题之一,并提出了乐观严峻触发机制 (OptGTM),该机制可最大限度地减少遗憾,同时激励代理大致诚实。我们表明……