#490 – State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI
Nathan Lambert 和 Sebastian Raschka 是机器学习研究人员、工程师和教育家。 Nathan 是艾伦人工智能研究所 (Ai2) 的培训后负责人,也是《RLHF 书》的作者。 Sebastian Raschka 是《Build a Large Language Model (From Scratch)》和《Build a Reasoning Model (From Scratch)》的作者。感谢您的聆听 ❤ 查看我们的赞助商:https://lexfridman.com/sponsors/ep490-sc 请参阅下面的时间戳、成绩单,并提供反馈、提交问题、联系 Lex
Appendix: Political categorization
在本次分析中,我们将人们分为两类政治类别:支持本国执政政党的人和不支持执政政党的人。这些类别是根据进行调查时的一个或多个执政党以及受访者对问题的回答来编码的[...]
How to Create Production-Ready Code with Claude Code
了解如何使用编码代理编写健壮的代码。如何使用 Claude Code 创建生产就绪代码的帖子首先出现在 Towards Data Science 上。
韩国三种Gloydius 物种毒液蛋白和转录本的全面分子表征和比较摘要在韩国,Gloydius brevicaudus、G. ussuriensis 和G. intermedius 是引起人类中毒的主要有毒物种。尽管这些物种属于同一属,但它们的毒液会引起不同的临床症状,并且抗蛇毒血清的疗效不一致,强调需要针对物种特异性的治疗策略。然而,韩国 Gloydius 物种的全面分子和毒理学分析仍未得到探索。在本研究中,我们使用二维凝胶电泳和 MALDI-TOF 质谱定量区分了三种 Gloydius 物种的毒液。结果显示,每个物种都进化出了不同的毒液蛋白质谱。为了进一步研究它们的表达调控,我们鉴定了编码
The Top 10 LLM Evaluation Tools
LLM 评估工具可帮助团队衡量模型在各种任务中的执行情况,包括推理、总结、检索、编码和指令遵循。他们分析性能趋势,检测幻觉,根据实际情况验证输出,并在微调或即时工程期间对改进进行基准测试。如果没有强大的评估框架,组织就会面临部署不可预测或有害人工智能的风险……阅读更多»“十大法学硕士评估工具”一文首先出现在《大数据分析新闻》上。
Is the Apple M6 MacBook Pro Worth the Upgrade? Expert Insights
Apple M6 MacBook Pro 已经上市,它已经引发了科技爱好者和专业人士的争论。苹果的新款 M6 芯片承诺更快的速度、更高的效率和增强的图形功能,许多人想知道这次升级是否真的值得投资。从纸面上看,M6 MacBook Pro 看起来像是一款专为要求严格的工作流程(从视频编辑到软件开发)而打造的强大设备。但它是否提供了足够的改进来证明您可以放弃当前的 MacBook?在本文中,我们将探讨 Apple M6 MacBook Pro、其性能、主要功能、设计和整体价值,以帮助您确定 M6 MacBook Pro 是否是提高您的生产力和创造力的正确选择。 Apple M6 MacBook P
Coding the Pong Game from Scratch in Python
使用 OOP 和 Turtle 在 Python 中实现经典的 Pong 游戏在 Python 中从头开始编码 Pong 游戏的帖子首先出现在 Towards Data Science 上。
Weekly Review 27 February 2026
我上周在 Twitter 上发布的一些有趣的链接(我还在 Mastodon、Threads、Newsmast 和 Bluesky 上发布了这些链接):Greenwashing 与任何其他行业一样适用于 AI:https://www.theguardian.com/technology/2026/feb/17/tech-companies-traditional-ai-generative-climate-breakdown-report 目前还没有新西兰律师被发现使用 AI 生成其提交的材料: https://www.leightonassociates.co.nz/post/no-nz-la
Learnings from COBOL modernization in the real world
实现成功的 COBOL 现代化需要一种解决方案,该解决方案可以确定性地进行逆向工程,生成经过验证和可追踪的规范,并帮助这些规范流入任何人工智能驱动的编码助手以进行正向工程。成功的现代化需要逆向工程和正向工程。在这篇文章中了解有关 COBOL 的更多信息。
Why I have changed my mind about AI and you should too
支持者和怀疑者都对 ChatGPT 等人工智能工具抱有强烈的看法,但在对 Vibe 编码进行实验后,我意识到两个阵营都是错误的,Jacob Aron 说
CISA gives federal agencies three days to patch actively exploited Dell bug
RecoverPoint 中的硬编码凭据缺陷已在间谍活动中被滥用山姆大叔的网络防御者只给联邦机构三天的时间来修补最严重的戴尔漏洞,该漏洞至少自 2024 年中期以来一直在被积极利用。
BetonRed Hazard – Wasza Brama wejściowa do Ekscytującej Zabawy Online
内容摘要 所提供的在线赌场的许可和安全 广泛的随机游戏 奖金系统和特别优惠 存款和取款选项 专业的用户服务 所提供的网站的许可和安全 我们根据著名的库拉索岛电子游戏监管机构颁发的合法许可证(许可证号 8048/JAZ)进行运营,该许可证验证了我们的信誉和对全球赌场行业要求的尊重。 BetonRed Logowanie 使用创新的 128 位 SSL 编码机制,保证充分保护可用玩家的用户数据和支付转账。确保资金安全是首要任务...继续阅读“BetonRed Hazard - 您通往令人兴奋的在线乐趣的入门大门”
AI showdown: GPT‑5.3-Codex vs Claude Opus 4.6
OpenAI 和 Anthropic 正在重新定义人工智能的功能,推出能够处理从编码到多步骤知识工作等复杂任务的模型。凭借代理协作、长上下文推理和自主解决问题等功能,这些升级展示了人工智能作为跨专业工作流程的智能数字协作者的潜力。
Launch Your MVP Fast with ChatGPT
为什么重要:使用 ChatGPT 快速启动您的 MVP,并将想法快速转化为原型,创始人无需编码。
Gemini Diagnosed Plex Server Flaws
为什么重要:Gemini 诊断的 Plex 服务器缺陷展示了 AI 如何查明元数据和编码问题以提高性能。
下面是研究人员开发和使用的编码方案,用于对开放式问题“什么让您感到自豪(调查国家)?请尽可能详细地分享”这一开放式问题的答案进行编码。每个代码列出的关键字代表了指示如何对信息单元进行编码的示例,而不是[…]帖子附录 C:密码本首先出现在皮尤研究中心。
Appendix D: Political categorization
在本次分析中,我们将人们分为两类政治类别:认同本国执政政党的人和不认同执政政党的人。这些类别是根据调查进行时的一个或多个执政党派以及受访者对问题的回答进行编码的[…]帖子附录D:政治分类首先出现在皮尤研究中心。
Google DeepMind wants to know if chatbots are just virtue signaling
Google DeepMind 呼吁对大型语言模型的道德行为(例如它们在被要求充当同伴、治疗师、医疗顾问等时的行为)进行与编码或数学能力相同的严格审查。随着法学硕士的进步,人们要求他们玩更多……