RLHF关键词检索结果

#490 – 2026 年人工智能现状:法学硕士、编码、扩展法律、中国、代理、GPU、AGI

#490 – State of AI in 2026: LLMs, Coding, Scaling Laws, China, Agents, GPUs, AGI

Nathan Lambert 和 Sebastian Raschka 是机器学习研究人员、工程师和教育家。 Nathan 是艾伦人工智能研究所 (Ai2) 的培训后负责人,也是《RLHF 书》的作者。 Sebastian Raschka 是《Build a Large Language Model (From Scratch)》和《Build a Reasoning Model (From Scratch)》的作者。感谢您的聆听 ❤ 查看我们的赞助商:https://lexfridman.com/sponsors/ep490-sc 请参阅下面的时间戳、成绩单,并提供反馈、提交问题、联系 Lex

根据设计师反馈改进用户界面生成模型

Improving User Interface Generation Models from Designer Feedback

尽管接受过大量数据的培训,大多数法学硕士仍无法可靠地生成设计良好的 UI。设计师的反馈对于提高 UI 生成的性能至关重要;然而,我们发现现有的基于评级或排名的 RLHF 方法与设计师的工作流程并不一致,并且忽略了用于批评和改进 UI 设计的丰富原理。在本文中,我们研究了设计师使用评论、草图和直接操作等熟悉的交互方式向 UI 生成模型提供反馈的几种方法。我们首先对 21 进行了一项研究...