Merging Language Models with Unsloth Studio
使用 Unsloth Studio 的无代码 GUI 轻松合并法学硕士,并组合模型而无需重新训练。
Gradient-based Planning for World Models at Longer Horizons
GRASP 是一种新的基于梯度的学习动态规划器(“世界模型”),它通过以下方式使长视野规划变得实用:(1) 将轨迹提升到虚拟状态,以便优化在时间上是并行的;(2) 直接向状态迭代添加随机性以进行探索;(3) 重塑梯度,以便动作获得清晰的信号,同时我们通过高维视觉模型避免脆弱的“状态输入”梯度。大型学习世界模型的能力越来越强。他们可以预测高维视觉空间中未来观察的长序列,并以几年前难以想象的方式概括任务。随着这些模型的扩展,它们开始看起来不再像特定于任务的预测器,而更像通用模拟器。但是拥有强大的预测模型并不等于能够有效地将其用于控制/学习/规划。在实践中,现代世界模型的长期规划仍然脆弱:优化变
A model for defect identification in materials
作者:Zach Winn 在生物学中,缺陷通常都是不好的。但在材料科学中,可以有意地调整缺陷,从而赋予材料有用的新特性。如今,在钢铁、半导体和太阳能电池等产品的制造过程中小心地引入原子级缺陷,以帮助提高强度、控制导电性、优化性能等。但即使 [...]
Standard-Based Grading Offers a Different Model of Assessing Student Learning
一些学区,包括缅因州、新墨西哥州、爱荷华州和俄勒冈州的学区,正在转向基于标准的评分,根据学生学习的技能和概念而不是整个学年作业和测试中积累的分数来评分。杰里德·克鲁斯 (Jerrid Kruse) 是德雷克大学 (Drake University) 的教育学教授,研究人们如何学习和教学 [...]
What is Mythos and why are experts worried about Anthropic’s AI model
该公司表示 Mythos 太危险,无法公开发布。网络安全专家一致认为该模型的功能很重要,但并非所有人都认同最令人震惊的说法
Nvidia представила модели ИИ для управления квантовыми процессорами
一系列新模型有望在执行计算任务之前从根本上加快量子位的校准速度。
Which AI Models Have Any Sense of Humor and Sarcasm?
我之前的帖子是对特朗普情绪的幽默、讽刺的审视。这是两个人工智能的回应。
Airbus’ autonomous supply-helicopter effort may pave the way for an armed model
自动感知测试涉及 Shield AI、L3 Harris 和 Parry Labs 的技术。
Bank of England: Andrew Bailey warns AI models could ‘crack’ cyber systems
英国央行行长安德鲁·贝利警告称,一家硅谷公司设计的新人工智能模型可能会“破解”网络安全系统,并补充说该技术对关键机构构成了持续的挑战。贝利在纽约的一次活动中发表讲话时表示,由 Anthropic 创建的 Mythos Claude 对 [...]
Researchers use large language models to discover recipes for novel materials
法学硕士可以发现最佳的分步说明,以加速新材料的发现。
AI remains lacking in clinical reasoning abilities, according to study of 21 large language models
一项研究表明,虽然人工智能可以正确诊断疾病,但它在临床推理方面存在困难,特别是在制定鉴别诊断方面。研究人员强调医疗人工智能应用中需要人工监督。
Russia displays Mock-up of Tu-454 All-New Long-haul Passenger Airliner
图波洛夫 Tu-454 宽体远程客机模型在展会上亮相
Your Model Isn’t Done: Understanding and Fixing Model Drift
生产模型如何随着时间的推移而失败,以及如何在它破坏信任之前捕获并修复它。您的模型尚未完成:理解和修复模型漂移一文首先出现在走向数据科学上。
LaCy: What Small Language Models Can and Should Learn is Not Just a Question of Loss
本文在 ICLR 基于 LLM 的代理系统内存研讨会上被接受。语言模型不断发展,将更多的世界知识压缩到其参数中,但可以预训练到其中的知识受到其参数大小的上限。特别是小语言模型(SLM)的容量是有限的,导致实际上不正确的生成。这个问题通常可以通过让 SLM 访问外部源来缓解:查询更大模型、文档或数据库的能力。在此背景下,我们研究的根本问题是……
New technique makes AI models leaner and faster while they’re still learning
研究人员利用控制理论在训练过程中消除人工智能模型不必要的复杂性,从而在不牺牲性能的情况下降低计算成本。
University's AI Model Could Help Coast Guard Avoid Arctic Ice
密歇根大学学生团队创建了一个人工智能模型,可以提高海岸警卫队在北极冰冷水域航行的能力。