模型关键词检索结果

将语言模型与 Unsloth Studio 合并

Merging Language Models with Unsloth Studio

使用 Unsloth Studio 的无代码 GUI 轻松合并法学硕士,并组合模型而无需重新训练。

基于梯度的长期世界模型规划

Gradient-based Planning for World Models at Longer Horizons

GRASP 是一种新的基于梯度的学习动态规划器(“世界模型”),它通过以下方式使长视野规划变得实用:(1) 将轨迹提升到虚拟状态,以便优化在时间上是并行的;(2) 直接向状态迭代添加随机性以进行探索;(3) 重塑梯度,以便动作获得清晰的信号,同时我们通过高维视觉模型避免脆弱的“状态输入”梯度。大型学习世界模型的能力越来越强。他们可以预测高维视觉空间中未来观察的长序列,并以几年前难以想象的方式概括任务。随着这些模型的扩展,它们开始看起来不再像特定于任务的预测器,而更像通用模拟器。但是拥有强大的预测模型并不等于能够有效地将其用于控制​​/学习/规划。在实践中,现代世界模型的长期规划仍然脆弱:优化变

材料缺陷识别模型

A model for defect identification in materials

作者:Zach Winn 在生物学中,缺陷通常都是不好的。但在材料科学中,可以有意地调整缺陷,从而赋予材料有用的新特性。如今,在钢铁、半导体和太阳能电池等产品的制造过程中小心地引入原子级缺陷,以帮助提高强度、控制导电性、优化性能等。但即使 [...]

重新定义体育界的领导力:CEO 模型

Redefining leadership in athletics: The CEO model

大学体育运动已经发展。了解高等教育领导者如何应对变革。

基于标准的评分提供了评估学生学习的不同模型

Standard-Based Grading Offers a Different Model of Assessing Student Learning

一些学区,包括缅因州、新墨西哥州、爱荷华州和俄勒冈州的学区,正在转向基于标准的评分,根据学生学习的技能和概念而不是整个学年作业和测试中积累的分数来评分。杰里德·克鲁斯 (Jerrid Kruse) 是德雷克大学 (Drake University) 的教育学教授,研究人们如何学习和教学 [...]

Mythos 是什么以及专家为何担心 Anthropic 的 AI 模型

What is Mythos and why are experts worried about Anthropic’s AI model

该公司表示 Mythos 太危险,无法公开发布。网络安全专家一致认为该模型的功能很重要,但并非所有人都认同最令人震惊的说法

Nvidia推出人工智能模型来控制量子处理器

Nvidia представила модели ИИ для управления квантовыми процессорами

一系列新模型有望在执行计算任务之前从根本上加快量子位的校准速度。

哪些人工智能模型有幽默感和讽刺感?

Which AI Models Have Any Sense of Humor and Sarcasm?

我之前的帖子是对特朗普情绪的幽默、讽刺的审视。这是两个人工智能的回应。

空客的自主补给直升机努力可能为武装模型铺平道路

Airbus’ autonomous supply-helicopter effort may pave the way for an armed model

自动感知测试涉及 Shield AI、L3 Harris 和 Parry Labs 的技术。

英格兰银行:安德鲁·贝利警告人工智能模型可能“破解”网络系统

Bank of England: Andrew Bailey warns AI models could ‘crack’ cyber systems

英国央行行长安德鲁·贝利警告称,一家硅谷公司设计的新人工智能模型可能会“破解”网络安全系统,并补充说该技术对关键机构构成了持续的挑战。贝利在纽约的一次活动中发表讲话时表示,由 Anthropic 创建的 Mythos Claude 对 [...]

研究人员使用大型语言模型来发现新材料的配方

Researchers use large language models to discover recipes for novel materials

法学硕士可以发现最佳的分步说明,以加速新材料的发现。

21种大型语言模型研究表明人工智能仍缺乏临床推理能力

AI remains lacking in clinical reasoning abilities, according to study of 21 large language models

一项研究表明,虽然人工智能可以正确诊断疾病,但它在临床推理方面存在困难,特别是在制定鉴别诊断方面。研究人员强调医疗人工智能应用中需要人工监督。

俄罗斯展示Tu-454全新长途客机模型

Russia displays Mock-up of Tu-454 All-New Long-haul Passenger Airliner

图波洛夫 Tu-454 宽体远程客机模型在展会上亮相

FUZE:陆军的新 VC 模型

FUZE: The Army’s New VC Model

众所周知,陆军原型设计工作的传统方法进展缓慢,让想法落入尘埃,而势均力敌的对手......

您的模型尚未完成:理解并修复模型漂移

Your Model Isn’t Done: Understanding and Fixing Model Drift

生产模型如何随着时间的推移而失败,以及如何在它破坏信任之前捕获并修复它。您的模型尚未完成:理解和修复模型漂移一文首先出现在走向数据科学上。

LaCy:小语言模型能够并且应该学习什么不仅仅是损失的问题

LaCy: What Small Language Models Can and Should Learn is Not Just a Question of Loss

本文在 ICLR 基于 LLM 的代理系统内存研讨会上被接受。语言模型不断发展,将更多的世界知识压缩到其参数中,但可以预训练到其中的知识受到其参数大小的上限。特别是小语言模型(SLM)的容量是有限的,导致实际上不正确的生成。这个问题通常可以通过让 SLM 访问外部源来缓解:查询更大模型、文档或数据库的能力。在此背景下,我们研究的根本问题是……

新技术使人工智能模型在学习过程中变得更精简、更快

New technique makes AI models leaner and faster while they’re still learning

研究人员利用控制理论在训练过程中消除人工智能模型不必要的复杂性,从而在不牺牲性能的情况下降低计算成本。

大学的人工智能模型可以帮助海岸警卫队避开北极冰

University's AI Model Could Help Coast Guard Avoid Arctic Ice

密歇根大学学生团队创建了一个人工智能模型,可以提高海岸警卫队在北极冰冷水域航行的能力。