30B关键词检索结果

NVIDIA Nemotron 3 Nano 30B MoE 模型现已在 Amazon SageMaker JumpStart 中提供

NVIDIA Nemotron 3 Nano 30B MoE model is now available in Amazon SageMaker JumpStart

今天,我们很高兴地宣布,具有 3B 活动参数的 NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpStart 模型目录中全面上市。您可以利用 Amazon Web Services (AWS) 上的 Nemotron 3 Nano 加速创新并提供切实的业务价值,而无需管理模型部署的复杂性。您可以使用 SageMaker JumpStart 提供的托管部署功能,通过 Nemotron 功能为您的生成式 AI 应用程序提供支持。

最高法院审理案件,关税达到 $30B

Tariff Duties Hit $30B as Supreme Court Weighs Case

美国财政部的最新消息显示,随着联邦预算赤字缩小,一月份与关税相关的海关收入激增,而最高法院则继续权衡一项法律挑战,该挑战可能决定特朗普政府是否可以保留这笔钱或必须退还这笔钱。

众议院、参议院法案将给予学校 $130B 用于设施升级

House, Senate bills would give schools $130B for facility upgrades

除了赠款之外,恢复和增强债券授权还可以为低收入学区提供更好的机会让资助问题获得通过。

俄罗斯新型Pauk-30B反FPV网将在乌克兰战区进行测试

Russia s New Pauk-30B Anti-FPV Net to be Tested in Ukraine War Zone

一家俄罗斯公司宣布计划测试新开发的反病毒

DiffuCoder:理解和改进代码生成的掩模扩散模型

DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation

扩散大语言模型 (dLLM) 是自回归 (AR) 模型的引人注目的替代品,因为它们的去噪模型在整个序列上运行。 dLLM 的全局规划和迭代细化功能对于代码生成特别有用。然而,目前 dLLM 在编码方面的训练和推理机制仍有待探索。为了揭开 dLLM 解码行为的神秘面纱并释放其编码潜力,我们系统地研究了它们的去噪过程和强化学习 (RL) 方法。我们在 130B 上训练 7B dLLM,\textbf{DiffuCoder}...