form关键词检索结果

大规模 Transformer 模型的高效部署:可扩展和低延迟推理策略

Efficient Deployment of Large-Scale Transformer Models: Strategies for Scalable and Low-Latency Inference

将基于 Transformer 的模型扩展到超过 1000 亿个参数已在自然语言处理领域取得突破性成果。这些大型语言模型在各种应用中都表现出色,但由于生成推理的顺序性,每个 token 的计算都依赖于前面的 token,因此有效部署它们带来了挑战。这需要细致的并行布局和内存。《高效部署大规模 Transformer 模型:可扩展和低延迟推理策略》一文首先出现在 AI Quantum Intelligence 上。

NVIDIA 研究人员推出 MambaVision:一种专为视觉应用量身定制的新型混合 Mamba-Transformer 主干

NVIDIA Researchers Introduce MambaVision: A Novel Hybrid Mamba-Transformer Backbone Specifically Tailored for Vision Applications

计算机视觉使机器能够解释和理解来自世界的视觉信息。这包括各种任务,例如图像分类、对象检测和语义分割。通过开发先进的神经网络架构,特别是卷积神经网络 (CNN) 和最近的 Transformers,推动了该领域的创新。这些模型已经展示了显著的效果。NVIDIA 研究人员推出 MambaVision:专为视觉应用量身定制的新型混合 Mamba-Transformer 主干首次出现在 AI Quantum Intelligence 上。

[鱼类学 • 2024] Microdous hanlini • 中国广西细齿睡虾(Gobiiformes:Odontobutidae)的一个新种

[Ichthyology • 2024] Microdous hanlini • A New Species of the fine-toothed Sleepers (Gobiiformes: Odontobutidae) from Guangxi, China

Microdous hanlini Wang, He & Li,in Wang, Wei, He et Li, 2024. DOI: 10.11646/zootaxa.5477.3.6摘要Microdous (Gobiiformes: Odontobutidae) 是分布于中国南部和越南的一属淡水栖息动物。该属中有两个描述种,M. chalmersi 广泛分布于中国海南岛和广西省,M. amblyrhynchos 分布范围非常狭窄,仅分布于广西百色。据报道,广西的 M. chalmersi 可能是一种隐蔽种,与海南的 M. chalmersi 不同。本文,我们将广西的隐蔽种描述为一个新种 Mi

TensorFlow Transform:确保生产中的无缝数据准备

TensorFlow Transform: Ensuring Seamless Data Preparation in Production

利用 TensorFlow Transform 扩展用于生产环境的数据管道照片由 Suzanne D. Williams 在 Unsplash 上拍摄数据预处理是任何机器学习管道的主要步骤之一。Tensorflow Transform 可帮助我们在分布式环境中通过庞大的数据集实现它。在进一步介绍数据转换之前,数据验证是生产管道流程的第一步,这已在我的文章《在生产管道中验证数据:TFX 方式》中介绍过。请阅读本文以更好地理解本文。我已在此演示中使用 Colab,因为配置环境更容易(也更快)。如果您处于探索阶段,我也会推荐 Colab,因为它可以帮助您专注于更重要的事情。ML 管道操作从数据提取和

Terraform Fork OpenTofu 1.7.0 带来状态加密等功能

Terraform Fork OpenTofu 1.7.0 Brings State Encryption and More

OpenTofu 1.7.0 已发布。OpenTofu 是一种开源基础设施即代码工具,用于使用各种 API 声明式云基础设施创建。它是去年从 HashiCorp 的 Terraform 分叉而来,此前后者的许可证发生了变化。新版本引入了几个重要的功能和改进。作者:Matt Saunders

Transformers 推理能力有多强?局部屏障和归纳便笺簿

How Far Can Transformers Reason? The Locality Barrier and Inductive Scratchpad

Transformers 能否通过组合已建立的三段论来预测新的三段论?更一般地说,这些模型可以从头开始学习什么类型的目标?最近的研究表明,Transformers 在表达能力方面可以是图灵完备的,但这并没有解决可学习性目标。本文提出了分布局部性的概念,以捕捉常规 Transformers 何时可以有效实现弱学习,其中局部性除了标记直方图之外还测量与目标非平凡相关的所需最少标记数。如实验所示……

[鸟类学 • 2024] Caprimulgus ritae • 来自帝汶和韦塔尔、小巽他群岛、华莱士的夜鹰新种(Caprimulgiformes:Caprimulgidae)

[Ornithology • 2024] Caprimulgus ritae • A New Species of Nightjar (Caprimulgiformes: Caprimulgidae) from Timor and Wetar, Lesser Sunda Islands, Wallacea

Caprimulgus ritaeKing, Sangster, Trainor, Irestedt, Prawiradilaga & Ericson, 2024 帝汶夜鹰 | Cabak Timor || DOI: 10.1111/ibi.13340 Researchgate.net/publication/381669747photo by James Eaton摘要Caprimulgus macrurus 复合群的夜鹰分布于巴基斯坦至澳大利亚,包含六种形态相似但声音不同的物种。在小巽他群岛的帝汶和韦塔尔进行的实地考察发现了该复合群中的第七种物种,我们将其描述为新物种。该物种之前曾与 Ca

Army Spouses: They Don’t Have Uniforms but Wear Many Hats

Army Spouses: They Don’t Have Uniforms but Wear Many Hats

从 5 月份的军人配偶感恩月庆祝活动可以看出,需要一支军队来支持我们的士兵——一支由敬业的配偶组成的军队……

探索微观世界:P. fusiformis (PyroDinos) 的迷人图像

Exploring the Microscopic World: Captivating Images of P. fusiformis (PyroDinos)

生物学家和摄影师 Desi Morrison 揭开了令人惊叹的微观图像集,以我们的 PyroDinos 为特色更多

“信息安全和IT初创企业交流”:“Business Petersburg”和“Gazinformservice”的更新项目已经启动

«Биржа ИБ и IT-стартапов»: стартовал обновленный проект от «Делового Петербурга» и «Газинформсервиса»

Победитель получит на реализацию проекта 1 млн рублей.

基于 Transformer 的 ASR N-Best 重新评分和重写模型

Transformer-based Model for ASR N-Best Rescoring and Rewriting

语音助手越来越多地使用设备上的自动语音识别 (ASR) 来确保速度和隐私。然而,由于设备的资源限制,涉及复杂信息域的查询通常需要搜索引擎进一步处理。对于这样的应用,我们提出了一种基于 Transformer 的新型模型,该模型能够通过并行探索 N 个最佳假设的完整上下文来重新评分和重写。我们还提出了一种新的判别序列训练目标,它可以很好地用于重新评分和重写任务。我们表明我们的 Rescore+Rewrite 模型优于……

人脑代替人工智能芯片:Neuroplatform 消除了道德界限

Человеческий мозг вместо ИИ-чипов: Neuroplatform стирает границы этики

Машины учатся думать как люди... в буквальном смысле.

USAG 意大利团队与 Ready and Resilient Performance Center 合作为士兵提供支持

USAG Italy teams with Ready and Resilient Performance Center to support Soldiers

在维琴察军事社区最近的一次弹性培训活动中,绩效专家 Eric Urrutia 举办了公共卫生活动课程...

Un nuevo informe presenta un planintegration para alcanzar los objetivos de cerocarbono neto en Estados Unidos y garantizar una transición energética justa y equaltativa

Un nuevo informe presenta un plan integral para alcanzar los objetivos de cero carbono neto en Estados Unidos y garantizar una transición energética justa y equitativa

Un nuevo informe de las Academias Nacionales de Ciencias, Ingeniería y Medicina ofrece una serie amplia de un plan full para encamanar a Estados Unidos hacia la consecución de sus objetivos de cero emsiones de Carbono para para 2050 y garantizar que todos los国家将受益于能源转型和公平。

如何使用 Terraform 在 AWS 上设置 MLflow:分步指南

How to Set Up MLflow on AWS with Terraform: A Step-by-Step Guide

部署机器学习模型可能令人生畏,尤其是在考虑托管模型的最佳环境时。AWS 和 GCP 提供了强大的云平台,但设置过程差异很大。最近,我们编写了有关在 Google Cloud Platform 上部署 MLflow 的指南,现在我们将分享有关设置 MLflow 的全面分步指南 […]文章如何使用 Terraform 在 AWS 上设置 MLflow:由 DLabs.AI 提供的分步指南。

作家在 Ready and Resilient Performance Center 的帮助下组建团队

Writer builds team with help from Ready and Resilient Performance Center

路易斯安那州约翰逊堡 — 陆军经常谈论弹性,但这到底意味着什么?据美国陆军预防局称,Resil...

使用 Terraform 在 GCP 中部署 MLflow:分步指南

Deploying MLflow in GCP Using Terraform: A Step-by-Step Guide

管理和部署 ML 基础架构的复杂性不断增加,确实令人生畏。前段时间,我们分享了“在 Google Cloud Platform 上设置 MLflow 的分步指南”,该指南广受好评。然而,随着时间的推移,技术的进步为我们提供了简化和自动化此过程的潜力 […]文章使用 Terraform 在 GCP 中部署 MLflow:由 DLabs.AI 提供的分步指南。

PEO EIS 欢迎 David Waisanen 担任 Allied Information Technology 新产品主管

PEO EIS welcomes David Waisanen as new product lead, Allied Information Technology

PEO EIS 的防御网络作战 (DCO) 于 1 月 12 日举行了授牌仪式,欢迎 David Waisanen 成为 AIT 的新产品负责人。