推理关键词检索结果

使用大型推理容器

Deploy DeepSeek-R1 distilled models on Amazon SageMaker using a Large Model Inference container

在SageMaker AI上部署DeepSeek模型为寻求在其应用程序中使用最先进的语言模型的组织提供了强大的解决方案。在这篇文章中,我们展示了如何在SageMaker AI中使用蒸馏型,该模型提供了几种选择R1模型的蒸馏版本。

优化诸如DeepSeek之类的推理模型,并在Amazon Bedrock上及时优化

Optimize reasoning models like DeepSeek with prompt optimization on Amazon Bedrock

在这篇文章中,我们使用Amazon Bedrock上的迅速优化来演示如何优化诸如DeepSeek-R1之类的推理模型。

抹布后的演变:AI从信息检索到实时推理的旅程像DeepSeek这样的新兴生成的AI模型如何塑造全球业务格局

How Emerging Generative AI Models Like DeepSeek Are Shaping the Global Business Landscape

即使在人工智能(AI)等快速发展的部门中,DeepSeek的出现也引发了冲击波,迫使商业领导者重新评估其AI策略。 DeepSeek的到来加强了在董事会和政府机构中的讨论,对技术的轨迹和含义提出了挑战。但是,有一件事变得越来越清楚:[…]等高级模型(如帖子)如何在unite.ai上首先出现了诸如DeepSeek(例如DeepSeek)的新兴生成AI模型。

Neubird的首席执行官兼联合创始人 GOU RAO - 访谈系列 Akool Avatar评论:最寿命的AI头像吗? 菲尔·汤姆林森(Phil Tomlinson),高级副总裁,Taskus全球产品 - 访谈系列 超越云:探索本地部署的收益和挑战 VIBE编码:AI如何永远更改软件开发 ai奇异性和摩尔定律的终结:自学机器的崛起 将近80%的培训数据集可能是企业AI 的法律危害 为什么创造者在多平台时代需要AI 户外市场AI获得了470万美元,以通过AI驱动的情报彻底改变商业保险 抹布后的演变:AI从信息检索到实时推理的旅程 像DeepSeek这样的新兴生成的AI模型如何塑造全球业务格局

Gou Rao, CEO & Co-Founder of NeuBird – Interview Series

goutham(gou)rao是Neubird的首席执行官兼联合创始人,Neubird是霍基(Hawkeye)的创建者,霍基(Hawkeye)是世界上第一位发电的AI驱动的ITOPS工程师,旨在帮助IT团队立即诊断和解决技术问题,从而实现人类团队和AI之间的无缝协作。 Rao是具有良好往绩记录的连续企业家,已共同创立并成功地退出了多家公司。 […] Neubird的首席执行官兼联合创始人 - 访谈系列首次出现在Unite.ai上。

AI推理模型可以作弊以赢得国际象棋游戏

AI reasoning models can cheat to win chess games

面对国际象棋的失败,最新一代的AI推理模型有时会作弊而不会被指示这样做。该发现表明,下一波AI模型更有可能寻找欺骗性的方法来做他们被要求做的事情。最糟糕的是?没有简单的方法来……

M2R2:有效变压器推理的多率残差的混合物

M2R2: Mixture of Multi-Rate Residuals for Efficient Transformer Inference

残差转换增强了大语言模型(LLMS)的代表性深度和表达能力。但是,在自动回归产生中应用所有代币的静态残差转换会导致推理效率和产生忠诚度之间的次优折衷。现有方法,包括早期退出,跳过解码和深入的混合物,通过根据令牌级的复杂性调节剩余转换来解决此问题。尽管如此,这些方法主要考虑由代币通过模型层所穿越的距离,忽略了…

DeepSeek级AI?只需7个简单的步骤即可培训您自己的推理模型!

DeepSeek-Level AI? Train Your Own Reasoning Model in Just 7 Easy Steps!

谁需要超级计算机?仅使用15GB VRAM培训自己强大的AI推理模型!

使用其多模式的视频理解模型推理

ByteDance processes billions of daily videos using their multimodal video understanding models on AWS Inferentia2

在Byedan​​ce上,我们与Amazon Web Services(AWS)合作部署了多模式大语言模型(LLMS),以在世界各地的多个AWS地区使用AWS推理AWS来理解视频理解。通过使用复杂的ML算法,该平台每天有效地扫描数十亿个视频。在这篇文章中,我们讨论了多模式LLM的使用用于视频理解,解决方案体系结构以及性能优化的技术。

imandrax:神经符号AI推理和自动逻辑验证的突破

ImandraX: A Breakthrough in Neurosymbolic AI Reasoning and Automated Logical Verification

Imandra Inc.宣布发布Imandrax,这是其在神经肌bolic型AI推理方面的最新进步。这个具有里程碑意义的版本在证明自动化,反例生成和决策程序方面引入了尖端功能,为AI驱动的逻辑分析设定了新的行业标准。随着AI系统越来越多地跨行业进行关键任务的应用程序,例如Imandrax:Imandrax:神经偶然AI推理和自动逻辑验证的突破,首先出现在Unite.ai上。

强化学习符合思想链:将LLMS转化为自主推理代理

Reinforcement Learning Meets Chain-of-Thought: Transforming LLMs into Autonomous Reasoning Agents

大型语言模型(LLMS)具有明显的高级自然语言处理(NLP),在文本生成,翻译和摘要任务方面表现出色。但是,他们参与逻辑推理的能力仍然是一个挑战。传统的LLM旨在预测下一个单词,依靠统计模式识别而不是结构化推理。这限制了他们解决复杂问题的能力[…]强化后的学习符合经济链:将LLMS转化为自主推理代理商,首先出现在Unite.ai上。

使用Amazon BedRock Guardrails的自动推理检查构建可验证的解释性

Build verifiable explainability into financial services workflows with Automated Reasoning checks for Amazon Bedrock Guardrails

在这篇文章中,我们探讨了如何通过各种常见的FSI方案(例如保险法律分解,承保规则验证和索赔处理)来工作。

llms不是推理的 - 他们真的很擅长计划

LLMs Are Not Reasoning—They’re Just Really Good at Planning

大型语言模型(LLMS),例如OpenAI的O3,Google的Gemini 2.0和DeepSeek的R1,在解决复杂问题,产生类似人类的文本甚至精确编写代码方面表现出了很大的进步。这些先进的LLM通常被称为“推理模型”,因为它们可以分析和解决复杂问题的非凡能力。但是,这些模型实际上是理由的,[…] LLMS并不是推理 - 他们真的很擅长于unite.ai首先出现。

使用 Amazon SageMaker AI 上的 Medusa-1 将 LLM 推理速度提高约 2 倍

Achieve ~2x speed-up in LLM inference with Medusa-1 on Amazon SageMaker AI

研究人员开发了 Medusa,这是一个通过添加额外头来同时预测多个标记以加快 LLM 推理速度的框架。这篇文章演示了如何使用框架的第一个版本 Medusa-1 通过在 Amazon SageMaker AI 上对其进行微调来加速 LLM,并通过部署和简单的负载测试确认了加速效果。Medusa-1 在不牺牲模型质量的情况下实现了约两倍的推理加速,具体改进取决于模型大小和使用的数据。在这篇文章中,我们通过在样本数据集上观察到 1.8 倍的加速来证明其有效性。

构建建筑分析的未来:CONXAI 在 Amazon EKS 上的 AI 推理

Building the future of construction analytics: CONXAI’s AI inference on Amazon EKS

CONXAI Technology GmbH 正在率先为建筑、工程和施工 (AEC) 行业开发先进的 AI 平台。在这篇文章中,我们深入探讨了 CONXAI 如何使用 Amazon Simple Storage Service (Amazon S3)、Amazon Elastic Kubernetes Service (Amazon EKS)、KServe 和 NVIDIA Triton 在 AWS 上托管最先进的 OneFormer 细分模型。

什么是代理推理:AI 代理如何思考、学习和做出决策?

What is Agentic Reasoning: How AI Agents Think, Learn, and Make Decisions ?

自主 AI 不再是一个未来的概念——它已经到来,正在改变行业。但是,什么使 AI 真正自主?代理推理使系统能够超越执行任务,独立解决复杂问题、适应变化并在不确定性中蓬勃发展。考虑电子商务中的 AI 代理实时动态调整库存。在黑色星期五期间,它可以分析实时销售数据、预测需求激增,并将库存从低绩效仓库重新分配到高需求地区。这种动态决策无需人工干预即可优化运营。代理推理的核心是结合机器学习、认知架构和实时反馈,以模仿类似人类的适应性。它处理结构化和非结构化数据,识别模式并迭代改进策略。为什么这很重要?代理推理支持自主业务流程、自适应客户支持和智能任务编排——而静态 AI 模型则不足。随着我们探索其构建

通过扭曲顺序蒙特卡罗对数学问题进行分步推理

Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo

增强大型语言模型 (LLM) 的多步推理能力一直是一个持续的挑战。最近,验证已显示出通过评估生成的输出来提高解决方案一致性的希望。然而,当前的验证方法存在采样效率低下的问题,需要大量样本才能达到令人满意的性能。此外,训练有效的验证者通常依赖于广泛的过程监督,而这需要高昂的成本。在本文中,我们通过引入一种基于 Twisted 的新型验证方法来克服这些限制...

OpenAI 免费发布其新的 o3-mini 推理模型

OpenAI releases its new o3-mini reasoning model for free

周四,微软宣布将向其 Copilot 用户推出 OpenAI 的推理模型 o1,现在 OpenAI 正在向使用免费版 ChatGPT 的用户发布一种新的推理模型 o3-mini。这将标志着绝大多数人首次能够使用 OpenAI 的推理模型之一……

优化 AI 响应能力:Amazon Bedrock 延迟优化推理实用指南

Optimizing AI responsiveness: A practical guide to Amazon Bedrock latency-optimized inference

在本文中,我们将探讨 Amazon Bedrock 延迟优化推理如何帮助解决在 LLM 应用程序中保持响应能力的挑战。我们将深入探讨优化应用程序性能和改善用户体验的策略。无论您是构建新的 AI 应用程序还是优化现有的应用程序,您都会找到有关延迟优化技术方面和实际实施方法的实用指导。我们首先解释 LLM 应用程序中的延迟。