D-ID 推出 V4 Expressive Visual Agents 用于实时 AI 交互

V4 化身结合了低延迟和高性价比的性能、扩散驱动的表达传递以及实时用户参与和长格式企业视频的一致身份。本文首次发表在 eLearning Industry 上。

来源:eLearning行业 | 在线教育博客

纽约,2026 年 3 月 16 日——企业级人工智能化身解决方案的领导者 D-ID 今天宣布推出 V4 Expressive Visual Agents,这是新一代超高保真数字人类,专为实时、LLM 连接的对话以及脚本化的长格式企业视频内容而设计。

V4 Expressive Visual Agents 基于新的基于扩散的模型构建,并根据真实演员捕获的表演进行训练,可在高达 4K 的分辨率下提供更快的生成、低延迟(低于 0.5 秒)的对话轮次和高精度的口型同步,从而实现富有表现力的自然交互,并在企业用例中可靠地扩展。

V4 虚拟形象现已面向 1500 家企业客户和数百万订阅者推出,专为低延迟交付而设计,使其适合实时对话体验以及较长形式的内容,例如培训模块、讲解器和多语言教育视频。迄今为止,已经使用以前的 D-ID 模型创建了超过 800,000 个视觉代理和 3 亿个非交互式化身。推出后,所有 D-ID 计划的用户都可以使用 V4 Expressive Visual Agent,每月起价仅为 5.90 美元,展示了 V4 AI 模型突破性的成本效率。

研究表明,类人的面部线索可以改善知识转移、保留和理解。因此,企业越来越多地采用高保真化身进行入职、培训、客户参与和内部沟通,特别是在清晰度、信任和一致性很重要的情况下。

继 2025 年 9 月收购 simpleshow 后,D-ID 扩大了其企业分销足迹,并将其 AI 化身功能集成到 simpleshow 的企业培训和讲解视频生态系统中。此后,D-ID 的 ARR 增长了 250%,反映出交叉销售的扩张以及企业对交互式 AI 驱动视频的需求增加。