Ученые Группы ЦРТ третьи в решении самой сложной задачи распознавания речи
在海得拉巴举行的全球最大的语音技术会议 INTERSPEECH 上,公布了国际语音识别竞赛第五届 CHiME 语音分离与识别挑战赛 (CHiME-5) 的结果。
Real-time voice agents with Stream Vision Agents and Amazon Nova 2 Sonic
In this post, you learn how to combine Stream's Vision Agents open-source framework with Amazon Bedrock and Amazon Nova 2 Sonic to build real-time voice agents that can be production-ready in minutes. You'll learn how the integration works under the hood, walk through code examples, and explore adva
Build real-time voice streaming applications with Amazon Nova Sonic and WebRTC
构建具有实时语音交互的端到端直播应用程序面临着多项挑战。本文介绍了一种基于 Amazon Nova 2 Sonic (Nova Sonic) 和 Amazon Kinesis Video Streams WebRTC (WebRTC) 的解决方案,可解决这些挑战。在这篇文章中,我们将介绍解决方案架构、实现模式和两个现实场景示例。
Ixigo rebuilds its app from scratch with AI-voice assistant ‘Tara’ at helm
重新设计的应用程序还引入了“旅行模式”,这是一种新的内置旅行伴侣,旨在为用户的整个旅程提供帮助
I use Sonos Voice Control every day in my home - here are my 5 favorite commands
智能家居可能会让人不知所措,但这些 Sonos 命令很简单 - 而且对我的日常生活至关重要。
International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2026
Apple 将于 5 月 4 日至 8 日在西班牙巴塞罗那举行的年度国际声学、语音和信号处理会议 (ICASSP) 上展示新的研究成果。我们很荣幸再次赞助该会议,该会议汇集了专注于信号处理及其应用的科学和工业研究界。以下是 Apple 参加 ICASSP 2026 的概述。
Open Weight Text-to-Speach with Voxtral TTS
了解 Voxtral TTS 模型的工作原理、其语音克隆和低延迟性能的独特之处,以及如何仅用几行 Python 代码即可开始生成语音。
Local Whisper Audio Transcription
了解如何使用 Faster‑Whisper 和 Python 在本地擦除音频,重点是隐私优先和 CPU/GPU 就绪。
FAA Awards $5B Contract for Hundreds of Digital Voice Switches
作为空中交通管制现代化工作的一部分,该局计划安装 462 个新系统。
NASA Curiosity discovery, suicide hotline hope, the AI voice clone upper hand
NASA 好奇号火星车在火星上发现了什么,988 危机热线推出后青少年自杀率如何下降,以及人们对人工智能语音克隆的看法
SOCOM begins fielding new battlefield biometrics system
Reveal Technology 的 Identifi 平台允许操作员在现场收集指纹、面部扫描、虹膜数据和语音识别。
The Future of Physical AI Isn’t Smarter Robots, It’s Smarter Interfaces
这篇赞助文章由 Wetour Robotics 为您带来。风力涡轮机上的现场技术人员,夹住安全带,双手握住扳手,需要向挂在腰带上的诊断设备发送命令。装卸码头上的一名物流工人戴着手套,眼睛盯着托盘,需要重新调整连接的电梯的方向。在拥挤的街道上使用辅助移动设备的人希望在不拿出手机或大声说话的情况下推动它前进。这些时刻都不需要更智能的机器人。他们呼吁采用一种更智能的方式来让现有的机器听到声音。该行业一直在从一方面进行建设。过去三年的物理人工智能是循环中机器人方面取得显着进展的故事。 Boston Dynamics、Figure 和 Unitree 等公司拥有先进的执行器、运动和灵巧性,其水平在十年前
10 Marketing Trends And Expert Predictions Transforming the Future of Digital Marketing
发现塑造数字战略和在线品牌增长未来的顶级营销趋势。从内容和视频营销的力量不断增强,到语音搜索的影响、不断发展的 SEO 实践以及数据驱动的见解,企业必须适应才能保持竞争力。该信息图重点介绍了专家预测和行业见解,可帮助品牌与[...]改变数字营销未来的 10 个营销趋势和专家预测后首次出现在电子学习信息图上。
Inside Anduril and Meta’s quest to make smart glasses for warfare
国防科技公司 Anduril 分享了有关其与 Meta 合作开发的军用增强现实耳机原型的新细节,包括通过眼动追踪和语音命令下令无人机袭击的愿景。奎伊·巴尼特 (Quay Barnett) 曾在陆军特种作战司令部工作过,后来担任安杜里尔 (Anduril) 副总裁,负责领导这项工作,他说,他的基本原则是……
В ТУСУРе разрабатывают систему альтернативной работы с электронными образовательными ресурсами
TUSUR 学生获得了创新促进基金 UMNIK 计划的资助,用于开发使用语音、图像和神经接口与电子教育资源 (EER) 进行替代交互的系统。
Ученики «Сириуса» научили Алису проводить психологические опросы
Yandex 参加了“大挑战”——Sirius 教育中心为来自俄罗斯各地的优秀学童举办的夏季科学技术项目。在“认知研究”方向,这些人熟悉了 Yandex 语音技术,并教 Alice 如何进行心理调查。
В НГУ Тотальный диктант прочтёт Алиса
Alice将成为第一位被赋予“独裁者”荣誉角色的语音助手。 Yandex 的开发采用了先进的人工智能技术,特别是 SpeechKit 语音合成和识别技术,使 Alice 能够以类似于真实人类语音的声音说话。