音频数据领域信息情报检索---XiaoMi-AI

俄罗斯技术国有集团新闻频道

2026年5月21日 14:53

Oktava DM 在 CIPR-2026 上展示数字解决方案

«Октава ДМ» продемонстрировала цифровые решения на ЦИПР-2026

在展台上，该公司展示了 AB-400 音频徽章、MKE-230-2 和 MKE-250-2 麦克风、ARD-4-USB 音频数据记录器和 GK-4 电脑耳机

Apple机器学习研究

2026年4月28日 00:00

StereoFoley：从视频生成对象感知立体声音频

StereoFoley: Object-Aware Stereo Audio Generation from Video

我们推出了 StereoFoley，这是一种视频到音频生成框架，可在 48 kHz 下产生语义对齐、时间同步和空间精确的立体声。虽然最近的生成视频到音频模型实现了强大的语义和时间保真度，但由于缺乏专业混合、空间精确的视频到音频数据集，它们在很大程度上仍然局限于单声道或无法提供对象感知的立体成像。首先，我们开发和训练一个从视频生成立体声音频的基本模型，在语义准确性和同步方面实现了最先进的水平。下一步...

音频数据关键词检索结果

Oktava DM 在 CIPR-2026 上展示数字解决方案

StereoFoley：从视频生成对象感知立体声音频