详细内容或原文请订阅后点击阅览
AI 耳机让你在喧闹的人群中也能听到一个人的声音
华盛顿大学的新目标语音听力技术可突出显示环境噪音中的重要声音。
来源:安全实验室新闻频道华盛顿大学的新目标语音听力技术可突出显示环境噪音中的重要声音。
华盛顿大学推出了一种新的人工智能系统,允许耳机用户从环境噪音中识别出特定人的语音。这项名为目标语音听力 (TSH) 的技术于 5 月 14 日在檀香山举行的 ACM CHI 计算系统人为因素会议上发布。尽管系统本身尚未出售,但系统代码可用于进一步开发。
被引入TSH 系统允许耳机用户只需注视感兴趣的人几秒钟即可“记录”他们的声音。然后,系统会过滤掉所有其他声音,并仅传输所选人员的声音,即使耳机用户移动或转动头部也是如此。
该开发旨在改善嘈杂环境中的听觉感知,例如拥挤的街道或办公室。该研究的主要作者、华盛顿大学教授 Shyam Gollacott 表示,该系统与典型的互联网聊天机器人不同,它使用人工智能来实时改变听觉感知。 “有了我们的设备,即使在嘈杂的环境中进行大量对话,现在也可以清楚地听到一个人的声音,”Gollakota 说。
要使用该系统,只需戴上带麦克风的普通耳机并按下按钮,将头指向讲话者即可。他的声音发出的声波会同时到达耳机两侧的麦克风(容差为16度)。耳机将该信号传输到内置计算机,其中软件学习识别所选对话者的声音并继续实时播放。
在系统测试中,21 位参与者对语音清晰度进行了评价。平均清晰度得分几乎是未处理音频的两倍。
当前系统版本