AI 耳机会自动识别您正在与谁交谈,让您听得更清楚

华盛顿大学的研究人员开发了人工智能耳机,可以在嘈杂的音景中自动隔离对话伙伴。该系统采用人工智能模型来监听来回的对话模式,并将不遵循既定节奏的声音静音。

来源:华盛顿大学

工程|新闻发布|研究|技术

2025 年 12 月 9 日

AI 耳机会自动识别您正在与谁交谈,让您听得更清楚

在拥挤的房间里进行对话通常会导致令人沮丧的“鸡尾酒会问题”,或者将对话伙伴的声音与喧闹声分开的挑战。这是一种精神上的负担,听力障碍可能会加剧这种情况。

作为这一常见难题的解决方案,华盛顿大学的研究人员开发了智能耳机,可以在嘈杂的音景中主动隔离所有佩戴者的对话伙伴。这款耳机由一个人工智能模型提供动力,该模型可以检测对话的节奏,另一个模型可以将任何不遵循该模式的声音以及其他不需要的背景噪音静音。该原型使用现成的硬件,只需两到四秒的音频即可识别对话伙伴。

该系统的开发人员认为,这项技术有一天可以帮助助听器、耳塞和智能眼镜的用户过滤音景,而无需手动引导人工智能的“注意力”。

该团队于 11 月 7 日在中国苏州举行的自然语言处理经验方法会议上展示了该技术。底层代码是开源的,可供下载。

“识别佩戴者正在听谁讲话的现有方法主要涉及在大脑中植入电极来跟踪注意力,”资深作者、华盛顿大学保罗·G·艾伦计算机科学与工程学院教授 Shyam Gollakota 说。 “我们的见解是,当我们与特定人群交谈时,我们的讲话自然会遵循轮流节奏。我们可以训练人工智能仅使用音频来预测和跟踪这些节奏,而不需要植入电极。”

该团队将现成的降噪耳机与双耳麦克风相结合来创建原型,如图所示。Hu 等人/EMNLP