流使用Web Audio API

在这篇文章中,我们探讨了使用浏览器的Web Audio API和Amazon转录流的Web应用程序的实现详细信息,以实现实时双通道转录。通过使用AudioContext,Channelmergernode和AudioWorklet的组合,我们能够无缝处理和编码来自两个麦克风的音频数据,然后再将其发送到Amazon转录进行转录。

来源:亚马逊云科技 _机器学习
多通道转录流是Amazon Transcribe的一个功能,在许多情况下可以使用Web浏览器使用。创建此流源具有挑战,但是使用JavaScript Web音频API,您可以连接并组合不同的音频源,例如视频,音频文件或麦克风(例如麦克风)来获取成绩单。在这篇文章中,我们指导您如何将两个麦克风用作音频源,将它们合并为单一的双键盘音频,执行所需的编码,并将其转换为Amakon和Amavon cammon Amavy Amavy cammon cammon Amavy campary cammon Amavy cammon cammon cammon cammon Amavy Amakon。提供了vue.js应用程序源代码,该代码需要将两个麦克风连接到浏览器。但是,这种方法的多功能性远远超出了这种用例,您可以对其进行调整以适应各种设备和音频来源。使用这种方法,您可以在单个亚马逊的转录会话中获得两个来源的转录本,可节省成本和其他福利,并为每个源使用单独的secribers and-challenges提供单独的crompribers。标签标识以识别说话者可能足够了,但是有一些考虑因素:扬声器标签在会话开始时随机分配,这意味着您将不得不映射应用程序的结果,在流启动以类似语音的语音的启动扬声器的扬声器可能会发生,即使人类很难与两个听众的交流有关,即使是一个听众可以通过一个听众来避免,也可能会出现两个听众的交谈,从而可以通过一个听众的源头进行交谈。每个转录来自固定输入源。通过将设备分配给扬声器,我们的应用程序事先知道要使用的成绩单。但是,如果附近的两个麦克风捡起多种声音,您可能仍然会遇到语音重叠。可以通过使用定向麦克风,音量管理和Amazon Trentcribe Word-le