使用 Amazon Bedrock 从 Amazon Transcribe 生成的音频记录中挖掘见解

在本文中,我们将通过一些示例来研究如何通过语音分析创造商业价值,这些示例侧重于以下内容:1) 自动总结、分类和分析营销内容(例如播客、录制的采访或视频),并根据这些资产创建新的营销材料,2) 自动从录制的会议(例如收益电话会议)中提取关键点、摘要和情绪,以及 3) 转录和分析联系中心呼叫以改善客户体验。

来源:亚马逊云科技 _机器学习

生成式 AI 不断突破可能性的界限。一个备受关注的领域是使用生成式 AI 分析音频和视频记录,从而提高我们从音频或视频文件中存储的内容中提取有价值见解的能力。语音数据独特而复杂,这使得分析和提取见解变得困难。手动转录和分析语音数据可能非常耗时且耗费资源。

生成式 AI

现有的从语音数据中提取见解的方法通常需要繁琐的人工转录和审核。您可以使用自动语音识别工具将音频和视频数据转换为文本。但是,您仍然必须依靠手动流程来提取特定的见解和数据点,或获取内容摘要。这种方法非常耗时,随着组织积累大量此类内容,对更高效、更有洞察力的解决方案的需求变得越来越迫切。考虑到组织以这些格式存储的数据量以及否则可能未被发现的宝贵见解,有很大的机会增加业务价值。以下是通过使用带有音频记录的大型语言模型 (LLM) 可以获得的一些新见解和功能:

  • LLM 可以分析和理解对话的上下文,不仅是说出的单词,还有隐含的含义、意图和情感。以前,这需要大量的人工解释。
  • LLM 可以执行高级情绪分析。以前,可以捕获情绪分析,但 LLM 可以通过理解对话的上下文来捕获更多情绪,例如讽刺、矛盾或复杂的感受。
  • LLM 不仅可以通过提取内容来生成简洁的摘要,还可以通过理解对话的上下文来生成简洁的摘要。
  • 用户现在可以提出复杂的自然语言问题并获得有见地的答案。
  • Amazon Transcribe Amazon Bedrock Converse