详细内容或原文请订阅后点击阅览
NVIDIA的转录工具鹦鹉在1秒内产生60分钟的文本
nvidia发布了一种新的AI转录工具,称为The Pareakeet,并且不可否认地快速。该型号是鹦鹉TDT 0.6B,具有6亿个参数,据报道可以在短短一秒钟内转录整个小时的声音。对于开发人员,研究人员和各个行业来说,这可能很有趣,这些行业需要转换数字[…] NVIDIA后的Transcript Tool Tool Pareakeet在AI News中首次出现在1秒钟内产生60分钟的文本。
来源:AI新闻nvidia发布了一种新的AI转录工具,称为The Pareakeet,并且不可否认地快速。该型号是鹦鹉TDT 0.6B,具有6亿个参数,据报道可以在短短一秒钟内转录整个小时的声音。对于开发人员,研究人员和各种行业来说,这可能会很有趣,这些行业需要将语音转换为文本的应用程序。
鹦鹉TDT 0.6B因此是自动语音识别模型(ASR)。由于其“全部注意力机制”,它旨在有效,并且可以一次应对24分钟的声音,这意味着它可以同时分析整个音频段,而不是对它们进行分析。此版本是专门用于英语音频转录的。
在此处尝试恶魔:https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2
在这里尝试恶魔: https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2 鹦鹉的速度和效率可以打开各种用途。例如,它可用于快速创建原型或通过从YouTube和Tiktok等平台转录视频流来定位内容。该模型也是开源的事实,可以使更广泛的用户更容易访问它。 看到如何收到长尾小鹦鹉以及在这项技术的帮助下开发哪些新应用程序会很有趣。 更多信息: nvidia构建:鹦鹉1.1b-rnnt-multlotinual-asr模型 演示parakeet-tdt-0.6b-v2 Parakeet-tdt-0.6b-V2https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2
鹦鹉的速度和效率可以打开各种用途。例如,它可用于快速创建原型或通过从YouTube和Tiktok等平台转录视频流来定位内容。该模型也是开源的事实,可以使更广泛的用户更容易访问它。
看到如何收到长尾小鹦鹉以及在这项技术的帮助下开发哪些新应用程序会很有趣。
更多信息:
nvidia构建:鹦鹉1.1b-rnnt-multlotinual-asr模型
演示parakeet-tdt-0.6b-v2Parakeet-tdt-0.6b-V2