Prompting Whisper for Improved Verbatim Transcription and End-to-end Miscue Detection
*相同的贡献识别错误(即,在大声朗读时犯的错误)通常是通过将自动语音识别(ASR)转录与目标阅读文本进行比较而大声接触的。但是,当ASR不准确转录逐字化的语音时,事后方法的性能很差。为了改善当前阅读错误注释的方法,我们提出了一种新颖的端到端体系结构,该结构通过提示结合了目标阅读文本,并接受了改进的逐字记录和直接的错误检测。我们的贡献包括:首先证明…