×
img

一种基于 CTC 对齐的非自回归变压器模型用于端到端自动语音识别(英文版)

发布者:wx****37
2023-04-21
831 KB 12 页
人工智能(AI)
文件列表:
一种基于 CTC 对齐的非自回归变压器模型用于端到端自动语音识别【英文版】.pdf
下载文档
英文标题:A CTC Alignment-based Non-autoregressive Transformer for End-to-end Automatic Speech Recognition中文摘要:本论文介绍了一种 CTC Alignment-based Single-Step Non-Autoregressive Transformer(CASS-NAT)方法,用于自动语音识别,通过利用与 CTC 对齐的语音边界信息提取标记级别音频嵌入来提高推理速度,实现了自监督学习,提出了多个训练策略来改善单词错误率(WER)表现,并探究了基于误差的对齐采样方法以减少训练和测试过程中的对齐不匹配,实验结果表明 CASS-NAT 对于多个 ASR 任务具有接近于 AT 的 WER,同时提供了~24 倍的推理加速,并且未经过语言模型的情况下,实现了新的最高效果。英文摘要:Recently, end-to-end models have been widely used in automatic speechrecognition (ASR) systems. Two of the mo

加载中...

已阅读到文档的结尾了

下载文档

网友评论>