CTC Segmentationの紹介
※こちらの記事は、2020年10月2日にRetrieva TECH BLOGにて掲載された記事を再掲載したものとなります。
Chief Research Officerの西鳥羽 二郎です。
今回は音声認識において長い音声データとその書き起こしから学習データを作成する際に役立つツールの紹介です。
書き起こしから学習データを作る時の問題点
音声認識は最近は Kaldi, Mozilla DeepSpeech, wav2letter, ESPnetなどのツールが整備されてき