人気の記事一覧

ReazonSpeech v2, whisper-large v3, nue-asrを比較してみた

2か月前

とりあえず、記録を残しておく ReazonSpeech https://research.reazon.jp/projects/ReazonSpeech/index.html NeMo https://github.com/NVIDIA/NeMo rinna、日本語音声処理に適した事前学習モデルを公開 → 動作せん謎 https://rinna.co.jp/news/2024/03/20240307.html

1か月前

ReazonSpeechで高精度の文字起こしをやってみた

【AI技術活用】ReazonSpeechで驚きの簡単さ!会議議事録作成の音声文字起こしフル活用ガイド

11か月前

【世界最高レベル】高精度日本語音声認識モデル。日本語音声コーパス「ReazonSpeech」を無償公開(2023年1月18日)

1年前

ReazonSpeech

新しい日本語大規模音声コーパス

今週のAI/人工知能ニュースまとめ 2023/1/22

会話系AI(2023年1月アーカイブ)

だからアプリの起動時にモデルを立ち上げるのは厳しいかもしれん。流石に裏で動かしても1分は待てないだろう。Nvidia Nemoはどこで使われているのか、なぜ、Cythonなのかも謎、ただ、今のところ認識の品質は良さそうだ。秒数にもよるが17秒→3秒で認識していた

1か月前

ReazonSpeechを使用したのだけど、処理速度は課題かもしれん。GoogleコラボのGPU使用したらtranscribe3秒程度だったんだけどCPUでは10数秒かかる。loadもGPUで1分弱なので常に起動させとく必要ありかも https://github.com/reazon-research/ReazonSpeech

1か月前