見出し画像

文字起こしツールは結局何がいいのか?お答えします。

どうも、かずちです!

最近はAIツールに夢中です。笑
個人的な予想ですが、今後はワードやエクセルを使っている感覚で、ChatGPTやその他のAIツールを活用することが当たり前になるでしょう。

そこで、今回は広報業務で一番活用されるであろう文字起こしから記事作成までを紹介したいと思います。よく使われているツールの比較から実際に記事にするまでの一部始終をお見せします。

ぜひ、日々の業務の効率化にお役立てください。

大前提

今回は仮でスティーブジョブスに1分ほどインタビューした音声を使って無料プラン部分で比較しました。その結果を考慮して、おすすめツールを順に紹介します。ちなみにもう1名はボイスチェンジャーを使った私です笑(なにをやっているのだろうか)ちなみに大前提として、私は滑舌が悪いです、ご了承ください。重要なのでもう一度言います、私は滑舌が良くはありません。

元のインタビュー原稿 ※もちろんGPT-4に依頼しました

0.結論

先に結論をお伝えしましょう。正直この結論だけ読んでくれたら問題ございません。笑 精度とスピード感、無料プランの充実度合いを考慮した結果CLOVA Noteをおすすめします。結構悩みましたので好みもあるかと思いますが、正直この3つのツールであれば誤字脱字やちょっと文字起こしができていなくてもChatGPTに入れてしまえばすぐに修正してもらえるのでそこまで大きな差はないです。あくまで今回は1分程度のサンプルで行っているのでこれが30分、60分のインタビューであればまた少し精度は変わってくるかもしれません。

文字起こしツールの紹介

1.CLOVA Note

CLOVA Noteは、LINEが提供するAIを活用した音声認識技術を利用した文字起こしツールで、毎月300分の利用時間を無料で提供しています。その他の特徴は以下の通りです。※アプリの新規ユーザーは現在一時停止中

LINEアプリ連携:
LINEアプリ内で簡単に音声データのアップロードや文字起こし結果の共有
高い認識精度:
AI技術を活用して、音声データを正確にテキストに変換
複数言語対応:
日本語をはじめ、英語や中国語など複数言語に対応
デバイス対応:
スマートフォンやタブレットなど、さまざまなデバイスで利用可能

🔽より詳しく知りたい方はこちらまで🔽

実際の文字起こしの結果が下記

ほぼ修正がいらない完璧な精度の文字起こしです。

2.Notta

Nottaは、日本語の音声をテキストに変換することに特化したAI文字起こしツールで、無料機能では月に120分の文字起こし時間が利用可能。その他の特徴は以下の通りです。※一部有料もある

日本語に特化:
日本語の発音やイントネーションを正確に認識した文字起こしが可能
自動区切り機能:
話者ごとに自動で区切りを入れて、見やすいテキスト形式で出力
校正機能:
AIが推定した文字起こし結果に対して、手動で修正を加える
シェア機能:
作成したテキストを簡単に共有

実際の文字起こしの結果が下記

一応、声変えて2人いる体でインタビューしたのですが、ボイスチェンジャーだと認識されなかったです。逆に本当の声を見抜いている点では精度が高いのかもですね。

3.Rimo Voice

Rimo Voiceは、音声をテキストに変換するための高精度な音声認識技術を利用した文字起こしツールで無料トライアルは60分まで可能です。その他の特徴は以下の通りです。

高い認識精度:
RimoVoiceは、音声データを正確にテキストに変換
複数言語対応:
英語、日本語、中国語、韓国語など、複数言語に対応
リアルタイム文字起こし:
音声をリアルタイムでテキストに変換
カスタマイズ可能:
業界用語や固有名詞の認識精度を向上させるために、独自の辞書に追加

取り込めるデータもかなり多いです。URLからも読み込めそうです。

🔽より詳しく知りたい方はこちらまで🔽

実際に文字起こしの結果が下記

1つの会話として認識しているので勝手に区切られているのが気になりますが、文字起こしツールとしては申し分ないです。少しだけ他のツールより精度が低そうですが、私の滑舌の問題かもしれません笑

記事にしてみよう

ここからChatGPTに記事にしてもらう方法は様々だと思いますが、私が使っているやり方をここでは紹介します。

1. ChatGPT-3.5で文章を整える、キーワードを抽出してもらう
2. ChatGPT-4で記事に仕上げてもらう
3. ChatGPT-4にこの記事がおもしろいか確認する ※重要な視点
4. タイトルをブラッシュアップする
5. 念のために誤字脱字チェック
※コツは3.5と4の使い分け

まずは質問と回答を分ける
これができるため文字起こしツールで分けなくても問題ない
しっかり認識されているようです
ちょっと変なキーワードもあるけど3.5なのでご愛嬌
GPT-4に戻って記事依頼をします

私はこれでは満足せずに、ChatGPT-4を試します。

自信満々に答えてくれて頼もしいですね。
ここで重要なのは改めて読者に刺さりやすそうなキーワードを間接的に引き出しているところです。そしてそのキーワードを元に再度記事を修正してもらいます。

私はこれを”鬼の推敲”と呼んでいます笑

後半部分の内容が誇りに思う瞬間から最も興味深いエピソードに焦点を変えているのがわかると思います。さらに最後のまとめの内容もキーワードに沿って変更されています。こうやって新しい記事の材料となる視点を引き出しては記事にしてそれを組み合わせていくことでいい記事になると思っています。最後にタイトルをブラッシュアップします。

「この記事を踏まえた上でタイトルを違う視点で5つ考えてください」と入力。

具体的に伝えたい内容をタイトルに盛り込むパターンとメッセージや道標のような抽象的なパターンのタイトルに分かれていますね。この中でいいものをピックアップしてブレストを繰り返すと納得のいくタイトルに近づくと思います。そして念のため最後に誤字脱字をチェックして完成です。

完成した記事

番外編

最後に他のツールも簡単に紹介します。

tl:dv

これはちょっと有名かもですが、文字起こしツールではありつつもデータをインポートするのではなくMeetやZoomに参加して、ミーティングが終わったら自動的にその内容が文字起こしされるツールです。かなり便利でいいのですが、無料だと文字起こしの内容がコピペできないのが困っています…

Summary fm

あのstand.fmが音声ファイルだけに特化した文字起こし&要約ツールをリリースしました。精度はかなり高い印象で、文字起こしのスピードもかなり早いです。ただポッドキャスト用なのか読者といったのに視聴者に変えられたりしていてちょっと笑いました。

Whisper

これについては専門外ですが、Pythonに対応したプログラム実行環境が必要みたいです。僕はここでフェードアウトしましたが、わかる方はこれが一番精度高そうなので使ってみてください。

CalqWorks

議事録作成、情報収集、ビジネス戦略の策定、メール作成、求人票の作成、履歴書の作成、SNS上での返信、広報資料の作成など、網羅的な機能があるので詳しくはご覧ください。このツールで一番推したいのはリアルタイムでの音声文字起こしの精度がとても高いです。たけどお試し版だと10分なのであまり使い道はないかもですが…

Flowcraft

まだβ版みたいですが、正式版が楽しみなツールです。これは文字起こしツールとかではなく、複雑な業務を自動化できるAIツールです。簡単に言うとプロンプトを繋ぎ合わせてワークフローを自動化するみたいです。下記の動画のようなことが起きれば間違いなく神ツールになるかと期待しています。

日々、ツールは進化し続けており、AdobeやGoogleなども高精度なAIを内蔵したサービスを展開予定です。一つのツールに固執せず、今は楽しみながらゆったりと情報が開示されるのを待ちたいと思います。確実に、ワードに文字起こしツールが組み込まれたら、皆さんはそれを使うでしょう。Slackに音声データを入れたら自動で文字起こし・要約してくれる世界が来たら、それを使うでしょう。ですので、現在出ている文字起こしツールはいずれ淘汰されていくと考えられます。

もし今回記載した内容で誤りがある場合は教えてください。
また、「こういうツールもいいよ」、「このやり方だと便利」みたいなハックがあればぜひ情報交換させてください!

ご覧いただきありがとうございます。
最後に前回の記事も載せておきます。

以上。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?