文字起こしツールは結局何がいいのか?お答えします。
どうも、かずちです!
最近はAIツールに夢中です。笑
個人的な予想ですが、今後はワードやエクセルを使っている感覚で、ChatGPTやその他のAIツールを活用することが当たり前になるでしょう。
そこで、今回は広報業務で一番活用されるであろう文字起こしから記事作成までを紹介したいと思います。よく使われているツールの比較から実際に記事にするまでの一部始終をお見せします。
ぜひ、日々の業務の効率化にお役立てください。
大前提
今回は仮でスティーブジョブスに1分ほどインタビューした音声を使って無料プラン部分で比較しました。その結果を考慮して、おすすめツールを順に紹介します。ちなみにもう1名はボイスチェンジャーを使った私です笑(なにをやっているのだろうか)ちなみに大前提として、私は滑舌が悪いです、ご了承ください。重要なのでもう一度言います、私は滑舌が良くはありません。
0.結論
先に結論をお伝えしましょう。正直この結論だけ読んでくれたら問題ございません。笑 精度とスピード感、無料プランの充実度合いを考慮した結果CLOVA Noteをおすすめします。結構悩みましたので好みもあるかと思いますが、正直この3つのツールであれば誤字脱字やちょっと文字起こしができていなくてもChatGPTに入れてしまえばすぐに修正してもらえるのでそこまで大きな差はないです。あくまで今回は1分程度のサンプルで行っているのでこれが30分、60分のインタビューであればまた少し精度は変わってくるかもしれません。
文字起こしツールの紹介
1.CLOVA Note
CLOVA Noteは、LINEが提供するAIを活用した音声認識技術を利用した文字起こしツールで、毎月300分の利用時間を無料で提供しています。その他の特徴は以下の通りです。※アプリの新規ユーザーは現在一時停止中
🔽より詳しく知りたい方はこちらまで🔽
実際の文字起こしの結果が下記
ほぼ修正がいらない完璧な精度の文字起こしです。
2.Notta
Nottaは、日本語の音声をテキストに変換することに特化したAI文字起こしツールで、無料機能では月に120分の文字起こし時間が利用可能。その他の特徴は以下の通りです。※一部有料もある
実際の文字起こしの結果が下記
一応、声変えて2人いる体でインタビューしたのですが、ボイスチェンジャーだと認識されなかったです。逆に本当の声を見抜いている点では精度が高いのかもですね。
3.Rimo Voice
Rimo Voiceは、音声をテキストに変換するための高精度な音声認識技術を利用した文字起こしツールで無料トライアルは60分まで可能です。その他の特徴は以下の通りです。
取り込めるデータもかなり多いです。URLからも読み込めそうです。
🔽より詳しく知りたい方はこちらまで🔽
実際に文字起こしの結果が下記
1つの会話として認識しているので勝手に区切られているのが気になりますが、文字起こしツールとしては申し分ないです。少しだけ他のツールより精度が低そうですが、私の滑舌の問題かもしれません笑
記事にしてみよう
ここからChatGPTに記事にしてもらう方法は様々だと思いますが、私が使っているやり方をここでは紹介します。
私はこれでは満足せずに、ChatGPT-4を試します。
自信満々に答えてくれて頼もしいですね。
ここで重要なのは改めて読者に刺さりやすそうなキーワードを間接的に引き出しているところです。そしてそのキーワードを元に再度記事を修正してもらいます。
後半部分の内容が誇りに思う瞬間から最も興味深いエピソードに焦点を変えているのがわかると思います。さらに最後のまとめの内容もキーワードに沿って変更されています。こうやって新しい記事の材料となる視点を引き出しては記事にしてそれを組み合わせていくことでいい記事になると思っています。最後にタイトルをブラッシュアップします。
「この記事を踏まえた上でタイトルを違う視点で5つ考えてください」と入力。
具体的に伝えたい内容をタイトルに盛り込むパターンとメッセージや道標のような抽象的なパターンのタイトルに分かれていますね。この中でいいものをピックアップしてブレストを繰り返すと納得のいくタイトルに近づくと思います。そして念のため最後に誤字脱字をチェックして完成です。
番外編
最後に他のツールも簡単に紹介します。
tl:dv
これはちょっと有名かもですが、文字起こしツールではありつつもデータをインポートするのではなくMeetやZoomに参加して、ミーティングが終わったら自動的にその内容が文字起こしされるツールです。かなり便利でいいのですが、無料だと文字起こしの内容がコピペできないのが困っています…
Summary fm
あのstand.fmが音声ファイルだけに特化した文字起こし&要約ツールをリリースしました。精度はかなり高い印象で、文字起こしのスピードもかなり早いです。ただポッドキャスト用なのか読者といったのに視聴者に変えられたりしていてちょっと笑いました。
Whisper
これについては専門外ですが、Pythonに対応したプログラム実行環境が必要みたいです。僕はここでフェードアウトしましたが、わかる方はこれが一番精度高そうなので使ってみてください。
CalqWorks
議事録作成、情報収集、ビジネス戦略の策定、メール作成、求人票の作成、履歴書の作成、SNS上での返信、広報資料の作成など、網羅的な機能があるので詳しくはご覧ください。このツールで一番推したいのはリアルタイムでの音声文字起こしの精度がとても高いです。たけどお試し版だと10分なのであまり使い道はないかもですが…
Flowcraft
まだβ版みたいですが、正式版が楽しみなツールです。これは文字起こしツールとかではなく、複雑な業務を自動化できるAIツールです。簡単に言うとプロンプトを繋ぎ合わせてワークフローを自動化するみたいです。下記の動画のようなことが起きれば間違いなく神ツールになるかと期待しています。
日々、ツールは進化し続けており、AdobeやGoogleなども高精度なAIを内蔵したサービスを展開予定です。一つのツールに固執せず、今は楽しみながらゆったりと情報が開示されるのを待ちたいと思います。確実に、ワードに文字起こしツールが組み込まれたら、皆さんはそれを使うでしょう。Slackに音声データを入れたら自動で文字起こし・要約してくれる世界が来たら、それを使うでしょう。ですので、現在出ている文字起こしツールはいずれ淘汰されていくと考えられます。
もし今回記載した内容で誤りがある場合は教えてください。
また、「こういうツールもいいよ」、「このやり方だと便利」みたいなハックがあればぜひ情報交換させてください!
ご覧いただきありがとうございます。
最後に前回の記事も載せておきます。
以上。
この記事が気に入ったらサポートをしてみませんか?