見出し画像

音声編集の勘所〜聴き心地の良いPodcast番組をつくろう

2つのPodcast番組で編集をしているゆとと申します。

本記事はPodcastを始めてみたは良いけど、「そろそろ編集もしてみたくなってきた!でもどう編集したら良いんだ?」という疑問にお答えするような、音声編集の勘所をご紹介します。

音声編集ソフトの具体的な操作方法には触れず、あくまで「どんな観点で編集すれば良いんだ?」という話に絞っています。

少々ボリューミーになりそうなので、以下のような段階に分けてご紹介します。 つまみ食いでも構いませんが、意外と①が大事だったりするので、通しで読んでいただくのがオススメです。

① 収録
② 編集<下準備:音源データの編集>
③ 編集<本作業:本編の編集>
④ 編集<仕上げ>

ちなみに、これからPodcastを始めようかな?という方向けの「Podcastの始め方」については、以下あたりの記事を参考にしてみてください!

<ほか、Podcast/音声配信を始める際に参考になる記事>
PodcastプロデューサーのKONさんが語るポッドキャストの始め方
音声配信のはじめかた勉強会」の資料を公開します 

さて、本題に入っていきましょう。

① 「収録時」のコツ

まずは、収録です。

意外と「編集するぞ!」というタイミングではなく、収録時に勝負が決まってしまっていることもよくあります。

マイクよりも、収録環境が大事といっても過言ではない

例えば、ぼくも大好きなラジオただいま発酵中の#01が良い例なので、ぜひ冒頭30秒くらいだけでも聴いてみてください。

内容はエグいくらいのハイクオリエティ、途中から音質も良くなってはいるのですが、実は第1話の音質は良くありません。

しかも、マイクは良いものを使っているはずです。

音質が良くないのはマイクが悪いわけでも、編集が悪いわけではありません。原因は、「収録環境」が良くないのです。

反響しやすい環境では、いくらマイクが良くても良い音質では収録はできません。

  • 必ず、収録前に試し録りしてみる

  • 反響が大きい場合は、吸音材などを検討する

これをやっておくだけでかなり変わりますので、ぜひ意識してみてください。

マイクはiPhoneで十分

よほど声質が大事なASMR番組などでない限り、マイクはそこまで高価なものは不要です。PodcastプロデューサーのKONさん(@konsan10)もiPhoneで十分とよく語られていますし、ぼくもそれに完全同意です。

ちなみに格安端末などは、端末により差が激しいです。試し録りしてどうしてもダメなら、マイクの購入を検討しましょう。

KONさんは、SM58というマイクをおすすめしてますね。

オススメマイクでいうと、1万円くらいのクラスで言うと、SHUREの『SM58』ですかね。

出典:PodcastプロデューサーのKONさんが語るポッドキャストの始め方

参考までにぼくらが使っているマイクもリンク載せておきます。

▽ TTさんマイク

▽ ゆとマイク

▽ しみさまマイク(6千円くらい)

ひとりひとりの音声ファイルができるように収録する

ZOOMなどで直接会話を録音するのではなく、手元のPC/スマホのボイスメモなどで、録音するのがおすすめです。

相手の声はイヤホンで聴くようにして、手元の録音は「自分の声だけ」が入っているファイルをつくる形です。

こうすることで、編集のしやすさが格段にあがります。
例)声が重なった時に「片方の声だけを消す」「時間をずらす」など

② 「編集<下準備:音源データの調整>」のコツ

ここからやっと、音声編集自体の話です。

編集の下準備とは、1人1人の音源データ自体を調整することです。代表的な下準備は、ノイズ除去ですね。ノイズ除去だけでなく、ぼくは以下のような観点で音量バランスを調整しています。

・音量(音圧)の偏りを整える(小さすぎ/大きすぎ)
・各音源の音量(音圧)0.1dBをMAXにノーマライズする

ノイズ除去について

1つ言いたいのは、実はそこまでこだわらなくていいのでは?ということです。こだわったノイズ除去よりも、音量バランスの調整のほうがよっぽど大事です。

とはいえぼくもノイズ除去はしています。ただ、そこまで時間をかけないようにはしています。感覚値ですが、せいぜい5分くらいのイメージですね。

最近ぼくがリスナーとして気に入っているPodcast「ニューロ横丁〜酒のツマミになる脳の話〜」もそんなに音質が良いわけではないですが、コンテンツが興味深く聴き入ることができています。

音量バランス調整のコツ

「音量バランスが悪い」というのは複数人での配信で、誰かの声が大きすぎて誰かの声は小さすぎるといった状況です。これが、ノイズよりも個人的にはストレスだと思っています。

音量バランス調整は、大きく以下の2観点で編集しています。

・音量(音圧)の偏りを整える(小さすぎ/大きすぎ)
・各音源の音量(音圧)0.1dBをMAXにノーマライズする

ということで、ひとつひとつ見ていきましょう。

ちなみに正しくは音声データ自体の音量的なものは「音圧」と言います。ただイメージしにくくなると思うので、この記事では「音量」と書いてしまいます。 音圧をご存じの方は、お手数ですが音圧に読み替えて読んでいただけると幸いです。
参考記事:音圧上げで音を大きく!音量と音圧の違いとは?

音量(音圧)の偏りを整える(小さすぎ/大きすぎ)

※ 話の順番的にノイズ除去の後にしていますが、作業順としては音量バランスを整えるほうを先に行っています

録音データを開くと、以下のような波で表示されます。大抵の場合ところどころ、赤い四角のように飛び出ている箇所があるんですよね。

テンションが上がって大きな声で話している場合や、笑い声がだいたい飛び出ています。これを、他の時間と同じくらいの大きさになるように調整します。

また逆に、マイクが遠かったなどで小さい音量になってしまっているケースもあります。こういった場合は、小さい音量の範囲の音を大きく編集しましょう。

・・・マイクから一定の距離を保って収録するというのも、大事ですね。

こうすることで、全体でだいたい同じような音量で話している音声データが出来上がります。

各音源の音量(音圧)0.1dBをMAXにノーマライズする

Youtubeを同じ音量設定で再生していても、動画によって音量が違って困ったことありませんか?  ここで紹介する作業は、あのようなことが起きないにすることです。

収録データの音量が違うと、1人はささやきボイスで1人はおいでやす小田さんみたいな会話になってしまうケースがあるのです。

これはなかなか悲惨で、ノイズがあるよりよっぽど聴きにくい番組が出来上がってしまいます。

これを回避するために、ノーマライズをしておきましょう。これはとても標準的な機能のため、どの音声編集ソフトにも入っているはずです。

ぜひ、「Audition ノーマライズ」「Audacity ノーマライズ」など調べて試してみてください。

ちなみにぼくは、音量(音圧)-0.1dB(マイナス0.1デシベル)にノーマライズしています。

Auditionでは音源データのMAX音量が-0.1dBになるように、
1クリックで編集ができます。

ここまでやってやっと、収録時の音声を聴きながらの編集に入ります。

③ 「編集<本編の編集>」のコツ

ここからは、②で調整した音源を重ね合わせて、聴きながらの編集です。

ぼくが意識している大きな観点は、以下6つです。特に、1~3が大事だと思っています。

1:(★★★)タイムライン上で改めて音量バランスを整える
2:(★★★)間を整える
3:(★★★)複数人の声が重なっている箇所を整える
4:(★★☆)フィラー音を整える
5:(★★☆)テンポと展開を考え、ジングルで全体感を整える
6:(★☆☆)相づちを整える

※ 星は重要度の感覚です

サクサク1つずつみていきましょう。

1:(★★★)タイムライン上で改めて音量バランスを整える

「② 「編集<下準備:音源データの調整>」のコツ」で-0.1dBにノーマライズをすると言っていたのに、まだ調整するの?と思いますよね。

そうなんです、さらに調整するのです。といっても、微調整です。

1人1人の音声を重ねて聴いてみると、やっぱり多少音量のズレがあるものなんですよね。これを、また調整するのです。

②ではMAXを-0.1dBにしましたが、ここの段階で音量をさらにもう少し上げています。具体的には、ここではざっくり平均が-0.1dBにするイメージまで上げています。

Auditionでは聴きながらその音量(音圧)を確認できるので、目で見ながら調整しています。あくまでぼくの参考値ですが、②からさらに8dBや10dBあげると、ちょうど平均が-0.1dBくらいになる感覚です。

2:(★★★)間を整える

「間」は、消せばいいってものでもないので難しいですよね。番組のタイプや人柄でも、良いテンポはバラバラです。なので前提として、基本のテンポ感は、ご自身で探してみてください。

1つ間違いなく言えるのは、2秒以上無言の箇所は基本カットでいいでしょう。そのほかは「自分の番組に合うテンポ」を基準に、

  • 遅いところは間を切る

  • 早いところは間をいれる

という作業をしています。ポイントは、カットではなく間を入れる箇所もあるということですね。特に、何かを説明しているときはマシンガントーク気味になりやすいので、間をあけるケースがたまにあります。

とはいえいずれの間の調整も、その人らしさはキープしつつ行うのが大事です。

3:(★★★)複数人の声が重なっている箇所を整える

複数人での収録で起こりがちなのが、同時にしゃべってしまうということですよね。

聴いてみての判断ですが、たいてい1人の声以外は消して、言い直したところをうまく繋げて一発で言えているように調整します。

でも、このような調整がどうしても難しいケースもありますよね。

そんな時は例えば、メインとして使う声以外の声を小さくします。こうすることで声は重なっていても、聴いてほしい声の内容が自然に聴けるようになります。

4:(★★☆)フィラー音を整える

フィラー音とは、「ええと〜」「あの〜」「なんか〜」などのつなぎ言葉のことです。

音声編集といえばの代表的なのがノイズ除去とフィラー音のカットを想像する人が多いかもしれません。でも、ぼくはこれより大事なのが上述した1~3と思っています。

また、「フィラー音のカット」ではなく、「フィラー音の調整」と表現指いることもこだわりです。

それは、消せばいいって話ではないからです。実はぼくは8割くらいのフィラー音は不要なのでカットしますが、残り2割くらいは消さずに残しているんですよね。

残す理由は大きく3つあって、1つ目はあえて綺麗に全て消しすぎないほうが自然なのでは?というのが個人的な意見です。

2つ目は、実はフィラー音を残したほうがリスナーとしてもテンポがちょうどよくなるときもあるということです。

例えばちょと難しい話をしていて、補足的に何かいう時など「リスナーも何か考えながら聴いている可能性が高い」ような時ですね。そこで「ええと〜」くらい言ってから話をしたほうが、聴いている方もちょうど良かったりします。

3つ目は、消すと不自然になるからなくなく残すものですね。これはなければないほうが嬉しいものです。笑

5:(★★☆)テンポと展開を考え、ジングルで全体感を整える

これは収録時にも意識したほうがいいことなのですが、同じ話が長すぎると間延びした感覚になりませんか?

これを編集的に調整するのが、「ピロンっ」とか「とぅるる〜ん」といったジングルです。ぼくは話が変わる部分にジングルをいれるのはもちろん、話が間延びしそうなときにもジングルを入れます。

ジングルは、だいたい5〜10分に一度は入るようにしています。目安として意識しているのは、最長12分です。それ以上だと間延びして感じるので、これ以上になりそうな時はなるべくジングルを入れますね。

ちなみに話が変わるときに使うジングルと、あまり意味はないけど区切りたいときのジングルは分けています。

6: (★☆☆)相づちを整える

相づちの編集は、学び系のコンテンツのみである程度必要と思っています。とはいえ、1〜5よりは優先度低いです。

相づちをまるっと消す

相づちの編集で実は一番やっているのは、相づちを消すことかもしれません。普通の会話では相づちされた方がぼく自身話しやすかったりするので、相づちは無意識に多い方だと思います(笑)

ただラジオ/Podcastを聴く上では、意外と相づちが多いと邪魔に感じたりするのです。話し手の一呼吸に一つくらいの相づち回数になるように、自分の相づちを消しまくっています。

相づちを一部消す

また「はいはいはいはい」「うんうんうんうん」のように、4回5回と繰り返して言っているときもありますよね。正直ぼくもよく使います。

会話としてはむしろ良いのですが、個人的にはこれもラジオ/Podcastでは不要かなと思っています。実際に聴いてみてよっぽど残した方が良いと判断できる時以外は、1,2回になるように調整しています。

相づちのタイミングを調整する

相づちのタイミング、以外と話し手と被りますよね。これも、時間を少し調整します。

ただしこの編集を凝りだすと果てしない時間がかかるので、注意が必要です。

おすすめなのは、よっぽど大事なことを言っている時に相づちがかぶったときくらいの調整ですね。

④ 「編集<仕上げ>」のコツ

最後に仕上げ部分のコツです。といってもここは、正直今までの①〜③に比べると優先度はかなり低いです。

観点としては、以下の3つです。

1:BGM
2:オープニング音
3:エンディング音

1:BGM

BGMはいろいろな役割で入れることがありますが、ぼくが配信全体にBGMを入れる理由は1つ。

それは、編集をサボるためです。

少しBGMがあるだけで、ノイズや少し編集で不自然な箇所が気にならなくなります。

良いマイクで、完璧なノイズ除去をした声だけのクリアな音を作れるのであれば、BGMがない方が引き込まれる番組になるかもしれません。でも、これってなかなかの手間で難しいんですよね。

ということで、ぼくははなからそれは狙わず、とても小さな音量(音圧)でBGMを入れてます。

具体的には、一番大きな音が-35dBくらいになるくらいです。

BGMで番組の印象付け・・・などの目的でBGMが大きめな番組はありますが、ぼくはその目的では使っていません。

むしろ、BGMを聴こうとしないと聴こえないレベルにしていますね。

2:オープニング音

オープニング音については、2つだけ言わせてください。

1つが、オープニング音は数秒程度に収めましょうということ。ぼくの番組では、5,6秒の音源を利用しています。(フリー音源を編集して短くして使っています)

たまに20秒などのオープニング音を見かけますが、これはしょっぱなからかなり不利な状況を自ら作り出している気がします。

ぼくの大好きなスカシウマRadioもそのくらい長いオープニング音ですが、彼らは異常なトーク力でカバーしているとしか思えませんw

少なくとも新規リスナー向けには、長いオープニング音はNGです。

もう1つが、オープニング音からの「間」には気をつけましょうということ。たまに、オープニング音が終わって、5秒くらい空白があってから始まる番組を見かけます。

ラジオだったらほぼ放送事故です。

ぼくはオープニング音と一言目は微妙に重なるくらいにしています。音を重ねるかどうかは趣味かと思いますが、余計な間はつくらないようにするが吉です。

3:エンディング音

「さようなら〜」「ばいばい」などの締めの言葉から、変な間を空けずにエンディング音をいれるのがコツです。

意外と、3,4回は聴き直して微調整をしています。

おまけ

最後に一番大事かもしれないことを言わせてください。

実は、ここまでご紹介した観点での編集を、最初の2分と最後の2分くらいだけ実践するだけでも大きく印象が変わるはずです。

「聴き始めるかどうかえを決める冒頭」と、「聴いた後の印象を決める最後の2分」に本気出すイメージですね。

時間とクオリティのバランスを意識して、苦しくなく楽しく継続できる塩梅を見つけましょう。

おわりに

ここまでお読みいただき、ありがとうございました。編集は凝れば凝るほど無限に長くなってしまうので、あくまでこんな観点があるんだなと思っていただくくらいでOKです。

試してみたいと思ったところから、ぜひ具体的に調べてみてくださいね。

ググっていただければ編集ソフトそれぞれで、記事や動画解説が豊富にあるはずです。そもそもの検索キーワードに困るなど、ご不明点があればぜひTwitterやコメントでご連絡ください!


そのほか参考にした記事


いただいたサポートは、新しいサービスづくりのための活動資金とさせていただきます!