#ayumix2020/人力ボカロについて

https://www.youtube.com/watch?v=l9Wp86bxCAw

2020年初頭、歌手浜崎あゆみ氏の自伝的ドラマ「M-愛すべき人がいて-」が放映開始。同時期にavex公式は彼女のボーカルデータ100曲分を公開、クリエイターチャレンジと称して世のDTMユーザーに対し「自由にリミックスしてYouTubeとかにUPしていいよ」というわりと前代未聞のイベントが企画された。
私自身結構浜崎あゆみの曲が好きで、10代の頃はいつか彼女に楽曲提供したいとか身の程知らずなことを思っていた。もちろん実現していない。
なのでこれは自称クリエイターなら参加しとくべきかな、となんとなく思ったのだった。

どんなのを作ろうか?
・4つ打ちトランス系とかEDMにするみたいなリミックスをやる奴は多分たくさんいる。ワブルベースが唸りまくるダブステップみたいなのを作る奴も多分いっぱいいるだろう。では私は?と考えた時に自分の得意技はビジュアル系のバンドサウンドだろう、と自己分析する。

・個人的には「SURREAL」がイチオシの名曲。なのでボーカルデータをDLしてなんとなく打ち込んでみるも、原曲を愛するあまりどんなアレンジにしてもハマらない、納得が行かない。仕事で「このアレンジにしてくれ」案件だったらミスマッチだろうがダサかろうが発注元が責任を取ってくれるのだが。

・私は行き詰まる。まぁいいか、時間があればいつかV系っぽくSURREALを仕上げるさ…ハハ…みたいなクソ思考のまま日々が過ぎてゆく。そんなある日、唐突にアホなアイデアが浮かぶ。

・「これだけの量のアカペラデータがあればいわゆる人力ボカロを作るのに相当有利じゃね?そう言えば今出来かけの曲がある。初音ミクで歌わせてもなぁ…。そうだ、あゆに歌ってもらおう!

・権利もクリアだしむしろ公式が「ayuの声を使ってあなたの作品を作ろう!」みたいなことを言っている。多分他にこれをやってる奴、やろうと思ってるアホはあんまりいないだろう!

・そう思った私は100曲分のボーカルデータを軽い気持ちでDLし始めるのだった。でも、これがいけなかった…

■そもそも人力ボカロってどうやるの
・初音ミクなどは結構触っていたが、人力ボカロというのはやったことが無い。10年くらい前に宇多田ヒカルの声でやってる動画を見ておーすごい、と思ったくらい。
・文字をただ拾って「こ」「ん」「に」「ち」「わ」とか歌わせても不自然になるだろうなというのはなんとなく思っていた。おそらく重要なのは前の文字の母音と次の文字に繋がる母音ではないかと私は考える。
・例えば「今日」と歌わせたければ「きょ」と「う」を拾ってくるのではなく、「Trauma」のド頭「今日の嬉しかったこと…」とか「SEASONS」のサビ「今日がとても…」から一部を拾ってきた方が自然になるだろうと考えた。
・結論としてその考えは間違っていなかった。が、必要なのはそれだけではない、というかそれは「基本のき」だった。

まず聞いてみた
・DLしたデータはハモリ、リバーブ、ディレイ、本人歌唱以外のクワイア類もそのまま収録されていた。これが後に最大の障害となる。
・まぁこの辺はメロダインのポリフォニック検出・編集とかで何とかなるんじゃねえかな、と私は軽く考えたがそんなことは無かった。

■メロダインでのハモリ解除
・結論から言うと結構助けられたのだが、使用したのは296トラック中で4~5トラックくらい。
・最大の利点はハモリ込みのデータから主メロだけを抜くことが出来るかもしれないという点だろう。
・基本的にCubase内でARAエクステンションとして使用したのだが、まずこのARAの動作が不安定。何回か止まったりwavが空になったりした。

・過度の期待はしていなかったが、やはり何でも引っこ抜いたり消したり出来るわけではない。ハモリパートを1oct上で認識していたり、ハモリを消してみたらメインパートの倍音まで削れてしまったのか変に細く聞こえるようになってしまったり。
・何トラックか試した結果、ハモリの入ってる部分は基本的に使えないという結論に落ち着き、どうしても仕方ない場合を除いてはハモリなしの部分を使う方向にシフトした。

元データに適用されているエフェクト
リバーブ
・ちょっとしたリバーブが入ってくるくらいならそれほど問題はないのだが、語尾など長めに伸ばす文字をリバーブ込みで使用してみたところ当然ながら波形を切ったところで残響もぶつ切りになり非常に不自然。元データの残響は基本使用しないことにし、リバーブを上書きするような処理で誤魔化した。
・「Who」などはバラードでゆったり歌っているので結構使ったが、他の曲と比べてもかなりリバーブが深いため場面を選ぶ印象だった。

ディレイ
・ディレイの方が問題で、これはメロダインでは音量の問題なのか内部アルゴリズムがAI的にポリフォニックとして判断していないのか、ほぼ検出されなかった。
・例えば使用率1位の「CAROLS」の3サビなどはハモリ無しかつドライで歌っており使いやすいデータなのだが、「私」という歌詞の所から「わーたし~~~」とディレイが追いかけてくるため、「し」の途中くらいまでしか使えない。
・その他ピッチ変更を行うと当然前の文字から残っているディレイなどの音のピッチも変わり、運が悪いと不協和音・ノイズ化する。何文字か妥協した。

◆歪み系、モジュレーション系など

・「too late」の平歌部などは全体に歪みとバンドパスフィルターが入っており使用不能であった。
・「ANGEL'S SONG」の後半は何だろうなこれは。フランジャーとかリングモジュレーターの類だろうか。Wavesで言うとMetaflangerとかでそれっぽい効果が生み出せそうだ。当然使用できない。
・あとどの曲か忘れたがオートチューン的ケロケロボイス等もあったり。

要するに浅めのリバーブ・ディレイはまぁセーフ、極端なエフェクトが乗っている音声は使えませんでした、という感じ。

時期ごとの歌い方や声質
・基本的に2nd「LOVEppears」あたりから6th「MY STORY」あたりの声質が私の中でパッと思い浮かぶ浜崎あゆみ像である。1st「A Song for ××」は入りにも語尾にもクセが少なく、ビブラートもほぼない。2ndも比較的ビブラートは控えめではあるもののいわゆる「あゆ節」が確立され始めている時期の印象。3rd「Duty」は個人的最高傑作。売り上げ面でも史上最高である。全身ヒョウ柄のアルバムジャケットは当時世間を賑わした。
・2010年以降は曲にもよるのだがかなり深いビブラートを使うことが増え、場面によっては使いづらいことも。
・全時期を通じてファルセットを使用している曲が極端に少ない。すべて確認したわけではないが「SEASONS」以外でパッと思いつくファルセット歌唱が無い。「そんな日々もあったねと」の部分はメロダインでハモリを抜いてありがたく使用させていただいた。

音の高低、長さエディットの許容範囲
ぴったり同じ音程で同じ文字、という音節は数えるほどしかなかった。必然的にどれもピッチシフト、タイムストレッチ、間を詰めてクロスフェード等の処理を施すことになる。

◆ピッチシフト
・こちらは意外に許容範囲が広く、上下2音くらいなら極端に違和感は出ない。が、Aメロなど低く作りすぎてしまった部分やサビ部の最高音等は5度くらいのシフトが必要になってしまい、音質劣化を招いた。
・伸ばしている音の途中でのピッチ変化はどうにも不自然になりがち。何箇所かで仕方なく適用したが。

◆タイムストレッチ
・延ばす方について。ピックアップしている音が1文字とかの場合、ほんの少し延ばすだけでも130%くらいのストレッチになるためケロケロ的なノイズの発生が頻発。どうしても仕方ない部分はメロ自体の譜割りを変更するなどして対応した。あゆに歌わせるのではなく歌っていただいているという感じ。
・縮める方について。こちらは比較的ノイズが発生しづらく、それほど問題になる場面は少ない。が、文字全体を縮めると当然子音も短くなるのでかなりニュアンスが変わってくる。「さしすせそ」「まみむめも」などは子音部がかなり長かったりするので、子音部の終わりにハサミを入れてそれ以降をタイムストレッチ、クロスフェードで繋ぐ等の処理をした例も。ビブラートも同様である。

・余談だが1サビに入る前の「して」の2文字は音程も長さも「evolution」の「思い出して」の部分がぴったりだったのだが、声を張りすぎだったのとディレイ深すぎだったので却下になった。

音量やEQの調整
・音量に関してはオートメーションではなくクリップボリュームで調整した。コンプレッサーは使用せず、目と耳で判断。ただし音量を馴らしても張り上げてる声と囁いている声では当然綺麗に繋がらない。
・EQは主にミドルカット、ハイ上げをする方向でリージョンごとに調整。囁くように歌っている部分などは基本的にこもって聞こえるのでスッキリ聞こえるようにした。一部ハイ下げの方向で調整したデータもあった。

後半に行くにつれこなれてゆく
・前半では子音だけを拾って別の曲の母音で伸ばす…というような処理もしていたが、苦労の割に報われないためあまりやらなくなっていった。

・1文字見つけたら次の文字も同じ曲の中で探した方が音質面でも歌い方面でも圧倒的に繋がりが自然なことに後半に入って気付く。そのため10文字連続で「immature」から使用出来た部分などもあった。

使用率ランキング
動画内では5位まで表示したがこちらでは20位まで公開。

1位 CAROLS:26文字
2位 LOVE ~Destiny~:23文字
2位 Zutto…:23文字
4位 immature:21文字
5位 YOU:19文字
6位 Dearest:17文字
7位 appears:16文字
8位 Far away:15文字
8位 Who:15文字
10位 HEAVEN:14文字
10位 SEASONS:14文字
12位 End roll:13文字
12位 SURREAL:13文字
12位 too late:13文字
15位 A Song for XX:11文字
15位 Moments:11文字
15位 Together When:11文字
15位 vogue:11文字
15位 Voyage:11文字
20位 JEWEL:10文字
20位 MOON:10文字

以下略。…となっている。やはりバラードが多いですね。歌い方もテンポもゆったりとしたものがハマりやすかった。

曲ごとの歌唱や使用感
・「Independent」「July 1st」「Greatful days」などは夏っぽくて非常に好きな曲なのだが、残念ながら譜割りが細かい、テンポが速い、歌い方が明るいなどの理由で1文字も使用出来なかった。
・「WORDS」は何文字か使用したが、平歌部は明るいというか可愛らしい歌い方の印象、サビ部は迫真すぎという理由でちょっと使いづらかった。
・「kanariya」「forgiveness」「SEASONS」などはスローテンポで使いやすそう…と思いきや、コーラス・クワイア隊がガッツリ参加している部分が多いため使える部分が非常に少なかった。
・全体的にサビ部はハモリが入っている場合がほとんどなので、3サビなど静かな部分で一声で歌ってる部分が無いか…に一縷の望みを賭けるパターンが頻発。逆に「JEWEL」のサビにはハモリがない。これもとても良い曲ですね。

すべての歌詞選別・入力終了、その後
◆ボーカルデータ編集

・歌詞選別、入力、調整は8月半ばくらいから始めて4か月近くかかった。まぁ空き時間に少しずつ進めてたので1日に作業できる時間はせいぜい3時間程度、それも毎日作業出来ていたわけではなかったのだが。
・運が悪いと30分で1文字とかしか進まない場合もある。精神的な疲労感が非常に激しく、今日は5文字でダウン、という日もままあったのだった。

・さてボーカルデータは完成し、お楽しみのオケとのミックスタイムである。といっても選別段階である程度音質・音量は馴らしてあるので、場面場面でリバーブのMix量を調整したくらいである。だが本当の地獄はこれからだった。

ハモリ部の生成、ノイズの発生
・ハモリに関してはある程度の不自然さはもう仕方がない。逆にハモリがつくことで繋ぎの不自然さが誤魔化せたりしないだろうかと甘い考えが脳裏をよぎる。結果として部分的にはまぁそうだったのだが。

・元のアカペラ音源が高音質wav等ではないこと、リバーブやディレイ込みでピッチシフトを適用していること、ハモリに関しては一度ピッチシフトを適用した音源にさらにピッチシフトを重ねており、場所によっては6度以上のシフトが掛かっている部分もある。
・その結果、低レートのmp3のようなシュワシュワしたノイズが多量に発生。主メロとハモリを同時に流すことでそのノイズは倍増、ボーカルトラックの他マスターにコンプレッサーなどを通すことでノイズはさらに増大し、見て見ぬふり出来るレベルを遥かに超えた低音質ボーカルデータが出来上がってしまった。

・正直もうこれに関してはどうにもできない。ハモリパートのEQ調整でほんのわずかでも聴感上ノイジーな部分を削り、部分部分の音量を調整して誤魔化すくらいしか残された手は無いのだった。万事休すだ。

まとめ
・様々な面で初体験の作業で、やりがいはあった。そもそもこんな作業が必要になる場面は限られていると思うのだが、似たような内容としては故hide氏の「子 ギャル」という楽曲は生前に残されたボーカルデータを使用、ボーカロイドのノウハウを利用して作られたものらしい。

・しかし今回の作業はアカペラデータとは言っても前述のようにハモリや空間エフェクトは入っているし条件は非常に悪い。個人なのでボーカロイドのエンジンを拝借することも出来ない。そんな中で出来る限りの人力ボカロ作品が出来たのではないかと個人的には思っている。ご清聴頂けたのなら幸いである。二度とやらないけどな!

・歌データを提供してくれたavex公式、浜崎あゆみ氏に最大限の感謝を。

おわり。ほんとに疲れた。

この記事が気に入ったらサポートをしてみませんか?