見出し画像

歌声合成ソフトのツールバーでよく見る項目

皆さんこんにちわ。くろ州です。

皆さんは歌声合成ソフト作ろうと思ったことありますよね?

そんな人のために「既存の歌声合成ソフトのツールバーによくある機能」をまとめてみました。早速行ってみましょう。

基礎的な話

今回の解説で出てくる専門用語を説明しておきます。

ピアノロールエリア:ノートを打ち込むエリア。縦軸が音名、横軸が時間のグラフ
パラメーターパネル:音声を編集する「パラメーター」を編集できるパネル。フロートだったりフロートじゃなかったりする
トラックエリア:トラックの表示や編集ができるエリア
ミキサー:1つ以上のトラックをまとめて操作できるパーツ

今回はVOCALOID4、CeVIO AI、UTAU、OpenUTAU、SynthVのツールバーをチェックしました。

ファイル

歌声合成ソフトに限らずどんなソフトにもある「ファイル」。さすがにソフトごとにあんまり差がない。

新規/開く/保存/名前を付けて保存/インポート/エクスポート/最近使ったファイル/終了

インポート・エクスポートできるファイル形式はソフトによって異なる。大体は音声/MIDI/プロジェクトファイルを入出力できる。OpenUTAUは

CeVIO AIには自動バックアップ機能があるため「ファイル」の中に「バックアップを開く」という項目がある。

UTAU以外には「トラックのインポート」機能がある。UTAUは単一トラックしか扱えないため存在しない。

OpenUTAUには「テンプレートから新規作成」「テンプレートを保存」という機能がある。同ソフトは自由度が高く、プロジェクトごとにパラメータセットを変えることもできる反面、毎度の設定が面倒なため、テンプレートという概念を実装している。

編集(一般的なコマンド)

編集部分は一般的な編集コマンドと各ソフトの機能に関わる項目が混ざっている。一般的な編集コマンドは以下の通り。

元に戻す/やり直す/コピー/ペースト/切り取り/削除/全選択

CeVIO AIは上記の7項目しかなくシンプル。OpenUTAUには編集タブがない。

VOCALOID4では全選択をするとパラメーターを含む全てのデータを選択している(と思われる)。加えて「全イベント選択」という項目もあり、こちらはパラメーターを含まない全てのノートを選択できる。

UTAUには全選択の他に「始音から終音まで選択」という項目がある。UTAUでは五線譜と同様に休符を入力するため、「始音から終音まで選択」は「プロジェクトの最初の休符ではないノートから末尾の休符ではないノートまでを選択する」という意味になる。

SynthVには全選択の他に「パラメーターを全選択」という項目がある。これはノートではなくパラメーターの全ての制御点を選択する。

編集(ソフト固有の機能に準ずるもの)

VOCALOID4には「オートノーマライズモード」という項目がある。同ソフトには「ノーマライズ」というコマンドがあり、これは「2つのノートが時間軸上で重なり合うことを防ぐため、後ろのノートの始点を基準に前のノートの末尾を切り詰める機能」である。ANMをオンにしておけば、ピアノロール上にノートを配置する際に自動的にノーマライズされる。

UTAUには「Rを挿入」という項目がある。Rは休符を指す言葉で「Rを挿入」を実行すると、デフォルト設定されている長さの休符を挿入する。

編集(ソフト固有の機能に準じないもの)

UTAUには「選択範囲を名前で選択」という機能がある。これはあらかじめ命名しておいた「範囲」を指定して選択できる機能。

UTAUには「結合」という項目がある。これは選択した複数のノートを結合するもので、各ノートの歌詞も削除せず結合する。

UTAUには「選択範囲」という項目がある。これは選択した範囲にある複数のノートに対して一括で限定的な調声処理を実行する機能。

SynthVには「ノートのパラメーターを選択」という項目がある。これは選択したノートに適用されたパラメーターの制御点を選択する機能。他にも「選択解除」「選択内容を削除」といったコマンドもある。

SynthVにはクリップボードへの保存やクリップボードからのコピーなどのコマンドが編集タブ内にある。

表示

表示の内容は、各ソフトのUIにより左右されるため共通項は多くない。

VOCALOID4

ツールバー/グリッドライン/スタートマーカー/エンドマーカー/コントロールパラメーター/歌詞発音記号切り替え/発音記号優先表示/ピッチカーブ表示/ノートの歌唱スタイル/ミキサー

「ツールバー」には「鉛筆ツール」などの一般的なツール類とトランスポート系(再生コントロール)及びピッチレンダリングボタンが含まれる。VOCALOIDは「ピッチレンダリング」をするまでUIにピッチカーブを表示できず、自動的にレンダリングすることもないためこのボタンが存在する。

「グリッドライン」は他タブで指定したグリッド幅をピアノロール上に表示する機能。マーカーは繰り返し再生の始点終点を示すもの。「コントロールパラメーター」はパラメーターパネルを表示するコマンド。

「歌詞発音記号切り替え」はノート上に歌詞や発音記号を表示するコマンド。デフォルトでON。「発音記号優先表示」はノートに表示される歌詞と発音記号の表示順を発音記号→歌詞にするコマンド。デフォルトでは歌詞→発音記号の順。

「ピッチカーブ表示」はレンダリングしたピッチカーブを表示する機能。「ノートの歌唱スタイル」はノート下部にアクセントやビブラートが適用されていることを示す記号を表示するコマンド。

UTAU

拡大縮小/拍子/音リスト/縦拡大縮小/曲線

「拍子」はピアノロールの拍子表示を3拍子にするか4拍子にするか切り替えられるコマンド。

「音リスト」は現在のプロジェクトに適用されているUTAU音源で使えるエイリアス(UTAUのUIから音素を呼び出すのに使う文字列)の一覧を表示する機能。

「曲線」はピアノロールの表示モード切替機能で、有効化するとピッチカーブやパラメーターなどの詳細情報を表示するモードに切り替わる。

CeVIO AI

標準・全画面・コンパクト/タイムベース/ツールバーの位置・フォント

「標準・全画面・コンパクト」はUIの表示モードを切り替えるコマンド。コンパクトではキャラのイラストのみ表示され、調声操作はできなくなる

「タイムベース」は時間軸の刻みを秒にするか拍にするかを指定するコマンド。

表示タブではない場所(ソングタブ)にはピアノロールの横軸(時間軸)にテンポ、拍子、調号、強弱記号を表示するか否かをコントロールする項目もある。

SynthV

ダイレクトピッチ編集/サイドパネル

「ダイレクトピッチ編集」はピアノロールに表示されたピッチカーブを直接編集できるモードの変更するコマンド。通常はパラメーターパネルで編集する。

「サイドパネル」はSynthVの第2のツールバーともいえるサイドパネルを表示する機能。SynthVではソフトの設定やノートのプロパティーなどあらゆるコマンドがサイドパネルから実行できる。

OpenUTAUには表示タブがない。

プラグイン系

UTAU、OpenUTAU、SynthV、VOCALOID4にはプラグイン機能があるため、それに関するタブが存在する。

プラグインの実行/プラグインの管理

VOCALOID4では「Jobプラグイン」という名前。外部プラグインの実行管理の他にも「ノーマライズ」「歌詞の流し込み」「テンポをインポート」がある。テンポは外部ファイルからテンポ情報のみをインポートするもの。

UTAUでは「ツール」タブにまとまっている。外部プラグインの実行管理の他、UTAU特有の「原音の設定」「prefixmapを編集」などのコマンドも含まれる。

OpenUTAUではサブウィンドウの「一括編集」タブの中にある。OpenUTAUにはメインウィンドウとサブウィンドウがあり、メインウィンドウではトラックの編集ができ、サブウィンドウではトラックごとの調声作業ができる。

一括編集の中にはクオンタイズやトランスポーズ、編集の初期化、歌詞変換、UTAU特有の操作などノートの編集に関わる機能群が大量に含まれる。

SynthVでは「スクリプト」タブにまとまっている。

トラック系

UTAU以外は複数トラックを扱えるため、トラックやパートに関するコマンドが存在する。しかしトラックはトラックエリアでも編集できるため、項目内容は細かい部分で異なる。

トラックの追加

共通部分は以上。VOCALOID4には「名前変更」と「トラックの合成」がある。「トラックの合成」を実行すると音声がレンダリングされ、再生時の負担が軽くなる

CeVIO AIには「複製」「削除」「移動」「クリア」「フリーズ」「ミュート」「ソロ」「キャスト変更」もある。「フリーズ」はVOCALOID4の「トラックの合成」と同様に音声を事前にレンダリングすることでPCの付加を軽減する機能のこと。

SynthVには「ミュート」「ソロ」「新規オーディオトラックの追加」「前後のトラックへ移動」などがある。

トランスポート系

再生に関するコントロール。

再生/停止/先頭へ移動/末尾へ移動/リピート再生

他にも複数のソフトで共通する機能としては「再生位置へ移動」「オートスクロール」「指定位置への移動」がある。

多くのソフトでは一般的に再生を停止すると再生カーソルは停止位置にとどまる。「再生位置へ移動」コマンドを実行するか、モード変更で常時再生位置へ移動するよう設定されている場合は、再生開始位置に戻るようになる。何度再生しても同じ位置から再生されるため調声に役立つ。

オートスクロールは再生カーソルが画面外に出ないようピアノロールを自動的にスクロールする機能。OpenUTAUには2種類のオートスクロールがあり「カーソルが画面外に行かないようピアノロールを更新する」モードと「カーソルの表示位置を固定しピアノロールをスライドさせる」モードを選択できる。

VOCALOID4には「巻き戻し」「早送り」という機能がある。これは再生速度をr倍するものではなく「再生状態を保ったまま1小節前/後に移動する」機能。

SynthVにはリアルタイムMIDI入力機能もなぜかトランスポートに含まれている。

UTAUには「選択部分を再生」「今聞いたのを保存」という機能がある。UTAUは合成にそこそこの時間がかかるため範囲指定をして再生する機能に需要がある。「今聞いたのを保存」は試聴のためにレンダリングした音声をWAVEファイルとして保存する機能。

歌詞系

多くのソフトに共通する機能としては「歌詞の流し込み」のみ。これは複数のノートにまたがって一括で歌詞を入力する機能。スペースや指定した記号を目印にして各ノートに歌詞を割り当てていく。

また、SynthVとVOCALOIDには歌声合成側にも辞書機能が存在する。

VOCALOID4には歌詞入力したが適切な発音記号が適用されなかった場合に使う「発音記号変換」、歌詞を一括でクリアする「デフォルト歌詞に戻す」、ノートのあらゆるプロパティを確認・変更できる「ノートプロパティ」などがある。

UTAUのツールバーには歌詞操作系がない。UTAUが歌詞でコントロールする要素が非常に多いことからプラグイン側で対応されることが多い。

CeVIO AIには「音素で歌詞入力」「英語歌詞の自動分割」がある。英語歌詞の自動分割は英語の歌詞を自動的に1音節1ノートに分離して当てはめる機能。

SynthVには「歌詞シフト」「音素リセット」機能がある。音素リセットはVOCALOID4の「発音記号変換」と類似の機能。歌詞シフトは指定区間のノートに入力された歌詞を前後にずらすもの。

クオンタイズ系

多くの歌声合成ソフトにはクオンタイズ機能があるのだが、これはグリッドラインにノートの先頭・末尾を合わせる機能ではなく、グリッド幅を指定する機能のことが多い。いわゆる「クオンタイズを掛ける」という操作はできず、基本的にはDAW側で実行する必要がある。

多くのソフトで共通する機能は「グリッド幅の指定」「休符を詰める」の2つ。

クオンタイズ機能そのものを実装しているのはUTAUとSynthV。SynthVには「スマートクオンタイズ」というノートの先頭や末尾をグリッドラインに近づける機能もある。

類似機能である「休符を詰める」はUTAUとCeVIO AI、SynthV、OpenUTAUに存在する。これは指定した長さ以下の休符もしくはノート間の隙間がある場合に、直前のノートの末尾を後ろにずらすことで隙間を埋める操作のこと。VOCALOIDは短い隙間を無視する挙動をとるため同機能がないと考えられる。

トランスポーズ系

1つ以上のノートのキーを上下する操作をトランスポーズと呼ぶ。ノートを全選択してずらせば再現できるが、UTAUとSynthVではツールバーにも項目がある。

1オクターブの上下に対応している:SynthV

半音の上下に対応している:UTAU

指定したキー分の上下に対応している:UTAU、SynthV

別トラックのノートを表示

表示タブにないことも多いが、そこそこのソフトに実装されている機能。CeVIO AI、SynthV、OpenUTAUにはある。VOCALOID4はデフォルト、UTAUは単トラックなのでなし。

ショートカット系

VOCALOID4とSynthVにはショートカットキーを変更する機能がある。

その他

VOCALOID4

VOCALOID4にはパート系がある。トラック内に複数のパートを配置できるためそれらの追加分割結合ができる。またパート単位でケロケロボイスにする機能もある。VOCALOID4の最終的なピッチカーブは複数のパラメーターの乗算で導かれるが、これをピッチパラメーターに集約する機能もある。

VOCALOID4にはVOCALOID音源の設定プリセット機能がある。デフォルトとするパラメーターの値などを指定できる。

VOCALOID4はミキサーにVSTプラグインを挿入できるため、VSTプラグインの管理機能が存在する。

UTAU

UTAUには検索機能がある。これは指定したエイリアスをプロジェクト内で探したり、あらかじめ設定しておいたラベルの位置に移動したりする機能のこと。

CeVIO AI

CeVIO AIには「調整モード」という項目がある。これには表示するパラメーターパネルの選択と自動ビブラートの無効化が含まれる。CeVIO AIはPITパラメーターとビブラートパラメーターの乗算で最終的なピッチカーブが完成する。自動ビブラートを無効化すると自分が描いた線がそのまま最終的なピッチカーブになる。

CeVIO AIには「小節の挿入・削除」という項目がある。これは指定した位置に指定した長さの小節を挿入・削除するもの。

CeVIO AIには「まとめ選択」という項目がある。これをONにしているとノートを移動するときに調声済みパラメーターが付随して移動する。他ソフトではパラメーターも含めて選択すれば実現できる。UTAUはパラメーターがノートのプロパティーのようになっているために選択しなくても勝手に付いてくる。

SynthV

SynthVには「ピッチリセット」「タイミング音素リセット」「デチューンリセット」などのリセット機能がある。また、パラメーターの制御点を追加する機能や間引きする機能もある。

VOCALOID4にはパート機能があるが、SynthVには類似の概念として「グループ化」機能がある。これは指定した範囲をグループ化してサンプルとして複製できる。

SynthVには「自動処理」タブがある。同ソフトは自動調声機能が売りで、自動で調声してくれる「自動ピッチ調声」や、ノート分割を使った自動調声ができる「ノートを分割してメロディーを調整」、別の自動調整結果を生成する「新しいテイクを生成」などの機能が含まれる。

他にも音声を楽譜データに変換する機能や、ベンチマークを実行してパフォーマンスを引き出せるよう各種設定を最適化する機能も存在する。

OpenUTAU

OpenUTAUはUTAU特有の歌詞操作がかなりの種類ある。それ以外ではビジュアルに関する設定が多く「ピアノロールの背景にイラストを表示」「UIにトラックカラーを使用」「ピアノロールに階名を表示」などがある。

また、UTAU音源そのものを編集する機能も(外部ツールとの連携が必要だが)存在する。

OpenUTAUにはオリジナルのパラメーターをユーザーが追加できる(サードパーティー製エンジンが搭載しているパラメーターをGUIで操作できるようにするものであってアルゴリズムを追加するものではない)機能もある。

OpenUTAUにはさまざまな言語の単語等を入力すると発音記号に変換するミニツールも存在する。

この記事が気に入ったらサポートをしてみませんか?