【信号処理】Melspectrogramがぼやけるとどうなる???【機械学習】
この記事の経緯とある実験でVAEに音声信号を学習させてました.音質をあげたり高度なSTOAレベルの信号生成が目的ではないので
「とりまシンプルなVAE + MelSpectrogram + Griffin-limでいいしょっ!」
て感じで実装しました.
(VAE, MelSpectrogram, Griffin-limそれぞれについての説明はしませんが検索やGPTに聞けばいろいろな情報があると思います. )
学習が終わって生成してみると,とにかく音質がわるい…
オリジ