機械学習勉強中

画像生成や大規模言語モデル、音楽生成など

機械学習勉強中

画像生成や大規模言語モデル、音楽生成など

最近の記事

StableDiffusionとAnimatediffとFreeUでハイクオリティな動画を作る方法。

前回の記事で、お褒め頂いた動画の生成方法と用いた技術や工夫を紹介させて頂きます。 なお技術は日々進歩しているのでStableDiffusionの拡張機能FreeUも今日現在version2に進化しており、同じデータセットとprompt、シード値で生成しても少し違う動画になってしまいました。 でも問題ありません。FreerUは今日(2023年10月23日)現在version1と2の選択が可能です。 FreeUをversion1に変更したところ、幸いなことに前回と同じ動画が

    • StableDiffusionとAnimatediffの進化 クリエイターと生成AI

      前回の記事でも終盤にAnimatediffで生成したアニメーションGIFを掲載しましたが、あれから更に進歩して、より自然なアニメーションやフレーム補間技術を応用して長尺の動画が作れるようになりました。 今回はそれらを紹介したいと思います。 更にアニメーションGIFではなくH264 mp4動画ファイルが作成可能になりフレーム補間技術を組み合わせることで、フルカラー(24Bit)でファイルサイズが軽量な動画が生成できました。 どれもハイクオリティかつ自然な色合いで驚きました。

      • 画像生成AI StableDiffusionで、手書きイラストを作り変えました。

        私は今まで機械学習の勉強をし、環境構築しながらTensorflowやPytorchのチュートリアルを動かして機械学習を学んでいたところ、 昨年の夏、8月の末にはオープンソースの画像生成AI StableDiffusionの登場。 秋には対話型大規模言語モデルChatGPTが登場し、それに続くようにオープンソースの大規模言語モデルが続々と公開され、 公式ウェブのデモサイト等ではなく、自身のPCのLinuxやWindowsやWSL2上でAIが動作するローカル環境を構築し、改良や更

      StableDiffusionとAnimatediffとFreeUでハイクオリティな動画を作る方法。