見出し画像

子供の時の絵を AI で学習、生成してみよう! #描画タイムマシン

割引あり

つくる人をつくる!AICU media の 知山ことねです。

昨日の記事「VRoid Studio を使ってキャラクター LoRA を作ろう!」が好評で、LoRA の制作に興味を持っている方からの「ぜひやってみたい!」という声を聴くことができました。

ところでこちら、画像生成AI「Stable Diffusion」の一大ブームを予言した深津貴之さんのつぶやきです。 

▶世界変革の前夜は思ったより静か|深津 貴之 (fladdict) @fladdict

https://note.com/fladdict/n/n13c1413c40de

https://note.com/aicu/n/n9d5cf46761b7

子供の頃の絵って魅力的ですよね。Soraが正式リリースされるのはまだわかりませんが、うかうかしていられませんね!

子供ゴコロあふれる「真の芸術」を爆発させていきましょう。

今回は、画像生成 AI でたびたび話題になる「下手な子供の絵を生成する AI」、命名「描画タイムマシン」を Stable Diffusion の LoRA 学習を利用して作っていきます!

美と知能を超え、人間性を爆発させていきましょう。

Google Colabだけで作る描画タイムマシン


描画タイムマシンは学習元の画像データと Google Colab だけで完成するので、皆さんもぜひ、自分の幼少期の絵やお子さんの絵で一緒に作ってみてください。


用意するもの:小学校時代の黒歴史

まずは学習元の画像、データセットを用意します。

今回は、この原稿を書いている私、知山ことねが小学生の時に自由帳に描いていた直筆雑誌「ザ・コトネ」「ことまが friends」を用意しました。

この雑誌を後生大事に保管しておいてくれた友人に感謝します
よっぽど愛されていたんですね

この色鉛筆の質感と歪んだデッサンが小学生らしいですね。
これらのページをスキャンして、画像データとして PC に取り込みます。

写真でも構いません

学習には15~40枚ほどの画像を用意することをおすすめしますので、1枚の絵をそのまま学習したい場合は、絵を最低7,8枚ほど用意しましょう(後述しますが、あとで左右反転コピーを行って枚数を増やすことができます)。

今回は1枚の紙に複数イラストが描かれているため、貴重なサンプルとして切り取ってデータセットを増やしていきます。雑誌の中のイラストを多く含んだ箇所20ページほどをスキャンしました。

スキャンしたページ

PC に取り込んだら、画像をそれぞれトリミングしていきます。今回は LoRAを扱いやすい Stable Diffusion (SD1.5) で学習を行うので、Photoshop 等を使い 512×512 px の正方形に画像を切り取っていきます。これを正則画像化といいます。

またこのままではノートの罫線や文字、透けている裏の紙の内容などのノイズも学習されてしまうので、それらの不要な部分は塗りつぶして消去し、画像全体のコントラストを上げるなどの色調補正も行いました。

これをイラストの枚数分繰り返し、正則画像化済みの画像のデータセットを作りました。

正則画像化された わたしの"こども"たち(多義)

またこの時に、用意できた画像の枚数が少ない場合や、画像の左右のバランスが望まない崩れかたをしている場合(左向きの顔が多い、など)は、左右反転したコピーPhotoshop等で作成し、保存しましょう。

また、LoRA を作ったことがある人ならご存じかと思いますが、学習時に画像をセットにして学習を行うため、画像枚数を2の倍数、具体的には 「2,4,…で割り切れる枚数」に揃えましょう。今回は32枚にしています。

学習

ここから先は

1,624字 / 5画像
この記事のみ ¥ 0〜

この記事が気に入ったらサポートをしてみませんか?