見出し画像

生成AI:画像にブツを描き足す「Generative Fill」レビュー

画像生成AIプラットフォーム「Clipdrop」のツールのひとつ、「Generative Fill」を使ってみたのでレポートします。

どういう機能か?

generative:生成的な、創造的な
fill:塗りつぶし

画像の上に別の絵を描き足す機能。

もう少し具体的に言えば、元の画像の一部をフリーハンドで範囲指定して、その部分に追加したい画像の説明をテキストで入力すると、自動的に画像が生成されて追加されるという機能です。

Clipdropのサンプルでは、女性の頭のまわりをドラッグして範囲指定し、
「a wizard hat」(魔法使いの帽子)
と指定していました。

結果はこんな風になっています。

魔法使いの帽子が生成された(公式サンプルより)

※Adobe Photoshopに同類の機能「ジェネレーティブ塗りつぶし(生成塗りつぶし)」があります。
Photoshopのジェネレーティブ塗りつぶしは、生成、補完、消去などが統合された機能になっているようです。
Clipdropは、それらの機能がGenerative Fill、Uncrop、Cleanup、Replace Backgroundなどの単機能に分かれています。

さて、いっちょ試してみよう!

元画像が必要なので、以下の記事で作成した中から選ぶことにします。

「DALL·E 3」で出力した以下の「パソコン女子」4枚のうち、今回は左上にいるボブカットの女の子をモデルとして登場してもらうことにします。

今回のモデル DBさん(仮名)

なぜか左右にマウスを配置するトリッキーな使い方をしているので、「デュアルマウスのボブ」の略でDB。

元画像

まずはサンプルにならって帽子

頭の部分をドラッグして範囲指定します。
青い点線が、フリーハンドで選択した範囲です。

頭の部分をフリーハンドで範囲指定します。

野球帽をかぶらせてみます。
テキスト欄に「a baseball cap」と入力してEnterキーまたは青いボタン。

結果

おお!ちゃんと頭に合ったキャップをかぶってくれました。すごいな。

特に色や模様の指定はしなかったので、似合いそうな水色の帽子になったようです。

次はヒゲを付けて遊んでみます

ちょっとおふざけで、口まわりを範囲選択。
「beard」(=ヒゲ)と入力します。

なんとなく背徳感

結果

あっはっはっは。

「フォッフォッフォ」という笑い声が似合う立派な髭。貴族か。
どう見ても、ムッとして怒っているような表情に見えます。
変なことさせてごめんね。

お次は目もと

眼鏡をかけたら、より知的な雰囲気になるでしょうか。

「a metal frame glasses」(メタルフレームの眼鏡)を描き足してみます。

結果・・ ブォッフォ🤣

思ってたんと違うー!

いや、たしかに金属フレームのグラスだけど。これがサイバーパンクというやつか?(違う)。
目つき・・目つきが・・
これじゃあ眼鏡じゃなくて、仮眠時の面白アイマスクだな。

※知的なメタルフレームの眼鏡(イメージ)

まだ少し動揺していますが、気を取り直して・・

お次はこれ

両腕の間、お腹のあたりを範囲指定してみます。
で、「cats」(猫)を追加。

結果!!

おおお!これはいいんじゃないか?かわいいぞ。

「cats」と複数形で書いたけど、1匹だけでした。
かわいいの二乗で、なかなか破壊力がある画像になりました。
心なしか、機嫌が直って少し嬉しそうな表情に見えます。よかったです。

【結論】わりと遊べます

眼鏡は失敗でしたが、他の指定は「ほぼ一発」で生成された画像です。

一から画像を作成する詳細なプロンプト(指示)と違い、ごく短いセンテンスで指定するので、あまり細かな設定は困難です。

よって、運任せの要素もかなり大きいですが、
①めちゃくちゃ簡単
②まあまあ高速(10秒程度)
③気に入るまでリトライ可能(履歴も残る)
という特徴があり、範囲指定さえきちんとすれば、精度もそこそこ高いと思いました。

ちなみに、「眼鏡」は範囲指定の方法を変えたり、他の人物画像にして試しましたが、どうしても形が崩れてしまい、うまくいかなかったので諦めました。

苦手なことを無理矢理やらせるのは、人間もAIもイヤでしょう。
得意なことを伸ばしてやれば良いってことですね。

興味があればお試しください。
無料でも1日20回まで試すことができます。
(※無料版は速度が遅い可能性があります)

関連記事

だいたい、ここまで1,800文字くらい。

Clipdrop ―「Generative Fill」のご紹介は、ここで終わります。

面白いのはわかった。で、何の役に立つの?


初の試みとして、ここから先はもう少し深掘りした第二部です。

ビジネスシーンやクリエイティブ活動で、「どんな役に立つのか?」を考察してみます。

試しに遊びで使ってみたいだけの人、あるいはすでに実務で活用しているプロのデザイナーなどの人は、読む必要はないと思いますので、ここで閉じてくださって全く問題ありません。


第二部

Generative Fillの可能性、どう役立てる?

この機能の有効性を、3つの観点から考えてみました。

ここから先は

2,422字 / 11画像

¥ 300

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?