見出し画像

最先端AIテクノロジー”DALL・E2”

第3回目の記事はOpen AIという会社が開発・発表したDALL・E 2(ダリ・ツー)という画期的なAIシステムについて紹介したいと思います。

近年セレブや有名人・政治家などのDeep Fake動画や画像が世間を騒がせ、あまりのリアルさに衝撃を受けた方も多いのではないかと思います。個人的に私も機械学習に興味があり、特にComputer Vison / Image Processing のエリアに興味があり、今回紹介するDALL・E 2の技術を知った時はAIの進歩に衝撃を受けました。
今、画像生成AIの分野では革命が起こっていると言われており、DALL・E2の他にもImagen(イマジェン)、Midjourney(ミッドジャーニー)など様々な画像生成系AIサービスが登場しました。

DALL・E 2(ダリ・ツー)とは?


DALL・E2 は自然言語(人間の言葉)のテキスト情報からコンセプトや特徴、スタイルなどを考慮したオリジナルでリアルなイメージ(画像)を生成することが出来るOpen AI社によって開発された画像生成技術です(今は試験的にOpen AI社によって承認された人だけが使用でき、一般公開はされていません)。

①例えば「宇宙飛行士 馬に乗る 実写(スタイル)」と入力すると下記のようなイメージを作り出すことが出来ます。


②また実際の写真を加工することも出来ます。下の三枚の写真は一番上がオリジナルの写真ですが、Photoshopなどでいちいち加工をせずともDALL・E2を使えば簡単にテキストでどの様な画像にしたいかを入力するだけで既存の画像を影、反射、テクスチャを考慮しながら要素を変更・削除・追加できます。

オリジナル
DALL・E2によって生成された画像 例1
DALL・E2によって生成された画像 例2

③それだけでなく既存の画像からインスパイアを受けて色々なバリエーションも作ることが出来ます。

オリジナル
DALLE2によって生成された画像

DALL・E2をユニークかつ顕著なシステムにしている技術は大きく2つあります。


① CLIP: Contrastive Language-Image Pre-Training
② DIFFUSION


① CLIP: Contrastive Language-Image Pre-Training
CLIPはイメージとテキストを結びつけることでコンピューターにイメージのコンセプトを覚えさせることが出来るニューラルネットワークの技術です。上記の例①で挙げた ”馬に乗る宇宙飛行士” も”宇宙飛行士” ”馬” ”乗る” というそれぞれのイメージとテキストをAIに覚えさせることでそれらを結びつけ全く新しい画像をAIが人工的に生成できる様になります。(参考記事:https://openai.com/blog/clip/

② DIFFUSION
CLIPで生成した画像をより鮮明でリアルにする技術が”Diffusion”となります。
機械学習やComputer Scienceを勉強していない方には少し理解が難しいですが「純粋なノイズから少しずつノイズを取り除いていくことで、最終的に何らかの画像を得る」という考えを元に高解像度のグラフィックを生成することが出来ます。

この技術によってこの世に存在しない人の顔をとてもリアルに生成することも出来ます。Random Face Generator (This Person Does Not Exist)というサイト(https://this-person-does-not-exist.com/en)では何万人もの人の顔の画像を読み込んでトレーニングされたAIが生成した人の顔(実在しない)を見ることが出来ます。

AIが生成した実在しない人の顔

DALLE2は人々のクリエイティビティや表現の幅を広げる大きな可能性を持った技術です。DALLE2を使えば、アーティストでなくても、誰もが簡単に頭の中で想像したイメージをグラフィックにする事が出来ます。
そんな最先端で人々をワクワクさせるDALLE2ですが、「アーティストやクリエイターの仕事を奪うことに繋がるのではないか」や「AIが生成した画像の著作権はどうなるのか」「自分の絵を勝手にAI学習に使われたく無い」などAI画像生成技術に付随する懸念も危惧されています。

新しいテクノロジーが出てこればその技術が悪用される可能性や様々な関連リスクなどは付き物ですが、その中でもAIは上手く活用すれば我々の暮らしをより良くも出来、反対に悪用されれば私たちの生活が危険にされることとなります。
今回の記事で少しでもAIの可能性や画像生成技術などに興味を持ってもらえたら嬉しいです。

【参考文献】
・DALLE: AI Made This Thumbnail!:https://youtu.be/yCBEumeXY4A

誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方:https://atmarkit.itmedia.co.jp/ait/articles/2209/16/news041.html

・Multimodal:https://openai.com/blog/tags/multimodal/



この記事が気に入ったらサポートをしてみませんか?