見出し画像

Generative AI Transformation、略して「GAX」プロジェクトを立ち上げたわけ

AIを活用したマーケター向けクリエイティブ制作・改善サービス「AIR Design」とアプリケーション開発事業を展開するガラパゴスは、ビジョン「デジタルモノづくり産業革命」の実現を目指し「プロセスとテクノロジーで人をよりヒトらしく」というミッションを掲げ事業活動を行っています。
そんな私たちが3月31日にGenerative AI Transformationを推進するプロジェクト「GAX PJ」を立ち上げた背景について、AI研究・開発をスタートした2015年に遡り、そこから現在までのAI技術の変遷と共に紹介していきたいと思います。

2015年、スタートしたAIの研究・開発

ガラパゴスは2009年に製造業のコンサルティングを行う企業、インクスに勤めていた同期4名(そのうち1名は退職)が創業しました。
その同期は、現在の取締役である中平健太(CEO)、島田剛介(CPO)、細羽啓司(CTO)。創業後はWebサイトの制作、アプリケーションの開発といった事業を行っていましたが(アプリ開発事業は現在も継続)、2015年に着手したのがAIの研究・開発です。

これは中平が社内のSlackで ”Deep Learning” という真新しい言葉を見つけたことがきっかけでした。「直感的に、これは知らなくちゃいけないなと思った。」と振り返る中平は、当時、湯川塾という私塾に参加し、機械学習の実用化を行うユニコーン企業、株式会社Preferred Networksを立ち上げた西川徹さんAI研究の第一人者でもある東大の松尾豊教授らから、最先端のDeep Learningに関する教えを受けました。今では想像もできないくらい贅沢な面々ですが、これを機にガラパゴスはDeep Learningと画像生成の研究開発を本格的にスタートします。

AIがデザインをする未来がくる。と皆が本気で信じ、開始したのがロゴの自動生成プロジェクト。LogoのAIにちなんでLAILAIプロジェクトと名づけた本プロジェクトは製造業のコンサル経験を持つ取締役陣により、デザインに「プロセステクノロジー」という考えを応用、ロゴ制作工程を徹底的に可視化・仕組み化・構造化し、ロゴ設計の段階にDeep Learningによる画像認識技術GAN(Generative Adversarial Network)[敵対的生成ネットワーク]をフル活用したものでした。

さまざまな紆余曲折を経て(詳細は以下リンクよりご覧ください)LAI Systemを構築、ソースコードを実装し、ロゴデータを集めて加工したものに情報を付与し、そのデータを学習させ、「こういう画像を生成しなさい」と指示をした結果、30分でロゴが生成できるように。満を持してクラウドソーシングのコンペに参加したところ、デザイナーが作ったロゴをおさえて、私たちがAIで生成したロゴが売れたのです。まさに、デジタルモノづくり産業革命への一歩を踏み出した瞬間でした。

2018年、デザインAI事業本格化

それを機にデザインAI事業へ人もコストも費やしていくことになりますが、結果としてロゴの自動生成事業からピボットすることを決断します。当時のGANができたことは、いわゆるスタイルトランスファーと言われるもので、馬をシマウマにする、ライオンをパンダ風にするといった見た目を少し変えるような技術だったため、ロゴの生成レベルは非常に低く、ビジネスで活用するクオリティを担保することは難しかったのです。

出典:iMagazine「GAN:敵対的生成ネットワークとは何か~『教師なし学習』による画像生成」
自動生成初期のロゴ

日々改良を続けながらも、AI事業の今後について考えていた時に出会ったのがB-SKET。B-SKETとは、ベーシック社が主催しているスタートアップ向けアクセラレーションプログラムで「起業の科学」の著者でもある、当時ベーシックCSO(チーフ・ストラテジー・オフィサー)の田所雅之さん(現、ユニコーンファームCEO)がメンターでした。
そのプログラムでの活動と田所さん他、多くの方とのメンタリングによって生まれたサービスが「AIR Design」。AIによるロゴ生成の知見を生かしテクノロジーを積極的に活用することができ、かつマーケターのペインを解消することができる、私たちが求めていた三方良しのサービスが誕生しました。

2019年には、大量のクリエイティブデータを独自開発したシステムで管理・活用するための機械学習技術“Reverse Design”の特許を取得。プランニングやクリエイティブ制作にデータを活用し、仮説ではなく、より根拠をもって成果につなげることができる環境を整えました。
ローンチ以降も、複数のメンバーが、画像生成だけでなくAIの動向をキャッチアップし続けており、プロダクトに使えそうなAI技術がリリースされるとPoCを繰り返してきましたが、明らかにこれまでとは違う、変革の時期が訪れます。それが「Midjourney」と「Stable Diffusion」の登場です。

2022年、唐突に訪れたシンギュラリティ

OpenAIが4月に公開した「DALL・E 2」はクオリティーの高さから社内でも「最新のAIやばい!」と評判上々でした。それでも使える人が限られていたため広く普及はしないだろうなとも感じていました。しかし、その後7月に登場したのが「Midjourney」。入力したテキストから、まるでプロのコンセプトアーティストが描いたかのような凄まじい画像を「AI」が瞬時に生成する本サービスの登場に、イラストや写真といった広告クリエイティブのパーツであればAIが書くことができる時代がとうとうやってきた!と感じていました。その驚きもつかの間、彗星の如く登場したのが「Stable Diffusion」です。私たちが2015年に使っていたGAN(敵対的生成ネットワーク)とは全く違う、Midjourney同様の手法、拡散モデル(Denoising Diffusion Probabilistic Model)でビジネスに耐えうる高品質の画像生成を実現しており、加えてオープンソースという太っ腹具合に、さらに度肝を抜かれたのでした。

<2022年に衝撃を与えたAI>
2022年4月〜5月 OpenAI「DALL・E 2」 / グーグル「Imagen」公開
OpenAIが開発した画像生成AI「DALL・E 2」が公開されると、生成された画像がとてもアーティスティックだと世間の注目を集めた。続くようにグーグルも画像生成AI「Imagen」を開発し、生成された画像の質が「DALL・E 2」より優れているのではないかといった議論を巻き起こすなど、こちらも話題を呼んだ。
※DALL・E 2は発表当初はBeta版の限定的な公開で、Imagenは非公開だった

2022年7月 ミッドジャーニー社「Midjourney」公開
MidjourneyはAIの研究者や開発者だけでなく、13歳以上なら一般の人でも自由に利用でき、かつ25回という限られた回数であれば無料で使えることから瞬く間に大人気に。TwitterやInstagramなどのSNS上で数多くのAIアート作品が投稿され非常に注目を集めた。

2022年8月:Stability AI社「Stable Diffusion」公開
オープンソースが大きな特徴。Stable Diffusionの機械学習モデルは、ライセンスを明記すれば営利・非営利を問わず使用できる。そのため、開発に対する門戸が一気に広がり、秋以降にはデザインツールのCanva上で画像生成機能が実装されたり、もともと小説の自動生成AIであったNovelAIから派生して二次元イラストに特化したNovelAI Diffusionが生まれるなど、同種の画像生成AIが次々と登場した。

2022年9月:OpenAI社「Whisper」公開
Whisperは汎用的な音声認識モデル。多様な音声の大規模データセット(680,000時間)で学習されており、 音声認識に加えて、音声翻訳、言語識別、多言語音声認識にも対応したマルチタスクモデル、「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが特徴。

2022年11月:OpenAI社「ChatGPT」公開
文章生成系の大規模言語モデル「GPT-3」の後継にあたる、GPT-3.5を対話向けにファインチューニング。会話形式でユーザーの質問に答えたり、プロンプトの指示にしたがって自然言語によるタスクを高精度にこなす。(ソースコードの記述、手順書の作成、エッセイの執筆、インタビュースクリプトの作成 etc…) 単に質問に答えるだけではなく、質問の前提に含まれる誤りを指摘したり適切ではない質問自体の回答を拒否したりといった、より自然な問答が可能。11月にリリースしてからおよそ3ヶ月後の2023年1月、ChatGPTは史上最速でユーザー数1億人を突破した。

それらが登場してからは、両サービスの研究を並行して進め、広告クリエイティブ制作過程で画像生成AIを活用するためのさまざまな実験を急ピッチで行ってきました。例えば、配信中の広告バナーと画像生成AIで生成したオリジナル画像を用いたバナー広告とでその運用結果の比較。

ストックフォトの画像では他企業も同様の画像を使っており差別化が難しかった。

オリジナル画像を用いたバナーの方がCTR1.8倍の成果が出たことから、その有用性が確認できました。そこで私たちは、ストックフォトサービスで提供していないオリジナル画像を広告用素材としてストックすることも開始しました。

ロボットを可愛く作るために必要なキーワードも編み出す
オリジナルの専属モデルとしても生成可能に

2023年3月、変革を担う新プロジェクトを発足

2022年11月、GPTをベースとした「ChatGPT」が公開され、会話(チャット)や自然な文章生成も可能になったことから、マーケティング・広告クリエイティブ領域におけるGenerative AIの活用範囲はさらに広がりました。広告のキャッチコピーやSEO観点からのサイト本文、構成案の作成などです。

中平が常日頃から「ビビるな、はみだせ、私たちは革命家だ」と鼓舞していたこともあり、ガラパゴスのメンバーは、新しいものに対する好奇心とチャレンジ精神が旺盛です。そのため新技術が登場するなり、事業部内の各チームが自発的にワーキンググループを実施し、業務の効率化・自動化、広告クリエイティブ用オリジナル画像素材の生成やキャッチコピーの大量生成、バナーの高速生成といった、Generative AIによる改善に取り組んできました。しかし、その改善に取り組んでいる最中、2023年の3月にGenerative AI業界はさらなる進化を遂げます。

3月リリースされた主要AIサービス
There's an AI for That(https://theresanaiforthat.com/)という、AIサービスを日々リスト化するサイトで3月リリースされたサービスを検索すると600種を超えていた。

3月14日にリリースされたChatGPT-4。OpenAI社は、それまでのChatGPT-3.5を超える性能を短期間で実装したのです。画像入力、日本語、専門領域への高精度な対応、ジョークをも理解するChatGPT-4。そのリリースを皮切りに日々登場する新サービス。これには社内のメンバーも震撼しました。予想以上にAIの進化が早く、そしてその影響範囲が広範囲に及ぶと想像できたからです。このたびのAI革命はホワイトカラー革命とも呼ばれています。私たちもいわゆるホワイトカラーに属する仕事をしています。8割の労働者が業務の1割に影響を受け、2割の労働者がその半分に影響を受けると言われており、これは、いままで大切にしてきた仕事の価値観ですら変えてしまうほどのインパクトがありました。

それに対して、中平は社内改革の推進を宣言、2015年からAIの研究に従事してきた島田、細羽も同調し、社内にメッセージが発せられました。
「楽観的にも悲観的にもなりすぎず、冷静に、フラットに、目の前で起きていることを直視して、素早く行動していきましょう。一番良くないのは思考停止だと思います。AIに対抗するのではなく、共進化する。AIに任せるところは全力で任せて人にしかできない領域を追求していくことに集中し、我々はデジタルケンタウロスを目指すべきだ。」

これからも人間の仕事として残り続けるのは、「デジタル・ケンタウロス」「手先ジョブ」「職人プレミアム」エリアに該当するものだ。それ以外の仕事は、「AI・ブロックチェーン失業」「ロボティクス失業」エリアに分類され、消え去っていく運命にある。

10年後に食える仕事 食えない仕事;AI、ロボット化で変わる職のカタチ

一見無謀とも思える、デザインの定量化・デジタルモノづくりのプロセスハックに取り組んできた私たちだからこそ、AIを乗りこなし、しっかりと人の役割、人がやらなくてはならない領域を定義できる。それは当社のサービスをご利用いただくお客様へのベネフィットにもつながります。サービスへのAI活用により多忙なお客様の業務を代替する領域が増えれば、その分後回しになっていた、あるいは時間を割くことができずにいた業務に専念していただくことが可能になると考えたのでした。

そうして、デジタルケンタウロスを目指すための社内プロジェクト「GAX PJ」が立ち上がり、今私たちはPJメンバーと共に、ChatGPTを活用して成果を高める広告のキャッチコピーを生成するプロンプトや、ペルソナシートといったプランニング資料を生成するためのプロンプトの開発、業務を効率よく進めるためのプロンプト型化、Generative AI関連の最新情報のキャッチアップ、蓄積されたノウハウの社内外への共有、また、社内向けのGPT利用チャットのリリースなどにも取り組んでいるところです。

プロンプト開発はPJメンバーが総力を上げて取り組んでいる


社内向けGPT利用チャット。これにより情報漏洩の心配なくChatGPTが使えるように。


未来へ、デジタルモノづくり産業革命のための宣誓

急速に普及するGenerative AIの驚異的な進化と共に進み、人にしかできない領域を追求していく。私たちがGAX PJを立ち上げたこと、それは私たちの宣誓でもあります。

Generative AIの登場により、テキストを入力するだけでさまざまなコンテンツを、誰しもが、一瞬で、生成できるようになりました。しかし、AIに自分が求める、あるいはビジネスで通用するクオリティレベルで生成させるためには、入力する側の知識が必要です。多種多様のサービスが登場しても、使いこなせなくては意味がありません。今後必要とされるのはプロンプトエンジニアリング、それはいわば言語化力・コミュニティ力といっても過言ではく、そのためにも、私たちは実際にAIツールに触れ、使いこなす力を身につけられる環境を早急に構築していきます。

これからは、GAX PJが主体となり、業務効率化による生産性向上と自社サービスへの積極的な活用を目的としたGenerative AI による変革を加速していきます。「プロセスとテクノロジーでより人をヒトらしく」というミッションにある通り、ガラパゴスはAIといった先端テクノロジーと、製造業コンサル仕込みのプロセスハック(可視化・仕組み化・効率化)をデジタルモノづくりという領域に取り入れ、AI時代のワークスタイルを確立し、デジタルモノづくりに関わる全ての人がヒトらしく働ける社会の実現に向けて邁進していきます。

GAX PJの取り組みについてはnoteで随時紹介していきますので、これからのガラパゴスとAIR Designの進化を楽しみにしていてくださいね。



(文責:前川 敦子)