2024年のAI動向予測は領域特化とマルチモーダル化

DEEPCORE / KERNEL

2023年12月13日 17:00

DEEPCOREは、メディア向け勉強会を開催し、「2024年のAI動向予測とAIを活用した新しい技術」をテーマに、代表の仁木と取締役CFOの雨宮が最新のAI市場トレンドや2024年に鍵となるAIテクノロジーについて発表を行いました。

生成AIの登場は組織のあり方や働き方、さらには産業構造やビジネスモデルを変えるとされています。

AIが急速に進化したことで、人間とAIの共存が求められているといえるでしょう。

2023年はさまざまな業界でAIが導入され、まさに“AI時代の幕開け”といっても過言ではないなか、2024年は新たにどのようなAIの発展やモメンタムが訪れるのでしょうか。

LLMの開発で進む「日本語特化モデル」と「領域特化モデル」

ディープコアでは、これまで画像認識やデータ解析、自然言語処理、音声認識、ディープラーニングなど、産業分野を問わずに多様な技術領域へ投資を行ってきました。生成AIの領域については2023年から投資を開始しています。

グローバル市場では、2023年の生成AI領域への投資総額は9月末までの時点で既におよそ174億ドルに達しています。カテゴリー別の投資額を見ると、大型調達があったこともありHMI（ヒューマンマシンインターフェース）の領域が多くを占めています。今後もインターフェース関連の企業への注目が集まるのではと予想しています。

ChatGPTの登場によって高い関心が寄せられる大規模言語モデル（LLM）の領域では、いろいろな企業が「日本語特化モデル」の開発に取り組み始めているほか、金融や医療などの専門用語が多い分野では「領域特化モデル」の開発も進んでいます。

とりわけ、日本語LLMの動向でキーワードになるのが「軽量・高品質」および「領域特化」です。
2024年3月から提供予定のNTT「tsuzumi」は、事前学習用の日本語データの質や量の向上を図ることで、軽量モデルでも高い日本語処理能力を実現するサービスです。さらに、「アダプタチューニング」という考え方を取り入れることで、従前の汎用モデルに固有の業界に合わせたチューニングも簡単に実施が行えるようになるとのことです。

また、弁護士ドットコムでは自社のデータを活用したリーガル両機のバーティカルLLM構想を打ち出すなど、2024年はビックデータを有する企業が日本語LLMの開発に乗り出し、さまざまなユースケースの創出が期待されています。

生成AIの画像生成技術も高度化。マルチモーダル化が進む

グローバルに視点を移すと、「LLMモデルのマルチモーダル化」が進んでいます。

2023年9月にはOpenAI社が開発した「GPT-4V」が発表され、“GPTが目と耳を持った”と表現されるように、音声による会話や画像を用いた質問等が可能になったのは、大きな反響を呼びました。

一方で、OpenAI社は画像生成AI「DALL-E 3」も2023年9月に発表し、マイクロソフト社のBingチャットでも利用可能になったほか、ChatGPTとの統合によって、会話をしながら直感的にプロンプトで画像生成ができるようになるなど、さらなる進化を遂げています。

そして、画像生成エンジンもマルチモーダル化が進んでおり、Meta社が提供するLLM「Llama2」をベースに、視覚指示を理解するためのチューニングを加えた「LLaVA」は、GPT-4Vに匹敵する精度を持つオープンソースの大規模マルチモーダルモデル。「Japanese Stable VLM」は、Stability AI社が開発した商用可能な日本語画像言語モデルです。

また、生成AIにおいては画像生成の技術自体も高度化しています。

静止画を動画のように動かせる「Stable Video Diffusion」、静止画の一部をBrushツールでなぞることで、自然な動きをつけられる「Runway Motion Brush」、1枚の写真から高解像度の3Dモデルを生成する「Human-SGD」など、応用領域の拡大も見られます。

そのほか、Meta社の音声生成エンジン「Voicebox」やGoogle Deepmind社の音楽生成エンジン「Lyria」など、言語や画像以外の生成AIも出てきています。

生成AI技術のネクストステップとして注目されるのが、ロボティクス分野への応用です。

ロボットは人間の言語指示に従って動作するわけですが、ロボット制御にLLMを活用することで、ロボットが自然な言語による指示を理解し、自分で推論した上で適切な動作を行うことが可能になるとされています。

従来のような定型的なルーティンをさせるロボットから、LLMを通じて自律的に考えて動いてもらうロボットの開発へ。2024年はこうした、次世代のロボットのあり方が見出される時期になるのかもしれません。

生成AI市場で成長が期待される企業の特徴について

2024年は、3つの領域に取り組んでいるスタートアップへの関心が高まると見立てています。

①インフラ・開発ツール
基盤モデルの開発および開発のためのインフラ提供

②業界横断型のアプリケーション
コード生成やセールス、カスタマーサポート機能の提供

③業界特化型アプリケーション
教育やヘルスケア、建築、エンタメなど特定領域に特化してその課題を解決

他方、開発ツール領域は生成AIの周辺領域としての成長が期待できるものの、ビックテック企業が機能提供を始めるリスクもあります。

例えば、OpenAI社が2023年11月に発表した「GPT Builder」は、コーディングの知識がなくても、Botとの会話でオリジナルのChatBotが開発できるもので、チャットボット開発企業にとっては脅威になっています。

次いで、業界横断型のアプリケーションにおいては、データが一定数存在するヘルスケア、金融、リテールの領域に生成AIが適応されていく可能性があります。

ヘルスケア領域でいえば、創薬の効率化や患者との会話を記録した臨床メモの自動作成、希少疾患のデータ不足解消などに、生成AIを活用していく流れが進むでしょう。

金融領域では、スタートアップよりも大量のデータを持つ大企業の取り組みが増えていくと考えています。過去に蓄積した膨大な自社データを活用し、各社それぞれが金融特化型LLMを開発し、顧客のニーズに合わせた投資アドバイスを提供していく動きが活発化すると見立てています。

リテール領域では、生成AIの活用でEコマースのUI/UX改善がさらに進むと考えています。
中国の生成AI企業であるSilicon Intelligence社では、Eコマース配信向けディープフェイク・アバター作成サービスを開発し、コスト削減に貢献しています。

ほかにも、生成AIを用いたEC向けの検索機能を提供するalgolia社は、 Eコマースのコンバージョン改善に貢献していて、Amazonではモール出品者向けサービスに生成AIを活用し、商品説明や広告写真の自動生成などの機能を提供しています。

生成AIの進展で鍵を握る「学習データ」と「AI規制」

生成AIの注視すべき課題点は以下の2点が挙げられます。

1点目は「学習データ」に関する問題です。

高性能モデルの構築には大量のデータを要するわけですが、現在のAI学習傾向が続くと、2026年までに高品質の言語データが枯渇するという論文が2022年に発表されています。

そうなれば、AIの技術進展にも影響を及ぼすため、アルゴリズムの改善で少ないデータ・計算能力でもAI学習を可能にすることや、合成データをうまく活用するなどの解決方法を見出していくことが求められるでしょう。

2点目は「AI規制」です。

欧州、米国、日本と各国で規制に対する方向性は異なっていますが、欧州は2023年6月に「EU AI Act」を策定。AIツールをリスクレベルに応じて規制し、ルールに沿わない企業には罰金を課すなどの厳しい措置が取られる見込みです。

米国は2023年10月末に「AIの安全性確保・技術革新を図るための大統領令」を発令。米主要15社と合意した自主ルールに基づき、企業活動に配慮した内容の規制が設けられました。その一方で、自己の作品を学習データとして利用された作家が、生成AIモデルの開発企業を提訴する事案が相次いでいることもあり、そのあたりの問題解決が待ち望まれます。

日本は政府が「AIガイドライン」の指針を示したほか、生成AIと著作権保護のあり方を議論している最中です。

生成AIによる作品が著作権侵害に該当するのか否か、AIで作った作品はどこまで著作物性が認められるのか。学習データとして利用がどこまで許容されるかなど、パブリックの見解が出されるのに関心が高まっている状況といえます。

▼登壇依頼・DEEPCORE及び投資先への取材について
問い合わせフォームよりご連絡ください。
https://deepcore.jp/contact

▼採用情報
DEEPCOREで働くことに関心がある方は、以下の問い合わせフォームよりご連絡ください。

この記事が気に入ったらサポートをしてみませんか？