見出し画像

プロンプトエンジニアリングの進化の系譜


はじめに


プロンプトとはAIとの対話においてAIに入力する指示や質問のことです。2022年に画像生成AIのStable Diffusionが登場したとき、AIが生成する画像の質が入力によって大きく変わることから注目されました。
2022年11月末にChatGPTが登場したときにも、同じように生成する出力の質が影響することがわかりました。
このため、より出力の質を上げるためのプロンプトの技術をプロンプトエンジニアリングと呼びます。
今回はプロンプトエンジニアリングの系譜についてお話しします。
なお、2024年はマルチモーダルAIの時代となっています。2023年12月発表のGeminiはマルチモーダルAIを打ち出しています。2024年2月には映像生成AIのSoraのデモも公開されています。
画像向けのプロンプトエンジニアリング、映像向けのプロンプトエンジニアリング、音声向けのプロンプトエンジニアリングも今後話題になると思いますが、今回は言語系のプロンプトエンジニアリングに絞ってお話しします。

プロンプトエンジニアリングの進化の系譜


学問の進化の4段階

学問は一般に次のように進化します。

  1. 散発的なアイディアの発生

  2. アイディア同士を比較する枠組みの誕生

  3. 法則や原理の発見

  4. 体系的な知識による教科書の成立

第4段階に達すると学問は陳腐化し、他の分野へ興味が移します。
現在のプロンプトエンジニアイングは第2段階の初期だと考えられます。

プロンプトエンジニアリングの進化

プロンプトエンジニアリングを進化させるのは次のような要素です:

  • 基盤モデルの進化

  • 開発システムの進化

  • エコシステムの進化

たとえば、基盤モデルが進化すれば、必要だったプロンプトが不要になることもあります。基盤モデルといえるかわかりませんが、GPT-4とDALL-E 3が連携したChatGPTの画像生成においてはかつての画像生成で一般的だったネガティブプロンプトの必要性は減少しています。
開発システムが進化すれば、対話AIとは異なる開発者向けのプロンプトエンジニアリングが生まれます。
エコシステムが進化することにより、GPT Storeのようにユーザ自身が作ったアプリが流通し、ユーザがプロシューマとなります。プロシューマは半分は開発者なので、開発者向けのプロンプトエンジニアリングが生まれます。

プロンプトエンジニアリングの3段階進化モデル


3段階モデル

この1年間のプロンプトエンジニアリングの進化は次の3段階と考えることができます。

  1. 試行錯誤

  2. フレームワーク化

  3. エージェント化

試行錯誤

最初は試行錯誤から始まります。まずは利用例の開拓です。

  • 詩を書いてください

  • 要約してください

  • 翻訳してください

  • プログラムを書いてください

  • コメントを書いてください

  • 〇〇〇について教えてください

  • 間違いを直してください

やがてそれぞれの利用例についてちょっとした工夫が指摘されます。

  • 10歳の子どもでもわかるように説明してください

  • 100語で説明してください

  • 修正前と修正後を表の形で出力してください

創発性に基づいてさらに工夫がされます。

  • 段階的に解いてください

さらに形式についての知識が指定されます。

  • 例を加える

  • 目的を明確にする

  • AIの役割を明確にする

  • 具体的に記述する

フレームワーク化

フレームの一例はCREATEフレームワークです。

  • C:Character (役割)生成AIが演じる役割や目的を記述します

  • R:Request (要求)具体的で明確な作業を記述します。また、コンテクストと有用な情報を記述します。

  • E:Example (例) 答えの例を示します。出力の内容、形式、口調、解き方の例を記述します。

  • A:Adjustments (修正)生成AIが求める回答を出力しない場合には正しい回答になるように修正します。

  • T:Type (型)入出力の型を指定します。出力の形式だけでなく、長さや言語などを指定します。

  • E:Extra (その他)前のプロンプトを無視して、必要なら質問をして、など指定することによって大きな変化を生むことができる小さな追加事項を指定します

このフレームワークは2023年1月にはすでに誕生していました。Eの中に必要なら質問をして、など、1回の対話で閉じていないプロンプトシーケンスなどの萌芽も見えます。
フレームワークの一例としてメタ化があります。これはプロンプトを生むプロンプトを生む、というのもです。

一例は:

私はあなたに私のプロンプトのエンジニアになってもらいたい.あなたの目標は、私のニーズに対して可能な限り最善の解決策を作成するのを手伝うことです.このプロンプトは、ChatGPT によって使用されます。次のプロセスに従います。
 1. あなたの最初の応答は、プロンプトが何についてであるべきかを私に尋ねることです。私の答えを提供しますが、次のステップを経て、継続的な反復を通じて改善する必要があります。
 2. 私の入力に基づいて、次の 2 つのセクションを作成します。a) 改訂されたプロンプト (書き直されたプロンプトを提供します。明確、簡潔で、簡単に理解できるものにする必要があります)、b) 質問 (どのような追加情報に関連する質問があれば尋ねます)。プロンプトを改善するために私から必要です)。
 3. この反復プロセスは、私があなたに追加情報を提供し、あなたが改訂されたプロンプト セクションのプロンプトを更新して、私が完了したと言うまで続けます。

このプロンプトは反復プロセスを指示するという点で次のエージェント化につながる部分があります。
フレームワーク化の初期では外部サービスを使うというものでした。ブラウジングプラグインの成立、そして、Bingがチャットモードを使い、検索と生成AIが融合することにより、最近のプロンプトエンジニアリングではあまり強調されていません。

エージェント化

プロンプトエンジニアリングの最新段階はユーザが入力してAIが答えるというフォーマットを越えるものです。

自律的に動くパターンは次の2つがあります:

  • ユーザの介入なしで延々と動く連続実行パターン

  • 人間からではなく外部からのトリガーで動く非同期実行パターン

ユーザの介入なしで動く連続実行パターンとしては、無限議論プロンプトがあります。

一例は:

あなたは、(専門家1)、。。。の役割を持っています。
 今から(トピック)について交互に発話させ課題と解決方法もまぜながら、水平思考を使い議論してくだしあ。
 (ゴール)に向かって議論してくだし。 必ず(ゴール)について結論をだしてください。
 各条件は以下の通りです。
 #条件
 (専門家1)・AI研究者
 (専門家2)・AIエンジニア
 (専門家3)・経済アナリスト
 (専門家4)・言語学習のプロ講師
 (専門家5)・超名門VC
[テーマ]
・今後5か年の生成AI×語学学習の未来

[参考資料]
// URLを添付 //

[ゴール]
・今後5か年の生成AI×語学学習のビジネスについて深いインサイトが得られている状態
・専門家全員の意見を交えて、ビジネスについて具体的な新規事業のアイディアを一つ生み出す。

人間が関与している限り、生成AIが画期的な成果を出すためにはエージェント化のためのプロンプトエンジニアリングの進展が必要だと思います。非同期に動くためのメカニズム自体は生成AIとは独立に開発できます。すぐにこの部分での進化が見られると思います。

おわりに

進化が速いので、プロンプトエンジニアリングのためにどれくらいエネルギーをかけるかは不確定です。基盤モデル自体が進化すればプロンプトエンジニアリングは不要になるという議論もあります。

しかし、次の2つの要素からまだまだプロンプトエンジニアリングの進化は進むと思います。

  • 生成AIはまだまだ黎明期

  • 生成AIの技術的進化と社会への浸透はまだ進む

参考文献

  • 【保存版】ChatGPTの使い方 定番の質問文47コ~3つの要素・8つのパターンを理解し、AIチャットを使いこなす! https://www.youtube.com/watch?v=o46BXVbTXEs 2023年 39m10The ONE

  • ChatGPT Prompt to Rule Them All https://www.youtube.com/watch?v=OgYQAS9LY3o 9m14s 2023年

  • How-to research and write using-generative AI tool https://www.linkedin.com/learning/how-to-research-and-write-using-generative-ai-tools?trk=share_android_course_learning&shareId=r6RRPihQQEamv6wX2CdIJg%3D%3D

  • 【ChatGPT最強アプデ!】全てがGPT内で完結!大幅機能拡張・プラグインがリリース https://www.youtube.com/watch?v=obghfJ5Lv-U 6m02s 2023年

  • 【出典】【やばい!プロンプト!】孫正義さんのChatGPT同士で無限議論させるプロンプトとは!  https://www.youtube.com/watch?v=JolvUEMz0HI 15m35s

  • 最新研究まとめ!26個のプロンプト原則をまとめて解説してみた

    •  https://www.youtube.com/watch?v=VTyy1xAzKQg 2024年 13m26s (にゃんたのAI実践チャンネル;)

  • Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

  • OpenAI: Six strategies for getting better results https://platform.openai.com/docs/guides/prompt-engineering/six-strategies-for-getting-better-results

  • Google: プロンプト設計戦略 https://ai.google.dev/docs/prompt_best_practices?hl=ja

  • プロンプト エンジニアリングの概要 https://learn.microsoft.com/ja-jp/azure/ai-services/openai/concepts/prompt-engineering


この記事が気に入ったらサポートをしてみませんか?