見出し画像

生成!生成!また生成!

ジェネレーティブAIのセミナー依頼が増えてきました。

6月・7月と2ヶ月連続でChatGPTのセミナーを実施し、今は画像生成AIのセミナー資料を作成中です。セミナー後に参加者から個別研修を依頼されるケースもあり、関心度の高さが感じ取れます。

とはいえ、社会実装されてまだ1年足らずのサービスです。私もまだまだ手探りで、皆さんと一緒に勉強しているという状態です。

AIは対話ができる優秀なアシスタント

ChatGPTのセミナーでは、今のところ「始めかた」「使い方と活用事例」「使用上の注意事項」という構成でお話ししています。

活用事例では「文章作成」「要約」といった汎用的な活用方法と、OpenAIが推奨するベストプラクティスに沿ったテクニックを紹介しています。

以下がGPTのベストプラクティスです(原文を翻訳しています)。

1.明確な指示を書く
2.参考テキストを提供する
3.複雑なタスクをより単純なサブタスクに分割する
4.GPT に「考える」時間を与える
5.外部ツールを使用する
6.テストは体系的に変更される

GPTのベストプラクティス(OpenAI)

ChatGPTはGoogle検索となにが違うの?という質問を受けることがあります。大きく異なるのは「対話ができる」という点でしょう。

例えば、Google検索との違いをChatGPTに質問してみます。このときは4つの違いを回答してくれました(※回答内容は毎回変わります)。

上記の回答を表にしてくださいとお願いすると、HTMLの<table>タグを駆使して表を書いてくれました。テキストで表現できるものであれば、文章以外の形式でも回答してくれます。

このように、対話の内容を踏まえて回答を生成してくれるところが、Google検索との大きな違いです。

また、下記のように称賛とお礼の言葉を伝えると、「どういたしまして!」と返答してくれます。このように、あたかも人格があるかのようにふるまうのも、GhatGPTの特徴です。

対話を進めることによって、質問を深掘りしたりアイディアをブラッシュアップしたりするのに役立ちます。ツールというよりはアシスタントに近い感覚で活用すると良いでしょう。

AIにペルソナを憑依させる

対話ができることを活かすテクニックとして「モデルにペルソナを採用するよう依頼する」というものがあります。

「ペルソナ(persona)」とは、主にマーケティングの領域で活用される概念で、サービス・商品を使用する典型的なユーザー像のことです。ChatGPT
は人格があるかのようにふるまうことができるAIなので、ペルソナを指定すると、まるでその人物が思考しているかのように回答してくれます。

noteのCXOである深津貴之氏が考案した「深津式汎用プロンプト」にも、同様の手法が取り入れられています。

ペルソナは架空の人物でも、実在する人物でも構いません。提示したペルソナ像が具体的であればあるほど、得られる回答も具体的になっていきます。イタコの口寄せに近い手法です。

口寄せ(くちよせ)とは、を自分に降霊(憑依)させて、霊の代わりにその意志などを語ることができるとされる術。または、それを行う人である。

口寄せ(Wikipedia)

「Apple社について100文字以内で解説してください」というプロンプトを用いて、ペルソナを活用してみます。

まずは、ペルソナを指定しないで依頼します。

これが「iPhoneを世界で最初に買った人」を憑依させるとこうなります。

最後に、Apple社の創設者を降臨させてみます。

このように、ChatGPTはハイコンテクストな対話にも対応できます。

画像生成AIにもペルソナを憑依させる

最近は画像生成AIのセミナー資料を作成している関係もあり、Midjourneyにドはまりしています。MidjourneyはDiscordのbotとして画像を生成することができるジェネレーティブAIです。

美しい日本人女性が無料で生成できるということで、Stable Diffusionのほうが人気のようですが、環境構築の難易度が高いことに加えて、ネガティブプロンプトなどの細かいチューニングが必要です。

Midjourneyは無料アカウントだと25枚までしか生成できないため、活用するには課金が前提になりますが、プロンプトのみで生成できる画像のクオリティが群を抜いています。

例えば「iPhoneを世界で最初に買った人」というプロンプトを入力すると、下記の4枚の画像を生成してくれます。

/imagine prompt The first person in the world to buy an iPhone

これを更にブラッシュアップしていくと、下記のようになりました。

ギークなイケオジ
Appleストアでパシャリ

どうでしょう?iPhoneのディティールだけ手修正すれば、充分実務でも活用できそうなクオリティではないでしょうか。

私が書いたプロンプトはたったこれだけ。制作時間は1分です。

The first person in the world to buy an iPhone, in the style of geek, stylish colors, tokina at-x 11-16mm f/2.8 pro dx ii, simple clothing, white and light blue

Midjourneyもペルソナを憑依させることができます。上記の画像をゴッホ風に描き直してもらいました。

ゴッホ風というかご本人ですね
スマホ依存症のゴッホ

今度は喜多川歌麿の浮世絵風でお願いしました。

ちょっと違う気がしますが、浮世絵ぽさは出ました

このように、Midjourneyを使えば高クオリティの画像を簡単なプロンプトのみで生成することができます。絵は描きたいけどアイディアも技術も根気もないという、私のような人間にとっては魔法のようなAIです。

プロンプトエンジニアリングに慣れよう

2月からMidjourneyを使い始めて、5ヶ月で1200枚の画像を生成しました。一回のプロンプトにつき4パターンの候補を提案してくれるので、アップスケールしていないものも含めると、5000通り以上の画像を描いてくれたことになります。

最近の私は、プロンプトのコツも掴んできて、描きたい絵のアイディアも溜まってきたので、Instagramアカウントを4つ同時に立ち上げ、各々のテーマに沿った画像を1アカウントあたり5枚ずつ毎日投稿しています。いつまで続くか分かりませんが、今のところネタ切れしそうな気はしていません。

同じことを人力でやろうと考えた場合、クリエイターさんに依頼して、5枚×30日×4アカウント=600枚/月の画像を制作してもらう必要があります。ものすごく安く見積もって1点あたり1,000円で提供してもらったとしても、月額600,000円の経費が掛かります。ちなみに、私がいまMidjourneyに課金している金額はわずか$24/月です。

すべての場面においてコストが最優先されるわけではありませんが、少なくともアウトプット力の差は歴然としています。デジタルクリエイターは、今すぐジェネレーティブAIを味方につけるべきです

まずは、何でもよいのでプロンプトを書くことから始めましょう。今はまだプロンプトエンジニアリングという概念に慣れることが重要で、個別のジェネレーティブAIの優劣は割とどうでもよいと考えています。

今後、あらゆる分野でプロンプトを活用することになるでしょう。ビジネスシーンでの活用は当然のことながら、プライベートでもプロンプトで調理できる家電や、ジェネレーティブ美容室なども登場するかもしれません。

自然言語でAIが操作できる時代は、プロンプトの質がそのまま成果物のクオリティに反映されます。AIとの共通言語であるプロンプトに慣れて、AIと仲良く協業していきましょう。

では。

プロンプトの精度が低いため、iPhoneにされてしまったゴッホ


この記事が気に入ったらサポートをしてみませんか?