見出し画像

Leonardo AI の新モデルとElement / [ Kino XL & Cybertech ] による画像生成-動物の例

はじめに

概要

Leonardo.AIが、1月26日に、Discordで新しい機能などをアナウンスしています。また、X(ツイッター)上で、新しいElementが紹介されています。
そこで、新しいモデルのKino XLと新しいElementのCybertechを使って画像をいくつか創ってみましたので、ご紹介します。トップの画像はその一例です。

また、キャンバスエディター(Canvas Editor)に、Focus Modeというのが追加されています。これについては、内容の説明が発見できなかったので、詳細は不明ですが、とりあえず、触ってみました。
どうやら、これを使って、少なくとも既存の画像の一部を変換できるようです。


Discordの内容紹介(1/26;by annaouncement)

新しい主要な機能:

  • キャンバスエディタに'Focus Mode'を追加しました

リリースされたマイナーな機能:

  • PhotoReal V2を使用した際のElementsのサポートを追加しました。(注;これについては、内容が、よくわかりません)

  • 新しいモデルKINO XLを追加しました

修正されたバグ:

  • Render Densityを1以上に設定して生成すると、生成がハングアップ/スタックする問題を修正しました

  • リアルタイムキャンバスのInpaintingモードでバックグラウンド画像を消去してしまう問題を修正しました

  • リアルタイムキャンバスで背景を変更しても、適切に生成がトリガーされない問題を修正しました

  • カテゴリーフィルターを切り替えるとフィードが下にスクロールしない問題を修正しました

これらのアップデートをお楽しみいただけることを願っています。そして、いつものように、あなたの素晴らしいアイデアをここに共有してください:

新機能について

新モデル: Leonardo Kino XL

説明

A model with a strong focus on cinematic outputs. Excels at wider aspect ratios, and does not need a negative prompt.
映画的な出力に重点を置いたモデル。広いアスペクト比で優れており、否定的なプロンプトは必要ありません。

上の赤枠で囲んだモデルで、現時点(1/30)では、モデル群の表示で一番最初に位置しています。(一番上で左側)
そもそも映画的、というのがよくわからないのですが、、少なくも、トップ画像で示したように、横長の画像に強い、ということでしょうか。
縦長ならどうだろう、とか、試してみます。

新Element: Cybertech

Tech out your images with this Element.
An exclusive Leonardo platform model.

下の画像では、次のような日本語訳で、DeepLの翻訳に近くなっています。

このエレメントで、あなたのイメージに磨きをかけましょう。
レオナルド・プラットフォーム専用モデル。

上の行は、意味的にはこんな感じの方がいいかもしれません。
 ” あなたの画像をこのエレメントで(Cyber)tech的にしましょう。”

Cyber(サイバー)とかが、よくわからないのですが、SFでは、ウィリアム・ギブソンのニューロマンサーあたりから、サイバーパンクと言う用語が使われ始めたように思います。サイバースペースとかですね。歴史的にはハイパーの次ぐらいでしょうか、結構、昔ですけど。
LeonardoAIが大好きな、パンク、という用語を使わず、サイバーテク、と表記したのは、なんとなく、サイボーグ的なハイテクな雰囲気を出すElementという感じを表現したかったのでしょうか。

この組み合わせで、動物(子猫)、人(日本人女性)、竜など、生物的な存在で試してみようと思います。

Focus Mode(@Canvas Editor)

キャンバスエディターの画面を開くと、一番上に、Focus Modeのボタンがあります。Focus Mode ⇔ Infinite Mode のトグルスイッチになっています。

Focus Mode画面の左側には、次のようなアイコンが縦に並びます。

この、Mask Lassoというのが、実質的に唯一の機能の選択肢となっています。これを使ってみます。


画像生成

最初に可愛い動物の代表で、子猫、に出てもらいます。

子猫の画像例

用いたプロンプト
A mischievous kitten perched on a stack of books, its bright green eyes wide with curiosity as it explores its cozy indoor playground.
いたずら好きな子猫が本の山にとまり、その明るい緑色の目を大きく見開きながら、ぬくもりのある室内の遊び場を探索しています。

設定条件
モデル: Kino XL
エレメント:Cybertech 
Alchemy V2: ON

Alchemy Upscaleの有無は、各画像の下に記載しました。
Low/Medium/High - (Smooth )ON、または、オリジナル、です。

1-1 Element 無し

Original
Medium-ON
Original
Low - ON

他のモデルの場合は、子猫の緑の目、という指定に影響されるのか、下に示すDiffusionXLのように、本などの周囲の環境も緑系になる傾向があるのですが、上のKinoの場合は、環境がカラフルです。なお、Alchemy Upscaleをかけると、猫の顔が補正され、普通の猫の目の色に変わる傾向があるようです。

また、Elementがかかっていない状態のKinoXLの画像は、Upscaleをかけなくてもリアルさという点で、高い質感を感じます。

Leonardo Diffusion XLの例

DiffusionXL; original
DiffusionXL; Low-ON

Alchemy Upscaleの効果は、Kino XLよりもあるようです。本の細部なども、改良されています。子猫の顔が締まった感じになりました。
上のオリジナルの方が、より幼い子猫というようにも見えます。

1-2  Cybertech 0.3

いよいよ、本論です。これから、Elementの重み(Weight)をだんだんと強くしてみます。まず、0.3の場合です。各々2つの例を示します。

Low - ON
Original

特に上の画像で、周囲の環境にテクっぽいのが見えてきてます。
子猫自体は、上の画像に首輪が付きました。下の画像は、オリジナルですが、古びた本の様子など、質感を感じます。


1-3  Cybertech 0.7

重みが、0.7の場合です。

Medium - ON
Medium - ON

ともに、テクノっぽい首輪で、下の画像は、ウェアも着始めています。背景は、まるで宇宙船の中です。これらは、ともに、Alchemy Upscaleをかけています。

次に、下の画像のオリジナルを示します。

Original

ほぼ、緑の世界です。また、全体にぼやけています。画像としての説得力が低下していますが、子猫の迫力はむしろオリジナルのほうがあるようにも感じます。

1-4  Cybertech 1.1

重みが、1.1の場合の生成画像です。

Medium -ON
Low - ON

下の画像は、かろうじて本が残っていますが、上は、見えません。
この、重み=1.1、は先ほどの画像と子猫が少ししか違わないように、見えますが、オリジナルは、結構異なります。

Orijinal
Original

Alchemy Upscaleの有無の差は、かなり大きくなってきています。
上の子猫は、猫でなくなりつつあるような気配です。

1-5  Cybertech 1.8

重みが、1.8の場合の生成画像です。

High - ON
High - ON

子猫は、完全に、サイボーグ化されているという風情です。
それでも、猫に見えますが、これは、Upscaleのおかげです。
それぞれのオリジナルは、次のようになっています。

Original
Original

このレベルになってくると、Alchemy Upscaleの強度(Strength)による画像の違いが顕著になります。

Medium - ON
Medium - ON

Medium の上の方の画像は、豹の系列のよう②見えます。それが、最初に示したHighにすると、猫らしくなっています。

1-6  Cybertech 2.3

重みが、2.3の場合です。このレベルになると、UpscaleをHighにしても、生物らしさは、消えます。一例のみ、示します。
オリジナル、Medium、Highを示します。

Original
Medium- ON
High - ON

Highの画像は、表情らしさがでてきて、童話の主人公、という雰囲気もあります。画像として、全く違う応用があるかもしれません。

生物的な補正が効くのは、おそらく、2.0前後までと推定されます。

例によって、長くなったので、分割します。
次回は、人、で試した例をご紹介します。






この記事が気に入ったらサポートをしてみませんか?