マガジンのカバー画像

AI画像生成入門

15
Catapp-Art3D の入門者向けの記事をまとめています。
運営しているクリエイター

記事一覧

【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

はじめに新しいものではありませんが、Stable Diffusion の基本テクニックをまとめてみました。

この記事で利用するソフトウェアは、

Stable Diffusion webUI(または forge)

IOPaint

Ollama Open WebUI(ローカル LLM)

です。

① 同じキャラクターの生成その1他の生成システムでも同じですが、一度に生成してコンシステンシーを

もっとみる
【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

はじめにAI画像系のソフトウェアとして Stable Diffusion webUI や ComfyUI は有名ですが、IOPaint は実力は非常に高いのにあまり知名度は高くありません。この記事では IOPaint(旧 Lama Cleaner)の機能を解説します。

公式レポジトリはこちら、

Windows への詳細な導入方法は下記に記載しています。※ PyPI に登録されているので、pip

もっとみる
【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。

髪型の名称が欲しい時は、

ポーズの場合は、

非常に便利になりました。

ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理

もっとみる
【入門】多様性のあるAI画像生成【Stable Diffusion】

【入門】多様性のあるAI画像生成【Stable Diffusion】

プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。

つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。

あとは、denoising strengt

もっとみる
AI生成画像の一般的な修正方法

AI生成画像の一般的な修正方法

はじめに日々さまざまな新しいAI技術が発表され、画像修正技術も進歩していますが、それでも汎用的に利用できる事は少なく、修正箇所が何かと干渉していたりすると上手く行かなくなる事がほとんどです。

この記事では、「汎用的」に活用できる修正アイデアを紹介します。

前景と背景を分けるAI画像でありがちなのが、背景コンテキストがおかしい事です。地平線がずれたりするものです。まずは、前景(主題)と背景を分け

もっとみる
人物の白黒写真高画質カラー化の話

人物の白黒写真高画質カラー化の話

はじめに同じ手法を利用します。

準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。

結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

戦艦大和をカラー高画質化させてみた話

戦艦大和をカラー高画質化させてみた話

はじめに生成 AI 技術を利用して、戦艦大和の白黒写真のカラー高画質化に挑戦します。元画像は、Wikipedia のパブリックドメイン写真を利用します。

カラー化まずは、カラー化のみを行います。利用したソフトウェアは Deoldifyを使います。公式のリポジトリはこちら。

導入方法は、(まだ)DeOldify に関して記述していませんが、Anaconda 導入です。下記を参考ください。

De

もっとみる
【入門】リアル系顔 LoRA 作成入門

【入門】リアル系顔 LoRA 作成入門

【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】

想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人

はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、

自分で作成した学習用イメージ

この記事で

もっとみる
BrushNet を使ってみた話

BrushNet を使ってみた話

はじめにAI画像生成界隈では、日々さまざまな技術が発表されています。この記事ではその中のひとつの BrushNet というものを試してみます。

公式レポジトリはこちら

「 A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion」というものですが、精度良くインペイントするものの”ようです”(すみませ

もっとみる
【中級】AI画像生成ワークフロー紹介

【中級】AI画像生成ワークフロー紹介


想定する読者Stable Diffusion webUI (forge) が利用できる人

IOpaint が利用できる人

画像エディタを利用して基本的な画像処理ができる人

はじめに最近の定着しつつあるワークフローを紹介します。

構図の作成手書き、3Dモデル、その他もろもろのAI生成システムでもいいのですが、凡その構図を作成します。今回は SDXL モデルを利用します。1024x768 で

もっとみる
【入門】GTX 1660ti の限界を調べる【StableDiffusion】

【入門】GTX 1660ti の限界を調べる【StableDiffusion】

はじめに先に結論です。設定したやり方では限界に到達しませんでした。。

webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。

しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリを

もっとみる
【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】

【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】


想定している読者【難しい内容ではなく入門者向けですが、どちらかと言うと、ガッツリ理解したい人向けです】

※ 単に Stable Diffusion を動かしたいだけなら、現状は StabilityMatrix が最適です。

※ github に公開されているAIソフトウェアを、誰かの解説なしに利用したい人向けです。

【ローカルでさまざまな画像系AIソフトウェア利用を本格的にはじめたいと考え

もっとみる
【入門】NMKD Stable Diffusion GUI で LoRA を作る

【入門】NMKD Stable Diffusion GUI で LoRA を作る


想定する読者NMKD Stable Diffusion GUI をインストールできる人

ローカルで画像生成を行った事がある人

LoRA を使った事のある人

はじめにStable Diffusion の爆発的な人気で、様々なローカル生成用の実装が公開されましたが、ブラウザで利用する webUI でなく、一般的な Windows アプリケーションとして実用的に利用できるのは NMKD Stab

もっとみる
【入門】ローカルで利用するAI画像生成ソフトウェア管理のための基礎知識①【Windows】

【入門】ローカルで利用するAI画像生成ソフトウェア管理のための基礎知識①【Windows】


想定する読者Stable Diffusion 等のAIソフトウェアをローカルにインストールして使い始めたが、Python の管理や仕組みを理解したいと考えている人

非 Python 開発者、非技術者等の AI ソフトウェア利用中心の人

はじめにAI画像生成システムをローカルで構築する上で知っておくべき技術的な内容の紹介をします。ただし、Python 開発者や AI 技術向けではなく、「AI

もっとみる