Catapp-Art3D

3Dアート作品や3Dモデルデータも扱っています。最近は専らAIを利用した作品が多いです…

Catapp-Art3D

3Dアート作品や3Dモデルデータも扱っています。最近は専らAIを利用した作品が多いです。 ※ BOOTHにて各種販売も行なっております。 https://lit.link/catappart3d

メンバーシップに加入する

3Dモデルや写実的なAI画像の実戦テクニックやノウハウをアップしていきます。

  • ベーシックプラン

    ¥1,000 / 月
    初月無料

マガジン

  • ブログ

    Catapp-Art3Dのブログです。

  • Linux の記事

    Catapp-Art3D の Linux の記事をまとめました。

  • AI画像生成入門

    Catapp-Art3D の入門者向けの記事をまとめています。

  • AI生成画像作品

    Catapp-Art3D の作品をまとめています。

  • Blender + Stable Diffusion

    Catapp-Art3D の Blender + Stable Diffusion 記事をまとめたものです。

最近の記事

  • 固定された記事

AI画像生成&修正テクニック

はじめにこの note では、筆者が(写実的な)3DやAI画像作品を製作する時に利用している手法やテクニックを紹介していきます。 AI系ソフトウェアの設定やインストール、最新情報は、ネット上に溢れるようになったので、より作品製作時の実践的な内容や工夫に特化したいと思います。 生成画像や画像加工等のウェブサービスを利用せずに、ローカル環境の(オープン)ソフトウェア を利用します。ローカル環境を利用する事で、理不尽な制限や制約に縛られず作業に集中する事ができます。 ※ と

    • 「AI生成画像はGPUによって個性がある」は都市伝説か?

      はじめに先に結論です。限りなく都市伝説でしょう。しかし、オーディオ専用CDプレーヤが(エラー訂正精度の問題で完全なデジタルとは言えない事を根拠に)高音質であるという話題が尽きないように、プリンターケーブルを短くすれば(ネットワークエラー率が下がり)早く印刷できるという話を完全に否定できないように、真っ赤な嘘という話でもありません。 アーキテクチャが異なれば画像は異なる当たり前の話ですが、世代などでGPUアーキテクチャが異なれば利用するバイナリコードが物理的に変わるので、処理

      • +6

        【超高画質】AI生成画像【背景】

        • Adobe Firefly がクリーンではないと言われる理由

          画像生成AI技術がありふれたものに変わり、最近では拒否反応のようなAI画像はすべて盗作だとする極論的な論調は少なくなってきました。それでも、企業はAIモデルや学習時の「クリーン」さを強調する必要性に迫られています。 企業がクリーンさを強調する手法の一つで、最大手 Adobe がAI技術に参入した際に取ったものは、自社の画像ライブラリのみで学習するというものです。確かに自社で所有する画像であれば、(許諾を取っていない)著作物を学習するリスクはないのではと考えるかもしれません。

        • 固定された記事

        AI画像生成&修正テクニック

        マガジン

        • ブログ
          20本
        • Linux の記事
          4本
        • AI画像生成入門
          13本
        • AI生成画像作品
          10本
        • Blender + Stable Diffusion
          8本

        メンバー特典記事

          【入門】リアル系顔 LoRA 作成入門

          「ベーシックプラン」に参加すると最後まで読めます

          【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】 想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人 はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、 自分で作成した学習用イメージ この記事では筆者が過去に chichipui に投稿したものを利用します GFPGAN

          有料
          500〜
          割引あり

          【入門】リアル系顔 LoRA 作成入門

          【中級】AI画像生成ワークフロー紹介

          「ベーシックプラン」に参加すると最後まで読めます

          想定する読者Stable Diffusion webUI (forge) が利用できる人 IOpaint が利用できる人 画像エディタを利用して基本的な画像処理ができる人 はじめに最近の定着しつつあるワークフローを紹介します。 構図の作成手書き、3Dモデル、その他もろもろのAI生成システムでもいいのですが、凡その構図を作成します。今回は SDXL モデルを利用します。1024x768 で生成しています。 SD1.5 モデルであれば、640x480 等が最適です。良

          有料
          100〜
          割引あり

          【中級】AI画像生成ワークフロー紹介

          【入門】GTX 1660ti の限界を調べる【StableDiffusion】

          「ベーシックプラン」に参加すると最後まで読めます

          はじめに先に結論です。設定したやり方では限界に到達しませんでした。。 webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。 しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリをGPUのディスク・スワップ(仮想メモリ)のようにしてエラー終了を回避し、解像度の

          有料
          0〜
          割引あり

          【入門】GTX 1660ti の限界を調べる【StableDiffusion】

          【中級】LinuxでFF15ベンチマークを動作させる

          「ベーシックプラン」に参加すると最後まで読めます

          想定している読者Windows 用のベンチマークソフト FINAL FANTASY XV benchimark を Linux 上で動作させたいと考えている人 Linux で Windows ゲームが動く仕組みを理解したい人 Flatpak のアプリをインストールできる人 基本的な Linux の操作ができる人 Linux Mint / Ubuntu を利用している人 はじめにLinux では Wine というソフトウェアを利用して、Windows 用アプリケーショ

          有料
          0〜
          割引あり

          【中級】LinuxでFF15ベンチマークを動作させる

          【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】

          「ベーシックプラン」に参加すると最後まで読めます

          想定している読者【難しい内容ではなく入門者向けですが、どちらかと言うと、ガッツリ理解したい人向けです】 ※ 単に Stable Diffusion を動かしたいだけなら、現状は StabilityMatrix が最適です。 ※ github に公開されているAIソフトウェアを、誰かの解説なしに利用したい人向けです。 【ローカルでさまざまな画像系AIソフトウェア利用を本格的にはじめたいと考えている人】 【Anaconda で Python パッケージ管理をはじめて行う

          有料
          250〜
          割引あり

          【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】

          【中級者】Blender+Stable Diffusion

          「ベーシックプラン」に参加すると最後まで読めます

          想定する読者Blender を利用した事のある人 Stable Diffusion webUI を利用した事のある人 ControlNet を利用した事のある人 Gimp や Photoshop などの画像処理ソフトウェアの基本機能を利用した事のある人 はじめにBlender で生成AIを利用すると聞くと、アドオンを利用してテクスチャを生成したり、3Dモデルを生成したりするのかと思ってしまうかもしれませんが、ここではもっと原始的な方法を紹介します。結論を言うと、St

          有料
          0〜
          割引あり

          【中級者】Blender+Stable Diffusion

        記事

          【無修正】Llama3 Uncensored を試す【脱獄モデル】

          はじめに文章生成AI(LLM)の Uncensored は仰々しく聞こえてしまいますが、実は Stable Diffusion webUI 等のAI画像生成系は最初からデフォルトで脱獄しています。元々のコードは生成途中で觝触すれば黒塗り画像に差し替えるようになっています。昔はミーム画像に変わったりしていたのですが、最近はどの画像生成システムでも見なくなりました。 確かに、LLM は画像だけの生成とは異なり、犯罪や爆弾の作り方などを答えてしまう可能性があるため、一般公開する場

          【無修正】Llama3 Uncensored を試す【脱獄モデル】

          【GTX 1660ti】Meta Llama3をローカルで動かした話【GTX 1650】

          想定している読者非技術者・非開発者(AIを道具として利用している人) Linux の基本的な操作ができる人 Windows の場合は WSL2 が利用できる人 自分のローカル環境 GPU で LLM(ChatGPTのようなもの)を動作させたい人 はじめにローカルで動作が可能な Meta 最新 LLM Llama3(Language Large Models Meta AI) を 旧GTX グラボで動作可能か検証してみました。 検証した環境は GTX 1660ti

          【GTX 1660ti】Meta Llama3をローカルで動かした話【GTX 1650】

          【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

          いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。 髪型の名称が欲しい時は、 ポーズの場合は、 非常に便利になりました。 ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理にかなっているのかもしれませんね。

          【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

          【StableDiffusion】歴史上の美女をAI画像生成していく【GTX 1660ti】

          はじめに筆者が利用している AI 用のより高速な PC は RTX 3060 なのですが、長時間の学習に利用しているため、ただ単に仕方なく GTX 1660ti を使うというだけの話です。チェックポイントはカスタムモデルですが SDXL 生成そのままの画像です。 Gemini に聞いてみました。 ※ AIに聞くときに、「全力で」「精一杯」などの表現を追加すると、ちょっとだけがんばってくれます。 歴史上の美人ヘレネ: トロイア戦争のきっかけとなったとされるほどの美貌を持つ

          【StableDiffusion】歴史上の美女をAI画像生成していく【GTX 1660ti】

          【入門】多様性のあるAI画像生成【Stable Diffusion】

          プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。 つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。 あとは、denoising strength を大きな値にして調節します。プロンプトは単純なもので問題ありません。例えば、

          【入門】多様性のあるAI画像生成【Stable Diffusion】

          【上級】SmoothVideo Project on Linux & smplayer を使っている話【フレーム生成】

          はじめにSmoothVideo Project(SVP)は、動画のフレームレートをリアルタイムで変換し、滑らかな視聴体験を実現するソフトウェアです。従来の24fps動画を60fpsや120fpsに変換することで、カクつきや残像を低減し、より自然で滑らかな映像にする事ができます。リアルタイムで視聴する以外にも、変換して保存する事も可能です。 似たような技術には、NVIDIA DLSS-3 や AMD FSR-3 があります。ただしこれらはゲーム用途に限定したもので、一部 P

          【上級】SmoothVideo Project on Linux & smplayer を使っている話【フレーム生成】

          お花畑の魔法(呪文)

          お花畑の魔法(呪文)

          InstantMesh(画像1枚から3Dモデル・ローカル生成) 面白い

          下記にて紹介しましたが、 予想以上に使えそうなので、InstantMesh の Windows でのインストール方法と簡単な使い方を追加しました。 AIで好きな画像を生成し、 この一枚の画像をデスクトップに保存したバッチファイルにドラッグ&ドロップすると、 デスクトップ上のフォルダに、3Dモデルが自動で作成されます。RTX 3060 (12G) で2分程度です。 すごい時代になったものです。筆者は持っていませんが、3Dプリンタがあればすぐに出力できてしまいますね。

          InstantMesh(画像1枚から3Dモデル・ローカル生成) 面白い

          InstantMeshを使ってみた話

          はじめにAI画像生成界隈では、日々さまざまな技術が発表されています。この記事ではその中のひとつの InstantMesh というものを試してみます。 公式レポジトリはこちら どのようなものかというと、一枚の画像から3Dオブジェクトを生成するソフトウェアです。 導入方法README に導入方法が紹介されています。Anaconda + pip 方式です。本当は下記方法をマスターしたら簡単ですよ、と言いたかったのですが、Windows では失敗するようです。。。文字コードの問

          InstantMeshを使ってみた話

          AI生成画像の一般的な修正方法

          はじめに日々さまざまな新しいAI技術が発表され、画像修正技術も進歩していますが、それでも汎用的に利用できる事は少なく、修正箇所が何かと干渉していたりすると上手く行かなくなる事がほとんどです。 この記事では、「汎用的」に活用できる修正アイデアを紹介します。 前景と背景を分けるAI画像でありがちなのが、背景コンテキストがおかしい事です。地平線がずれたりするものです。まずは、前景(主題)と背景を分けます。IOpaint を利用します。導入やプラグインなどは下記で説明しています。

          AI生成画像の一般的な修正方法

          人物の白黒写真高画質カラー化の話

          はじめに同じ手法を利用します。 準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。 結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

          人物の白黒写真高画質カラー化の話

          戦艦大和をカラー高画質化させてみた話

          はじめに生成 AI 技術を利用して、戦艦大和の白黒写真のカラー高画質化に挑戦します。元画像は、Wikipedia のパブリックドメイン写真を利用します。 カラー化まずは、カラー化のみを行います。利用したソフトウェアは Deoldifyを使います。公式のリポジトリはこちら。 導入方法は、(まだ)DeOldify に関して記述していませんが、Anaconda 導入です。下記を参考ください。 DeOldify でカラー化すると次のようになります。 Gimp で彩度をブースト

          戦艦大和をカラー高画質化させてみた話