teftef

M1になれました。趣味でアニメーションと写真レタッチなどをやっています。この記事では幅…

teftef

M1になれました。趣味でアニメーションと写真レタッチなどをやっています。この記事では幅広いジャンルで備忘録のようなものを書いていくつもりです!

マガジン

  • 論文解説まとめ

    論文解説まとめ

  • 作品集

    作品集です。ノウハウも書いてあります。

最近の記事

  • 固定された記事

Style-Bert-VITS2 JP-Extra と LLM を用いた AI エージェント構築

 こんにちはこんばんは、teftef です。今回は LLM と TTS を使って推しの AI エージェントを作るという話です。今までは LLM として GPT-4 を用いて、 TTS として「KOEIROINC」 を使っていました。これはAI エージェントとしてはなんも問題ないのですが、やっぱり「自分の推しをエージェントにしたい」という想いで作成しました。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントな

有料
500
    • Latent Surfing(第3回 AI なんでもLT 会の振り返り)

       こんにちはこんばんは、teftef です。2024 年 3月 10 日に開催された LT 会で話したことについてのまとめと振り返りです。「Latent Surfing 」という題目で、 GAN や Diffusion Models を用いたモーフィングについて話しました。その内容についてまとめます。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあ

      • BlueskyBot+LLM をローカル環境で動かす。

         こんにちはこんばんは、teftef です。今回は,BlueSky が招待コードなしで使えるようになったので、自然言語と組み合わせてメンションに対して返信する Bot を作ったという話です。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT-4 による校正、修正が含まれています。 組み合わせた、LLM エージェントはこちら ⇩ ※この

        有料
        500
        • ポケモン対戦エージェント : POKE´LLMON

           こんにちはこんばんは、teftef です。今回は,ポケモンを LLM でプレイしてみたという論文です。ぱっと見た感じ見た感じよくある「エージェント」の論文ですが、ちょっと結果が面白かったので、メモ程度に書いていこうと思います。(主がポケモンをやっていたから気になるというのもあります。)  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT-4

          有料
          500
        • 固定された記事

        Style-Bert-VITS2 JP-Extra と LLM を用いた AI エージェ…

        マガジン

        • 論文解説まとめ
          29本
        • 作品集
          11本

        記事

          CartoonSegmentation を使ったキャラクター切り抜き

           こんにちはこんばんは、teftef です。今回は,CartoonSegmentation を使って画像内の被写体抽出をするツールについてです。実はあまりフロントエンドの開発経験がなく、いつかやろうと思っていた React + FastAPI の勉強ついでに作ってみたツールに紹介もあります。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT

          有料
          500

          CartoonSegmentation を使ったキャラクター切り抜き

          2023 年の振り返りと 2024 年に向けて

           こんにちはこんばんは、teftef です。年末なので、少し今年 (2023年) のまとめと来年に向けて書きます。1月くらいから、基本的に一週間に1本、気になった論文やドキュメントをまとめてきました。その振り返りも兼ねて書いていきます。 (基本的に自分語りです。)  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT-4 による校正、修正が含ま

          2023 年の振り返りと 2024 年に向けて

          セグメンテーションを用いた被写体切り抜きとパーツ分け

           こんにちはこんばんは、teftef です。今回は,セマンティックセグメンテーションを使って画像内の被写体抽出をただ試すだけという記事です。いくつかの論文と手法をベースにしていますが、詳しいことは書かない予定です。Google Cloab も配布しているのでぜひ最後まで見ていただけると幸いです。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、G

          有料
          500

          セグメンテーションを用いた被写体切り抜きとパーツ分け

          Nightshade の可能性と限界

           こんにちはこんばんは、teftef です。今回は,敵対的サンプルとデータポイズニングについてです。主題として、 Nightshade について取り上げます。画像に対して摂動を加えることによって、機械 (識別器や特徴抽出器) を混乱させて、謝った結果を出力させることを目的にしています。 Nightshade の論文の中身にも触れますが、実際に効果があるのか、使われるのかを中心に考察を書いていきます。 2023 年 11 月 19 日時点でコードが公開されていないので、あくまで

          有料
          500

          Nightshade の可能性と限界

          ComfyUI で動かす LCM-LoRA AnimateDiff

           こんにちはこんばんは、teftef です。 「Latent Consistency Models の LoRA (LCM-LoRA) が公開されて、 Stable diffusion , SDXL のデノイズ過程が爆速でできるようになりました」という記事を書きました。今回は ComfyUI でその LCM-LoRA をつかって AnimateDiff を使用する方法についてです。 画像生成についてはこちらから。 ※この記事は有料となっていますが、最後まで内容が読めます。

          有料
          500

          ComfyUI で動かす LCM-LoRA AnimateDiff

          ComfyUI で動かす Latent Consistency Models LoRA (LCM-LoRA)

           こんにちはこんばんは、teftef です。 Latent Consistency Models の LoRA (LCM-LoRA) が公開されて、 Stable diffusion , SDXL のデノイズ過程が爆速でできるようになりました。LoRA なので既存モデルでも使えます。今回は ComfyUI でその LCM-LoRA を使用する方法についてです。(いつもの論文とかは後で書きます。)  ※この記事は有料となっていますが、最後まで内容が読めます。  私もまだ初学

          有料
          500

          ComfyUI で動かす Latent Consistency Models LoRA (LCM-L…

          Latent Consistency Models について

           こんにちはこんばんは、teftef です。今回は爆速画像生成ができる Latent Consistency Models についてです。WebUI 拡張やお試しも載せておきます。  拡散モデルの拡散過程は確率常微分方程式 (Probability Flow ODE) を解いて得ることができ、少ないステップによってその解軌道に沿ったサンプリングができるように学習します。これによって、Consisitency Models は Diffusion Model のサンプリングを

          有料
          500

          Latent Consistency Models について

          ごめんなさい、クロスブレードが最強でした

           こんにちはこんばんは teftef です。 今回は Backpack Battles というゲームの攻略記事です。(AI は一切関係ないですww) ルールや初心者の方はこちらが便利です⇩ 謝罪  前回、「マナビルドが最強」という記事を書いたんですが、 ごめんなさい訂正します。クロスブレード最強です www (10/24 にアップデート、クロスブレードの威力、クールダウンに変更有り) マナが最強になったかもしれない クロスブレード (Cross Blades)D

          ごめんなさい、クロスブレードが最強でした

          Backpack Battles 0から始めるマナビルド

           こんにちはこんばんは teftef です。 今回は Backpack Battles というゲームの攻略記事です。(AI は一切関係ないですww) Backpack Battles について 無料の神ゲー。(だそうです) 簡単に言うとパズル PvP ゲームです。 下の記事で基本的な攻略が書かれています。 デッキについて このゲームには数多くの強いと言われているデッキがあります。 農園ビルド ( 回復を積みまくりパイナップルの反射ダメージで倒す) フライパンビルド

          Backpack Battles 0から始めるマナビルド

          超解像について (その3・Real-ESRGAN)

           こんにちはこんばんは、teftef です。超解像その 2 の続きです。CNN を使った超解像が主流となる中で、GAN を使った超解像によって画像の高周波成分の復元が高品質にできるようになり、画像がぼやけることがなくなりました。しかし、SRGAN も ESRGAN も学習に使ったデータセットの質の問題が考慮されていませんでした。今回は学習する画像の質にバリエーションを増やし、汎化性能を上げた Real-ESRGAN についてです。  私もまだ初学者であり、説明が間違っていたり

          有料
          500

          超解像について (その3・Real-ESRGAN)

          超解像について (その2・SRGAN と ESRGAN)

           こんにちはこんばんは、teftef です。超解像その1の続きです。前回は、画像を拡大するアルゴリズム手法から始まり、SRCNN といった機械学習手法を使って超解像をするところまで書きました。今回はさらに SRCNN を応用した SRGAN , ESRGAN , Real-ESRGAN について書いていきます。GAN の概要は飛ばすので、もし読みたい方がいればこちらをご覧ください。  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了

          有料
          500

          超解像について (その2・SRGAN と ESRGAN)

          超解像について (その1・SRCNN まで)

           こんにちはこんばんは、teftef です。今回は画像を拡大縮小することに関してです。2 回に分けて書きます。これは前半で比較的よく知られていることが書かれています。(個人的に超解像に興味がわいたので1か月くらい文献追ってました)  私もまだ初学者であり、説明が間違っていたり勘違いがある可能性が 0 ではないということをご了承ください。ぜひコメントなどをいただけたら幸いです。また、この記事を作成するにあたり、GPT-4 による校正、修正が含まれています。 ※この記事は有料と

          有料
          300〜
          割引あり

          超解像について (その1・SRCNN まで)