Masayuki Abe

AIの世界に貢献したく、最新の海外のAI事例を、ChatGPT、AI、Generati…

Masayuki Abe

AIの世界に貢献したく、最新の海外のAI事例を、ChatGPT、AI、Generative AI、GitHub、Hugging Faceなどから紹介しています。記事作成の励みになりますので、フォロー頂ければ幸いです。

マガジン

  • InfraGPTの構築記録

    InfraGPTを構築しています。Linux系を中心に、自然言語でLinuxサーバに関する主要操作をするウェブアプリの開発をしています。当面はLinuxサーバ系を中心にしており、Windows Server系も自然言語操作を目指しています。

  • Google AI系記事

最近の記事

Winny開発者の金子勇氏のED法はAIに変革を起こすのか?

最近、AmazonPrimeで映画Winnyを見ました。そんな時、技術ブログサイトの代表格のQiitaで、金子勇氏のED法がBP法というAIのアルゴリズムに変革を促すのではないかと話題になっています。次々とED法にチャレンジしている記事が登場しています。 20年以上前、ChatGPTのような先進的な技術がまだ知られていない時代に考案され、論文などに記録されることなく忘れ去られていたED法について、今、有志たちがAIにおける可能性を探っています。この試みになんか胸が熱くなりま

    • 高速AIチップで話題のGroqのAPIをStreamlitで使う方法

      Groq社の紹介Groqとは、高速なLPU(Language Processing Unit)を開発しているアメリカ系のベンチャー企業です。株式は公開されていませんが、Meta社のLlama3リリースタイミングで、Llama3を取り込んだGroqChatにより、高速な言語処理能力を見せつけて、Twitterやテック系記事で取り上げられています。 Groqの紹介記事やGroqChat、GroqのAPIキーの取得方法について、以前記事を書いたので興味があるなら参考にしてみてく

      • ChatGPT登場時と同じような衝撃を受けたgroqを調べてみた

        groqとは?groqとは、言語モデル処理に特化したLPU(Language Processing Unit)を開発している会社です。 このLPUを使用することにより大規模言語モデルの応答速度が格段に速くなります。 その結果、ユーザはレスポンスの待ち時間を意識することなく大規模言語モデルを使用することができるようになります。 groqは、そのLPUを使用したgroq.comというChatGPTに似たサイトであるGroqChatを提供しています。 GroqChatの使

        • MetaのLlama3を眺めてみる

          Hugging FaceにおけるLlama3の紹介2024年4月18日に、MetaよりFacebookの会社より、Llama3がリリースされました。オープン系の大規模言語モデルでは、Meta社のLlama2をベースにファインチューニングされているLLMが性能評価でも結果を残しているので、Llama2の後継のLlama3は期待度が高いです。 Hugging FaceにおけるLlama3の情報を眺めていきます。 Llama3は、80億パラメータと700億パラメータのバージョ

        Winny開発者の金子勇氏のED法はAIに変革を起こすのか?

        マガジン

        • InfraGPTの構築記録
          6本
        • Google AI系記事
          18本

        記事

          ゼロから始める自作LLM

          イントロダクション今回は、オズの魔法使いの文章をベースに自作LLMをGoogle Colabで作成していきます。LLMのベースとなる学習データがオズの魔法使いという非常に少ない文章量のため、実行結果は期待されているほどにはなりません。しかし、ゼロからLLMを作成してみるという経験を積むには良いと考えてます。 今回は、こちらのコードを参考にさせて頂きました。 コード説明今回は、Google ColabのA100かV100で実行します。それ以外だと計算に時間がかかりすぎてしま

          ゼロから始める自作LLM

          ストリートファイター3をプレイするのにOpenAIの最強の言語モデルは?

          OpenAI言語モデルがストリートファイター3をプレイしたら? gpt-3.5-turbo-16kのモデルが一番強かったです。 以前、ストリートファイター3で言語モデル同士を戦わせる方法を記事にしました。自分でも実施してみたいと思う人は、この記事を参考にしてください。 今回は、OpenAIの言語モデル同士でストリートファイター3で戦わせていきます。今回登場するOpenAIの言語モデルは以下です。 gpt-4-turbo gpt-4 gpt-3.5-turbo

          ストリートファイター3をプレイするのにOpenAIの最強の言語モデルは?

          AIで画像からショート動画を作ろう

          SadTalkerの紹介SadTalkerという画像1枚から用意した音声をベースに動く動画を作成してくれるGitHubのプロジェクトを紹介していきます。今回作成するのは、次のようなショート動画を1枚の画像から作成してきます。 SadTalkerのGitHubのプロジェクトは、こちらです。 テンセント、アントの人らが作ったGitHubプロジェクトとなります。 SadTalkerの使い方GitHubプロジェクトのところに、Google Colabのコードがありますので、こ

          AIで画像からショート動画を作ろう

          OpenAIのSoraに対抗しているOpen Sora Planを使ってみた

          Open Sora PlanのGitHubプロジェクトの紹介OpenAIが自然言語から動画を作成するモデルSoraのプレスリリースをして世間を驚かせましたが、いつ頃出てくるのかはまだ発表されていません。そんな中、オープンソースで自然言語から動画を作成するプロジェクトがGitHubにありましたので紹介していきます。今回の成果物は次のような動画です。 Open Sora Planの使い方今回は、Open Sora PlanのGitHubプロジェクトに、Google Cola

          OpenAIのSoraに対抗しているOpen Sora Planを使ってみた

          LLM同士をストリートファイター3で戦わせる方法

          Twitterを見ていたら、LLM同士をストリートファイター3で戦わせてどちらが性能が良いかを競い合うプロジェクトを見つけました。LLMの性能を計測するベンチマークとしてストリートファイター3を利用しています。 LLM同士を戦わせて、どちらが優れているかを計測するプロジェクトとなります。ストリートファイターというゲームのため、非常に可視化出来てわかりやすく、このプロジェクトは面白いと思いましたので、自身でも実行してみたくなり試してみました。 LLM-Colosseumの設

          LLM同士をストリートファイター3で戦わせる方法

          Hugging FaceのAI系Cookbook

          Hugging FaceがオープンソースのAI系のCookbookを作成していましたのでざっくりと眺めてみます。 Hugging FaceのAI系のCookbookでは、次のことについて用意されています。 今回良いなと思ったのは、各々にGoogle Colabのリンクが貼ってあり、すぐに試すことができることです。 所感は、記事のタイトルを見ると、Zero-shot、RAG、PEFT、Fine-tuningなどのAI系コードには欠かせなくなってきている概念あるいは手法が掲

          Hugging FaceのAI系Cookbook

          LLMを動かすOllamaのインストール方法

          Ollamaというツールを使えばローカル環境でLLMを動かすことができます。 Windows版だけではなく、MacOSやLinux版もありますので、各自の環境に合わせてインストールすることができます。 Ollamaは、Windows環境をインストールしてみましょう。 "Download for Windows (Preview)"と書いてあるところをクリックするとexeファイルがダウンロードできます。 そのEXEファイルを実行すればインストールが始まります。 インス

          LLMを動かすOllamaのインストール方法

          日本語も理解できたCohereForAIのオープンソースのLLMモデルを試してみる。

          CohereForAIのLLMをGoogle ColabのA100で実行したので紹介していきます。フリーのLLMなのに文章生成、数値計算、英訳、日本語理解力がChatGPTみたく回答されているのに驚きました。 Hugging Faceで、CohereForAIのLLMのc4ai-command-r-v01が上位にランクインしていましましたので試してみることにしました。 今回は、上記にあるコードを少し修正して利用しています。Google Colabの環境は、A100です。L

          日本語も理解できたCohereForAIのオープンソースのLLMモデルを試してみる。

          3D画像を高速生成できるTripoSRというオープンソースのGoogle Colabでの実行方法

          今回は、Google Colab上で、2D画像から3D画像を高速に生成できるTripoSRというオープンソースモデルを試してみます。 開発は、Tripo AIとStability AIとなります。 今回は、上記コードを参考に修正し、Google Colab V100で実行します。 左側に3D画像にしたい2D画像を取り込んで、Generateをクリックすると、右側に3D画像ができます。実際に、右側の3D画像のハンバーガーは動かせます。 では、Google Colabでの

          3D画像を高速生成できるTripoSRというオープンソースのGoogle Colabでの実行方法

          ByteDanceの画像生成AIのSDXL-LightningのGoogle Colabでの使い方

          ByteDanceといえば、tiktokの会社ですね。そこが、画像生成AIで、軽くて早く実行できるというSDXL-Lightningを出しましたので、Google Colabでの使い方を紹介します。 今回は、Google ColabでA100で上記のコードを少し修正して、画像を30枚作成できるコードとなります。 !pip install diffusersimport torchfrom diffusers import StableDiffusionXLPipeline

          ByteDanceの画像生成AIのSDXL-LightningのGoogle Colabでの使い方

          GoogleのオープンソースLLMのGemmaのGoogle Colabでの使い方

          GoogleがオープンソースのLLMのGemmaという70億の言語モデルを出してきました。Gemminiとどのようにブランディング効果を狙っていくのかは気になるところです。 今回は、Google ColabでのGemmaの使い方を紹介します。 まずは、Hugging Faceのところで、Gemmaにアクセスするための許可を取ります。 すると、Google Gemma Access Request画面が出てきますので、下に行きます。 !pip install huggi

          GoogleのオープンソースLLMのGemmaのGoogle Colabでの使い方

          Microsoftが作ったWindows OS Copilotみたいな動きをするUFOの使い方

          久しぶりの記事です。時間が無かったというものありますが、色々と試してみて上手く行かない場合は記事にはしていないので、だいぶ時間が空いてしまいました。 今回は、誰もが自然言語で、Windows OSを操作することが出来るのなら良いなと思ったことがあるはずです。自然言語で、Windows OSを操作できるMicrosoftのUFOを紹介します。UFOは、何の略か正式には記載されていませんが、UI-Focused Agent for Windows OSの略となります。 使い方

          Microsoftが作ったWindows OS Copilotみたいな動きをするUFOの使い方