ナガメ研究所🎲🤖

AIを使った面白いコトを探してます。今はポーカーAIの開発をしており、強化学習や自然言…

14 フォロー 13 フォロワー

自然言語処理シリーズ

ナガメ研究所🎲🤖

3本

GPTを中心に、AI技術を用いた文章生成関連の記事をまとめています。
強化学習で遊ぶシリーズ

ナガメ研究所🎲🤖

3本

いろんなテーマを問題にして、強化学習したAIの行動の記録を記事にしています。こんなことAIでできない？など、アイデア募集しております。
ポーカーAI開発シリーズ

ナガメ研究所🎲🤖

8本

UnityとMl-agentsを用いたポーカーAI開発の記録をまとめたマガジンです。月1～3本程度投稿しています。ポーカーについて興味ある人、AIについて興味ある人を対象に、試行錯誤している様子を書いています。

ChatGPTのAPIが公開！サービス開発する上で気をつけるべき”プロンプトインジェクション”について

こんにちは！ナガメ研究所です。3月始めに、OpenAIがChatGPTのAPIを公開しました。これにより、これまで公式のウェブサイト上でしか操作できなかったChatGPTがアプリなどの…

ナガメ研究所🎲🤖

1年前

強化学習で遊ぶ part3 真似して育つAI

UnityのML-agentsを利用し、サッカーAIを強化学習で育てる記事です。～～～前回の内容はこちら～～～強化学習で遊ぶシリーズpart3じゃ。サッカー対戦をテーマに強化学習…

ナガメ研究所🎲🤖

1年前

強化学習で遊ぶ part2 「AIにサッカーさせてみる」

UnityのML-agentsを利用し、サッカーAIを強化学習で育てる記事です。～～～前回の内容はこちら～～～はじめに博士じゃ。前回に引き続き、強化学習で遊んでいくぞ。助…

ナガメ研究所🎲🤖

1年前

強化学習で遊ぶ part1 AIが育つ「強化学習」の面白さ

こんにちは！ナガメ研究所です。普段はポーカーAIの開発をしています。ポーカーを通して強化学習というものの面白さを伝えたいのですが、なかなか思うように開発が進められ…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part7 ～スタッツを報酬に加えてうまくいった話～

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。今回は、前に書いたpart4の記事の続編です。よろしくお願いします。はじめに前回、WTSDと…

ナガメ研究所🎲🤖

1年前

噂のChatGPTにポーカーの質問をしてみた

こんにちは！ナガメ研究所です。今回は、最近噂のChatGPTを触れてみたので、その話をしようと思います。はじめに ChatGPTとは？ChatGPTとは、OpenAIが開発したチャットサ…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part6 ~17万試合を学習したAIと対戦してみた~

こんにちは！ナガメ研究所です。ポーカーAI開発の記事もpart6になりました。これまでの記事へのスキやフォロー、本当にありがとうございます！引き続きポーカーAIの開発を…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part5 ～AIがポーカーを実況・解説する 2歩目～

こんにちは！ナガメ研究所です。今回は、テンプレート方式で大量に生成した文章をGPT-2に流して、ゲーム状態に応じた文章生成をするAIモデル作ってみたので、その話をしま…

ナガメ研究所🎲🤖

1年前

AIがnoteを書いてくれるかも？文章を生成してくれるAIモデル「GPT-2」を使って自分のnoteを学習させてみた

こんにちは！ナガメ研究所です。今流行の文章生成AIモデル”GPT-2”の日本語版を使って遊んでみたので、その内容を書いていきます。GPT-2の詳しい仕組みやアルゴリズムやイ…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part4 〜スタッツを元に報酬を設計する～

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。今回は、part2の記事で話したスタッツ（プレイの特徴を表す様々な数値）を評価指標にして、…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part3 〜AIがポーカーを実況・解説する第一歩〜

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。今回は、ポーカーAIがポーカーのプレイを実況・解説してもらうにはどうしたらいいかについ…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part2 〜AIの行動を分析してみる〜

こんにちは！ナガメ研究所です。前回のpart1に”スキ”をくれた皆様、ありがとうございます。励みになります！さて今回は、いい加減やろうと思ってたAIの行動分析について…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発 part1 〜自分と対戦して賢くなるAIを作ってみた〜

こんにちは！ナガメ研究所です。先日、TwitterにAIと対戦した動画を投稿しました。まだ見てない方は先にこちらをご覧ください。※音がでますこの記事では、強化学習の内…

ナガメ研究所🎲🤖

1年前

ポーカーAI開発の思い

はじめにナガメ研究所は今、何をしているの？現在、ノーリミットテキサスホールデム(以下NL、ポーカー)を行うAIを作成しています。Unity ML-Agents Toolkitを使って強化…

ナガメ研究所🎲🤖

1年前

ナガメ研究所🎲🤖

2023年3月10日 16:32

ChatGPTのAPIが公開！サービス開発する上で気をつけるべき”プロンプトインジェクション”について

こんにちは！ナガメ研究所です。3月始めに、OpenAIがChatGPTのAPIを公開しました。これにより、これまで公式のウェブサイト上でしか操作できなかったChatGPTがアプリなどのサービスに組み込めるようになりました。以前からChatGPTの一つ前のバージョンであるInstructGPTは公開されていましたが、使用料金もグッと下がって、応答速度も非常に早いため、今後AIサービスはかなり広まって

もっとみる

ナガメ研究所🎲🤖

2022年12月28日 13:07

強化学習で遊ぶ part3 真似して育つAI

UnityのML-agentsを利用し、サッカーAIを強化学習で育てる記事です。
～～～前回の内容はこちら～～～

強化学習で遊ぶシリーズpart3じゃ。サッカー対戦をテーマに強化学習の解説をしてきたが、今回は模倣学習を学んでいくぞ。

模倣学習ですか。何かを真似るということですか？

その通りじゃ助手くん。4対4のサッカーAIを学習するのに1日かかっておったが、基本はキックしてボールをゴールに入

もっとみる

ナガメ研究所🎲🤖

2022年12月23日 11:56

強化学習で遊ぶ part2 「AIにサッカーさせてみる」

UnityのML-agentsを利用し、サッカーAIを強化学習で育てる記事です。
～～～前回の内容はこちら～～～

はじめに博士じゃ。前回に引き続き、強化学習で遊んでいくぞ。

助手です！前回はサッカーのルールも教えてないのに、AIが自ら学習してゴールまで決めてましたね！
けど、もっと沢山のナガメ(AI)でサッカーするのを見てみたいですね。

前回は学習を早めるために、狭い空間で2対2のサッカーを

もっとみる

ナガメ研究所🎲🤖

2022年12月19日 17:26

強化学習で遊ぶ part1 AIが育つ「強化学習」の面白さ

こんにちは！ナガメ研究所です。普段はポーカーAIの開発をしています。ポーカーを通して強化学習というものの面白さを伝えたいのですが、なかなか思うように開発が進められていません(ポーカーって難しい・・・)
そこで、もっと身近で面白そうなテーマをいろいろつまみ食いして、その発見をお伝えする強化学習で遊ぶシリーズを考えました。このシリーズでは、ナガメ研究所の博士と助手、ナガメの3人に強化学習の紹介をしても

もっとみる

ナガメ研究所🎲🤖

2022年12月12日 14:28

ポーカーAI開発 part7 ～スタッツを報酬に加えてうまくいった話～

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。今回は、前に書いたpart4の記事の続編です。よろしくお願いします。

はじめに前回、WTSDという、ポーカーのプレイ傾向を指す指標を元に、AIの学習をコントロールできないか試しました。結果は芳しくないとまとめましたが、今回は手応えを感じたのでその続編です。AIの学習方法やこれまで何をしてきたかなどの細かい話は前回の記事を

もっとみる

ナガメ研究所🎲🤖

2022年12月9日 18:33

噂のChatGPTにポーカーの質問をしてみた

こんにちは！ナガメ研究所です。今回は、最近噂のChatGPTを触れてみたので、その話をしようと思います。

はじめに ChatGPTとは？ChatGPTとは、OpenAIが開発したチャットサービスのことです。インターネット上の沢山の文章を学習したAIモデルを使用しています。文章で話かけると、人間が書いたものと遜色ない返答がもらえるため、2022年12月現在、話題になっているようです。
利用するには

もっとみる

ナガメ研究所🎲🤖

2022年11月30日 16:42

ポーカーAI開発 part6 ~17万試合を学習したAIと対戦してみた~

こんにちは！ナガメ研究所です。ポーカーAI開発の記事もpart6になりました。これまでの記事へのスキやフォロー、本当にありがとうございます！引き続きポーカーAIの開発を頑張りたいと思います。

さて今回は、最近やっていたパラメーターの探索(AIモデルを作るために人が決定すべき数値を探す)が落ち着いたのと、今のアプローチではもうこれ以上強くできないなあと考えたので、これまでの内容を一旦記事にまとめま

もっとみる

ナガメ研究所🎲🤖

2022年11月19日 16:40

ポーカーAI開発 part5 ～AIがポーカーを実況・解説する 2歩目～

こんにちは！ナガメ研究所です。今回は、テンプレート方式で大量に生成した文章をGPT-2に流して、ゲーム状態に応じた文章生成をするAIモデル作ってみたので、その話をします。今回の記事は、前回の書いた内容の続きとなっていますので、ぜひご覧ください。細かいアルゴリズムや数式の話はしませんので、ご了承ください。

はじめに対戦ゲームは基本、試合中に自身の考えや今後の戦略を話したりはしません。なので観客は試

もっとみる

ナガメ研究所🎲🤖

2022年11月14日 18:51

AIがnoteを書いてくれるかも？文章を生成してくれるAIモデル「GPT-2」を使って自分のnoteを学習させてみた

こんにちは！ナガメ研究所です。今流行の文章生成AIモデル”GPT-2”の日本語版を使って遊んでみたので、その内容を書いていきます。GPT-2の詳しい仕組みやアルゴリズムやインストール方法については触れていないのでご了承ください。よろしくお願いします。

はじめにGPT-2って何？って方へ、簡単な説明をします。GPT-2とは、これまでたくさんの人が書いてきた大量の文章を学習したモデルです。単語、もし

もっとみる

ナガメ研究所🎲🤖

2022年11月11日 22:21

ポーカーAI開発 part4 〜スタッツを元に報酬を設計する～

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。
今回は、part2の記事で話したスタッツ（プレイの特徴を表す様々な数値）を評価指標にして、AIのプレイスタイルをコントロールできないか試したのでその話をしたいと思います。

はじめに現在開発しているポーカーAIは、AI同士が対戦することで強くなる”self-play”という学習方法をとっています。AIは報酬と呼ばれる、行

もっとみる

ナガメ研究所🎲🤖

2022年11月9日 17:40

ポーカーAI開発 part3 〜AIがポーカーを実況・解説する第一歩〜

こんにちは！ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。
今回は、ポーカーAIがポーカーのプレイを実況・解説してもらうにはどうしたらいいかについて、関連情報を軽く紹介しつつ、筆者の考えていることについて書いていきます。

AIが実況・解説するとは？AI(コンピュータ)が実況・解説するとはどういうことなのでしょうか。機械音声などを使えば、文章があれば一応読み上げることは可能です。

もっとみる

ナガメ研究所🎲🤖

2022年10月28日 17:33

ポーカーAI開発 part2 〜AIの行動を分析してみる〜

こんにちは！ナガメ研究所です。前回のpart1に”スキ”をくれた皆様、ありがとうございます。励みになります！
さて今回は、いい加減やろうと思ってたAIの行動分析について、ざっと項目を洗い出してきました。ただ、筆者はポーカー初心者です。ポーカープレイヤー目線のもっと良いデータの見方があれば参考にさせて頂きたいので、ぜひコメントお願いします！

ポーカーAIの行動分析調べてみると、ポーカーゲームではH

もっとみる

ナガメ研究所🎲🤖

2022年10月14日 17:15

ポーカーAI開発 part1 〜自分と対戦して賢くなるAIを作ってみた〜

こんにちは！ナガメ研究所です。
先日、TwitterにAIと対戦した動画を投稿しました。まだ見てない方は先にこちらをご覧ください。※音がでます
この記事では、強化学習の内容に触れつつ、どういった工夫をしてきたかを書いていきます。

問題となった点今回、ML-agentsの"self-play"を用いて、AI同士を対戦させて強いAIをつくることを目指しました。その過程で、うまく学習できなかったパター

もっとみる

ナガメ研究所🎲🤖

2022年10月6日 15:23

ポーカーAI開発の思い

はじめにナガメ研究所は今、何をしているの？

現在、ノーリミットテキサスホールデム(以下NL、ポーカー)を行うAIを作成しています。Unity ML-Agents Toolkitを使って強化学習やセルフプレイを試しています。この記事では，考えていることとかつらつら書いていきます。

ポーカーを題材に選んだのはなぜ？

発端は以下の動画。世界のヨコサワさんが日本のポーカーについて熱く語っているのでぜ

もっとみる

マガジン

自然言語処理シリーズ

強化学習で遊ぶシリーズ

ポーカーAI開発シリーズ

記事一覧

ChatGPTのAPIが公開！サービス開発する上で気をつけるべき”プロンプトインジェクション”について

強化学習で遊ぶ part3 真似して育つAI

強化学習で遊ぶ part2 「AIにサッカーさせてみる」

強化学習で遊ぶ part1 AIが育つ「強化学習」の面白さ

ポーカーAI開発 part7 ～スタッツを報酬に加えてうまくいった話～

噂のChatGPTにポーカーの質問をしてみた

ポーカーAI開発 part6 ~17万試合を学習したAIと対戦してみた~

ポーカーAI開発 part5 ～AIがポーカーを実況・解説する 2歩目～

AIがnoteを書いてくれるかも？文章を生成してくれるAIモデル「GPT-2」を使って自分のnoteを学習させてみた

ポーカーAI開発 part4 〜スタッツを元に報酬を設計する～

ポーカーAI開発 part3 〜AIがポーカーを実況・解説する第一歩〜

ポーカーAI開発 part2 〜AIの行動を分析してみる〜

ポーカーAI開発 part1 〜自分と対戦して賢くなるAIを作ってみた〜

ポーカーAI開発の思い