ailora will

LLM・画像生成AIほか生成AI全般に興味あり。たまに検証とかします。作ったコードと…

6 フォロー 40 フォロワー

OpenAI-TranslatorでGemini1.5FlashAPIを利用して、長文でも無料で翻訳をする方法（翻訳以外にコード解説や要約、自分で作成した…

※OpenAI-Translatorは中国系の方が開発されているOSSであり、その点に懸念を持つ方には使用はおすすめできません。何故翻訳アプリが必要なのか今や、ChromeやEdgeには英…

ailora will

5時間前

gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、ネオチバの設定作成対決させた(創造的タスクテスト)。

幸運なことに、gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、「サイバーパンクの仮想の千葉市、ネオチバの設定を作ってください。」で設定を作…

ailora will

3週間前

ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

LMSYS Chatbot Arena: Benchmarking LLMs in the Wildは、オープンソースで人間がLLMの勝ち負けを評価する研究で、現在40種類のLLMのうち、2つのLLMが一定の基準(得点が定…

ailora will

1か月前

ChatbotArenaの対戦画像集

各項目の一番下にあるPerplexityのリンクは、各質問をClaude3-Opusにしたものですので、参考にしてください。本編はこちらです。 ChatbotArenaで対戦しまくって、各LLMの…

ailora will

1か月前

11種のLLMでのPythonコード生成（ダイスアプリ作成）の簡易テストをしました。

様々なコード生成専用のものも含めて、自分の使用可能な範囲のLLMを使用し、簡単なダイスアプリを作らせることで、実際の簡単なコード生成がどの程度できるか調査してみま…

ailora will

1か月前

bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をGithubで公開しまし…

　bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をClaude3-OpusとGPT4-Turboを使用して、ところどころ修正して…

ailora will

1か月前

CommandR+量子化の簡易比較テスト(dranger氏のtxtを使用)追記ローカルでのiq1_sテスト

　CommandR+の量子化を作成してくれたdranger氏が各量子化ごとでの出力結果のtxtを公開してくれました。　同じシード、温度は0の設定で、「Write an essay about AI in th…

ailora will

1か月前

llama.cppのserver.exeに起動オプションを送って起動できるPythonコードを公開しました。

残念ながら、2024年4月6日時点のKoboldcppではc4ai-command-r-v01-GGUFが起動できないので、llama.cppで起動するしか無いのですが、cuiで動かすのは嫌なので、server.exeで…

ailora will

1か月前

Koboldcpp用pngメタデータ編集コード公開しました

　GUI付きでKoboldcppにインポート可能なchub.aiとPygmalionAIのダウンロードしたキャラクターのPNGファイルのメタデータを編集できて保存ができるコードを作成しました。 …

ailora will

1か月前

PerplexityのProSearchなどの日本語変換の確定でクエリが送信される問題を解決するユーザースクリプトの公開（ページ機能での同…

@toshikawaさんが、labs.Perplexityでの日本語入力問題を解決するコードを作成してくれました！ Labs.perplexity.aiでの日本語入力中のEnterで送信されないようにする。自…

ailora will

1か月前

Claudeに定型文挿入ボタンを追加するユーザースクリプトを公開しました

　Claude本家サイトのChatに定型文挿入のボタンを追加するユーザースクリプトを公開しました。基本はClaude3-Opusに作成してもらって、動作しなかったので私が適宜修正しま…

ailora will

1か月前

Perplexityの検索ボックスに定型文を入力できるコードを公開しました

　残念ながら、Perplexityの検索のバックエンドはおそらくBingを使用(訂正Bingではなくhttps://www.reddit.com/r/LocalLLaMA/comments/1bh6o3e/reverse_engineering_perple…

ailora will

1か月前

Claude3の3モデルと、GeminiPro1.5で、10万字超えの要約性能（粗筋作成）を比較してみた。追加テストしました

　北条カズマレさんと某所でのチャットで、Claude3-Opus本家でも、数万字超えで要約がおかしくなるという話をしていたので、実際に検証してみることにした。比較方法　検…

ailora will

1か月前

PerplexityのClaude3-Opusのトークン制限疑惑を検証してみた。訂正とお詫び有り

　PerplexityProで、Claude3-Opusを使用した場合、Anthropicの公式のClaude3-Opus200kと異なり、30kほどでトークンが制限されているとの噂が出ている。　そこで、自分で検…

ailora will

1か月前

Perplexityのコレクション機能を使用したClaude3を使った半自動小説作成bot（プロンプトを公開しました）

　自分も昨日知ったばかりの機能なのですが、Perplexityにはコレクションという名前からは想像できないシステムプロンプトを設定できる、Poeのbotや、ChatGPTのGPTsに近い…

ailora will

2か月前

Claude3本家とPerplexityとPoeのサービス比較

　以下は、AnthropicのClaude Pro、PoeのPoeサブスクリプション、Perplexity Proの価格とサービス内容を比較した表です。なお、PerplexityProのClaude3Opusを使用して作成…

ailora will

2か月前

ailora will

2024年5月23日 21:03

OpenAI-TranslatorでGemini1.5FlashAPIを利用して、長文でも無料で翻訳をする方法（翻訳以外にコード解説や要約、自分で作成したアクションも可能）

※OpenAI-Translatorは中国系の方が開発されているOSSであり、その点に懸念を持つ方には使用はおすすめできません。

何故翻訳アプリが必要なのか今や、ChromeやEdgeには英日翻訳機能が付いていて、翻訳性能も十二分なものになって、今更翻訳アプリなんて不要と言いきっても良いわけだが、Firefoxには英日翻訳機能はまだない。
更にいうと、まだChromeやEdgeにもpdfの翻訳機

もっとみる

ailora will

2024年4月30日 22:09

gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、ネオチバの設定作成対決させた(創造的タスクテスト)。

幸運なことに、gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、「サイバーパンクの仮想の千葉市、ネオチバの設定を作ってください。」で設定を作らせ続けて、創造的タスクでの性能を比較してみた。

最初はそのまま作らせ続けたのだが、途中から適当に指示を追加して、性能を比較した。
指示によって、評価がひっくり返ることも合ったが、本当にギリギリ

もっとみる

ailora will

2024年4月20日 18:34

ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

LMSYS Chatbot Arena: Benchmarking LLMs in the Wildは、オープンソースで人間がLLMの勝ち負けを評価する研究で、現在40種類のLLMのうち、2つのLLMが一定の基準(得点が定まったものは選ばれにくくなるなど)で選ばれて、その出力結果を人間がAとBのLLMの名前が伏せられた状態で、どちらが優れているかを評価するテストです。
その結果もリンク先のLead

もっとみる

ailora will

2024年4月20日 18:27