人気の記事一覧

『仕事で、遊ぼう。』

3か月前

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】

2週間前

優れた事例を参考にしながら独自の強みを築いて行く ベンチマーキング

304:【成長】継続していく上で大事にしてきたこと3つ!

10b程度のモデルをファインチューニングする日記 (逐次更新)

2週間前

Geminiの技術レポートを読み解く〜生成AIの最前線

【論文瞬読】大規模言語モデルの自己反省能力を高める新手法「Self-Contrast」

2週間前

【論文瞬読】LLMが「人の心」を理解する: 新しいベンチマークの提案

1か月前

【論文瞬読】大規模言語モデルは外部情報にどう反応する?知識の矛盾への対処法を探る

1か月前

【論文瞬読】エキスパートAGIの実現に向けたベンチマークの提案

1か月前

【論文瞬読】言語モデルにメタ認知能力を!MetaRAGが切り拓く新たな可能性

1か月前

もはや生成AI(LLM)はドラゴンボール状態

1か月前

【中級】LinuxでFF15ベンチマークを動作させる

有料
0〜
割引あり
2週間前

Mac mini M2 ゲームとベンチマーク

3か月前

【論文瞬読】OmniACT: 自律型エージェントの汎用性評価に向けた大規模UIデータセットが登場!

1か月前

【論文瞬読】マルチタスク言語理解ベンチマークMMLUの元論文を読んでみた

1か月前

Japanese-StableLM-Instruction-ja_vocab_beta-7Bを試した

5か月前

日本語生成AIのベンチマーク

3週間前

Claude 3 Opusのベンチマーク結果の小数点以下

3週間前

CALM2-7Bをベンチマークする(11/5追記)

5か月前