人気の記事一覧

速報:話題の 1ビットLLMとは何か?

既存日本語LLMをBitNetで置き換えて実行してみた

2か月前

BitNet&BitNet b158の実装①

1か月前

これは衝撃!1.5Bで超高性能LLM!RWKV-5-World-v2

5か月前

イーロン・マスク xAIによる「Grok-1」リリース!明らかに重すぎる重みが重い

1か月前

【論文瞬読】無限の可能性を秘めたTransformerFAM: 脳科学と言語モデルの融合

10日前

OpenAIの動画生成AI「Sora」の映像は絶対に見ておいたほうがいい

2か月前

「Makuake」で開始したプロジェクトの応援購入総額を時系列予測する

BERTの解説

BitNet&BitNet b158の実装④

1か月前

【論文紹介】TDB: トランスフォーマーデバッガを使ったGPTの内部メカニズムの解析例

1か月前

Soraの革新的動画生成技術:その裏側にある驚異のメカニズムを解明

Mambaを動かして速度をtransformerと比較するメモ

2か月前

Transformerのデコーダーモデル解説

大規模言語モデル(LLM)

5か月前

[論文紹介コード付] 時系列Transformerを自然言語処理のお作法で鍛えたらゼロショットで未来の系列を予測することができました

”More Agent”はLLMの見えない壁を超えるか?

Transformerの神通力はいつまで続くか

3週間前

生成AIと宇宙との不思議な邂逅

1か月前