人気の記事一覧
大規模言語モデルをフルスクラッチする練習 (環境構築ー前処理ー事前学習ーファインチューニングー評価まで)
大規模言語モデルの構築の事前学習に使えそうなデータセット(主に日本語系)の整理メモ
Chat VectorならぬMath Vectorは作れるのか
Chat VectorにならぬCode Vectorは作れるのか
6-4.ディープラーニングの詳細な説明(深層強化学習等)
Google Colabでの日本語Mambaの事前学習
BitNetにおけるSTE(Straight-Through Estimator)の実装
BitNet&BitNet b158の実装:参照まとめ
クロードのいる生活(10)ラーメンズのApple CM