ログイン
会員登録
DPO
書いてみる
関連タグ
#LLM (3,878)
#AI (308,874)
#人工知能 (221,139)
#大規模言語モデル (1,883)
#HuggingFace (369)
#Llama2 (178)
人気
急上昇
新着
定番
有料のみ
6件
人気の記事一覧
LLMの強化学習における新手法:TR-DPOの論文紹介
sergicalsix
11日前
10
最近のLLMの学習法のまとめ - SFT・RLHF・RAG
npaka
8か月前
103
DPO による Llama 2 のファインチューニング
npaka
8か月前
41
Google Colab + trl で DPO のQLoRAファインチューニングを試す
npaka
8か月前
17
股関節形成不全 (HD)
幻の犬飼い
7か月前
10
従来のIPOに代わる選択肢は何か?SPACとDirect listingについて
yuri
2年前