📚今わたし、これ読んでる https://sakana.ai/evolutionary-model-merge-jp/
🌈日本語画像生成モデル (EvoSDXL-JP)はまだ公開されてないようね 残念だわ。それが使いたかったのよー あ、SakanaAIのお話ね
早速、SAKANA AIのEvoLLM-JP-A-v1-7Bをllama.cppでggufに変換してローカルPCで実行した。何となくではあるが、blogに書いてあることは出来ている気がする (q4に変換したことが影響したかは謎だけど) https://sakana.ai/evolutionary-model-merge-jp/
コストが少ない中でどうアプローチするのかについて考えさせられた。こういう姿勢は見習いたい。独自ではないけど新しいのは素晴らしい。ただ、追加学習をさせるより発展的で独創的なアプローチだと思う。オリジナルのモデルを超えるための手法の一つだと思う。日本の市場が見えているんだろうな。
概ね、正しいw https://huggingface.co/spaces/SakanaAI/EvoVLM-JP 進化的アルゴリズムによる基盤モデルの構築 https://sakana.ai/evolutionary-model-merge-jp/ arxiv https://arxiv.org/html/2403.13187v1