見出し画像

16GBのVRAMで4bit量子化版のCommand R+ 104B版を動作させる

 取り急ぎ状況報告。16GBのVRAMを搭載したGPUと64GB主メモリのPCでも、下記記事の "なんちゃって小説(日本語で36,204万語)" をCommand R+にプロ編集者になって頂いて批評して頂くことに成功。
 もう少し改善できそうな気もするけど、現時点でのパラメータは下記の通り。なぜか一時間程度で完了してしまったので、自分でも理由が分からずに吃驚。(とりあえず「結果オーライ」ということで)

  • -ngl 5

  • -c 30000

  • OSはUbuntu 22.04

 実はWSL2だと消費リソースがもったいないので、Windowsノートパソコンに無理やりUbuntu 22.04を同居させて検証実施。その話は後日に。

 では。

ーーーー
 記事作成:小野谷静(オノセー)

この記事が気に入ったらサポートをしてみませんか?