レスありです
モデルをいくつGPUに保持するかって設定ですよね
Maximum number of checkpoints loaded at the same timeは1
Only keep one model on deviceは〆済み
にしてあるので1つしか読み込まないはずなんですよね
終了するとき別の6GBモデルに切り替えておけば平気なんですけど
今までこんなこと無かったんだけどなー我慢するしかないか