CUDAを使ったエンコーダーは実際に映像編集ソフトなどで既にあるんだが
確かにエンコードスピードは早くなるが一番良くて数倍程度で
併せてCPUの稼働もフルに近くなる
数千コアも使ってるにしては期待はずれな結果なんだが
何故こうなるかと言うとメモリが関係してくる
グラフィックカードの搭載メモリ量は多くて数Gバイトだが
これを何千もあるCUDAコアに割り当てると1コア当りでは1MBレベルになってしまう
エンコード作業に使うバッファとしては全く足りず頻繁にスワップが発生して速度低下し、
数千コア分のスワップを処理するCPUもパンク状態になってしまう
結局のところ、数千のコアが充分に動作出来るのは1コアが使うのが1MB程度の処理に限られ
それ以上の事をさせるにはコア以外の部分でスパコン並に大掛かりなシステムが必要になってしまうわけだ