20万行程度のアプリケーションだよ。
ビルドログがわかりにくくなるんで/MPを使ってないのと、templateとCUDA(nvcc)が
足を引っ張ってる気がしないでもない。