DGDenoiseのフィルタdescriptionを貼って何を質問したいのかさっぱりわからないが、
DGDenoiseが速いのならそれ使ってればいいじゃん?何でわざわざKNLMeansCL使ってるのさ?
これCUDAフィルタでしょ?
OpenCLで動くKNLMeansCLとは仮にロジックが全く同じであっても同じパフォーマンスにはならない
NVIDIAでOpenCLを動かすのはちょっとパフォーマンス面で都合の悪いところがありましてね。。。

その上でDGDenoiseを見ていくと、

DGDenoiseは単なる2Dのデノイザーだけど、KNLMeansCLは2D+時間軸のフィルタなんで
主フレーム+前後nフレームと、時間軸ONにすれば処理するデータ量がでかくなるのは当然
d=0にすれば時間軸方向参照しなくなるんでDGDenoiseと同じになる

DGDeboiseはデフォルトでchroma=falseなんで最初っからYチャンネルしか処理してない
もっともKNLMeansCLでYUV420p8のUVチャンネルをオフってもたいして速度上がらないのだけど

DGDenoiseのsearchw=5(default)ってのはたぶん5*5のブロックで処理してる
おそらくKNLMeansCLのa=2(対象ピクセル+近傍2ピクセルで5*5)と同等なんじゃないかなあ