X



【NVENC/VCE】ハードウェアエンコーダーを語るスレ【QSV】

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@編集中 (ワッチョイ 4381-Xflc)
垢版 |
2018/08/08(水) 04:44:09.82ID:NnYmcXUx0
ソフトウェアエンコーダーに画質は劣るものの、エンコード完了までの処理速度が爆速なハードウェアエンコーダーを語りましょう

●Intel
https://software.intel.com/en-us/media-sdk
https://en.wikipedia.org/wiki/Intel_Quick_Sync_Video

●NVIDIA
https://developer.nvidia.com/nvidia-video-codec-sdk
・エンコード: https://en.wikipedia.org/wiki/Nvidia_NVENC
・デコード: https://en.wikipedia.org/wiki/Nvidia_PureVideo

●AMD
https://github.com/GPUOpen-LibrariesAndSDKs/AMF
・エンコード: https://en.wikipedia.org/wiki/Video_Coding_Engine
・デコード: https://en.wikipedia.org/wiki/Unified_Video_Decoder
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0087名無しさん@編集中 (ワッチョイ 6ad2-MHz5)
垢版 |
2018/08/25(土) 16:35:38.35ID:nJe+uVbx0
ワッチョイの下4桁はUserAgentで決まるから被ってもおかしくないはず
PcWxはMonazilla/1.00 JaneStyle/4.00 Windows/10.0.17134らしいから利用者も多いだろうし
0090名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/25(土) 17:35:59.42ID:DovDn/Ya0
NVEncの固定品質(>>58)試してるんだけど、どうもコレ内部では
ビットレート指定VBRと全く同じモードで動いてるっぽい
(少なくともGTX1060では)

ビットレート指定VBRと画質が全然変わらなかった

実写、アニメ、前半実写で後半アニメの3つくらいでエンコしてSSIM測って
SSIM-ビットレートをプロットしたら全部同じ線上に並んでしまった

という訳で今の所使う意味なさそう
次のTuringでは良くなるのかなぁ
0092名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/25(土) 17:43:46.29ID:k4YhneCR0
Turingの方はTensorコア使ったポストエフェクトとか超解像の方がトピックかもしれん
SDKから機能的にどう触れるかはまだ解らんけども、描画フレームにms単位の処理時間で適用出来る変態仕様みたいなんで
デコードされたフレームデータにも使えたらフィルタ処理系で色々面白い事出来るかも
0094名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/25(土) 19:10:57.61ID:DovDn/Ya0
あれ、でもやっぱりビットレート分布は全然違った
ビットレート指定VBRと同じではなかった
ビットレート分布が変わっても平均するとプラマイゼロでSSIMは変わらないのか・・・
0096名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/25(土) 19:23:10.26ID:DovDn/Ya0
NVEncの固定品質はちゃんと固定品質になってた
↓最初4分の1が実写で以降アニメの動画をエンコードしてCheckBitrateでビットレート分布出した
https://i.imgur.com/BfPIXjI.png

SSIMはほぼ同じだったけどSSIMはそういうものなのかな
まぁでも固定品質がちゃんと使えることは分かったわ

これからは固定品質一択だね
ビットレート指定VBRなんて必要ないわ
0098名無しさん@編集中 (ワッチョイ d9ec-PcWx)
垢版 |
2018/08/25(土) 20:19:17.91ID:gHNH7/ie0
>>90 >>96

>>55>>58にあるNVEncの

 > --vbrhq 0 --vbr-quality 32

については、rigaya氏のブログのNVEnc 4.12の記事のコメント欄でやりとりされていて、
そこでのrigaya氏のコメントは以下のようになってる。

---
固定品質モードですが、ご指摘の方法でよろしいかと思います。

NVEncCのドキュメントにないのは、一応NVENCのSDK上では、
これがビットレート指定モードの一部だからです。
(「Rate control」としてはずばり固定品質モードというのはなく、
vbrhqでビットレートを指定しない(つまり0)、という形が必要です)
---
0100名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/25(土) 20:49:29.76ID:k4YhneCR0
>>97
何勘違いしているのか、知ってるフィルタの名前使いたいのか知らんけど
Tensorコアでwaifuの処理内容が高速に処理出来る訳じゃ無い

nvidiaが用意した機械学習成果を元にTensorコアで判断処理して補正・補完を適用するnvidiaの超解像技術になる
学習データが更新されると精度も上がるだろうし、レイトレなんかよりコンシューマPC環境にTensorコアを使用した処理環境が降りてくる方がデカい
0101名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/25(土) 21:01:03.56ID:k4YhneCR0
nvencの固定品質モードってのは便宜上やりとりとしてがそう呼称してるだけで

ビットレートの指定を明示的に無くす事で、指定ビットレートに近づけるために量子化係数の増減調整がされなくなるから、実質上固定品質と同意の処理になるってだけ
0102名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/25(土) 21:04:45.93ID:DovDn/Ya0
>>100
別に勘違いしてないよ
nvidiaが用意するモデルにも興味はあるけど、既に高画質だって分かってるwaifu2xが
Tensorコアを使えるようになってリアルタイムくらいの速さになればいいなって期待してる

Tensorコアはfp16(半精度)で4x4の行列積を演算するコアだよ
convolutionを高速に計算するためにあるんだから、
convolutionがボトルネックになってるwaifu2xも高速化できるはず

今はfp32で演算してるからfp16でも精度がなるべく落ちないようにチューニングする必要はあるだろうけど
Tensorコア使ってconvolutionを計算するところはcuDNNがやってくれるから
書き換えはそんなに大変じゃないと思う
0103名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/25(土) 21:09:21.97ID:DovDn/Ya0
>>101
揚げ足取るようで申し訳ないけど、固定量子化量(Constant QP)じゃないんだから
量子化係数は調整してるでしょ
もしかして今の実装的には 固定品質=固定量子化量 だったりする?
0104名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/25(土) 21:59:30.04ID:k4YhneCR0
>>103
「指定ビットレートに近づけるために量子化係数の増減調整」と書いているんだが
画質評価基準に擦り寄せる為の量子化係数の調整と勝手に思い込みで混同されても困る

waifu2xの件も行列積の浮動小数点演算精度が半精度化しているなら、行列積としての精度どれほど落ちると思ってる?
もうそれはwaifu2xのロジックをベースとした精度が大幅低下した派生物でwifu2xでは無いんだよ、同じ処理が出来ている訳じゃ無いんだしな

都合良く読み替えたり、後出しで精度不足とか都合の良い部分容認してみたりとか、ほんとに狡い奴だなお前は
0105名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/26(日) 02:11:05.20ID:i4axf3T+0
>>104
えっと、つまり>>101

ビットレートの指定を明示的に無くす事で、指定ビットレートに近づけるために量子化係数の増減調整が
されなくなるから、実質上固定品質と同意の処理になるってだけ

↑これの解釈は

ビットレートの指定を明示的に無くす事で、(「指定ビットレートに近づけるために量子化係数の増減調整」と
「画質評価基準に擦り寄せる為の量子化係数の調整」の両方をやっていたところの)
指定ビットレートに近づけるために量子化係数の増減調整がされなくなるから、
(「画質評価基準に擦り寄せる為の量子化係数の調整」だけになって)実質上固定品質と同意の処理になるってだけ

ってことか?それとも

ビットレートの指定を明示的に無くす事で、指定ビットレートに近づけるために量子化係数の増減調整が
されなくなるから、(代わりに「画質評価基準に擦り寄せる為の量子化係数の調整」がされるようになって)
実質上固定品質と同意の処理になるってだけ

ってことか?うーむ・・・
0106名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/26(日) 02:30:07.42ID:i4axf3T+0
>>104
waifu2xは「Tensorコアで」って書いてるんだから半精度化することも含めて
できたらいいなっていう期待で書いてるんだけど・・・

> waifu2xの件も行列積の浮動小数点演算精度が半精度化しているなら、行列積としての精度どれほど落ちると思ってる?

ディープラーニングの推論をfp16やint8でやっても精度低下は僅かって話はたくさんあるし、
nvidiaがfp16の演算コアを導入したのは、「ディープラーニングでは精度低下は僅かで十分実用的」だからでしょ
それを否定されてもなぁ・・・
0107名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/26(日) 09:46:57.21ID:BIBv3N7z0
>>106
ホントに手前の都合良く緩さを容認した事は「当たり前」と話して、そうじゃない事は違いを許さないとか利己的だな

行列積は単純な浮動小数点の計算と違って、複数回計算で精度取り戻せない
32bit精度で行列演算するコードを16bit精度のTensorコアで高速化とか、半精度を容認する前置きも無く書き込んでおいて
後出しで半精度容認している旨書き込んで悪びれもしないし

waifu2xと同様の処理が出来ても同じ精度維持出来ないから同じ処理は出来ないと言っているのに
機械学習でTensorコアの効果を否定しているかの様に勝手に話置き換え始めたり
ホントに最低に狡い奴だな
0109名無しさん@編集中 (ワッチョイ d9ec-PcWx)
垢版 |
2018/08/26(日) 11:21:56.08ID:m7n2BMFu0
要するに

 45c3-iM7h :
  精度を落としたものをwaifu2xと呼ぶことは絶対に認めない

 29c3-PcWx :
  今の waifu2x は高品質だけど遅すぎるから、半精度化によってある程度品質が落ちる代わりに
  Tensorコアによる高速化メリットが得られる waifu2x' みたいなもんができるといいな。
  (半精度化による品質低下やTensorコアによる高速化がどれくらいかにもよるけど)

ってことじゃないの。

技術的なこだわりが強いのか何なのか知らんが、受け取り方がねじ曲がりすぎじゃね?
カリカリして人格攻撃するほどの話じゃないだろ。
0110名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/26(日) 14:06:55.17ID:i4axf3T+0
>>107
> 32bit精度で行列演算するコードを16bit精度のTensorコアで高速化とか、半精度を容認する前置きも無く書き込んでおいて

>>92
> Tensorコア使ったポストエフェクトとか超解像

これはディープラーニングを使ったもので、「Tensorコアでディープラーニングを計算する」
って時点で、fp16に精度を落として行列積を計算するってことだよ

つまり、ディープラーニング(正確には行列積部分)をfp16で計算するっていうのは君が最初に言ってること

同じようにディープラーニングで超解像するwaifu2xもTensorコアで高速化できるよね
って話をしてるんだから、fp16で計算するっていうのは何の脈絡もなく出てきたわけではない

> waifu2xと同様の処理が出来ても同じ精度維持出来ないから同じ処理は出来ないと言っているのに
> 機械学習でTensorコアの効果を否定しているかの様に勝手に話置き換え始めたり

ディープラーニングを使った代表例みたいなwaifu2xにTensorコアを使うことを否定するのは
「機械学習でTensorコアの効果を否定」するのと同義だと思うのだが
0113名無しさん@編集中 (ワッチョイ d9ec-PcWx)
垢版 |
2018/08/26(日) 15:22:59.23ID:m7n2BMFu0
>>110のように「お前が最初に言った」みたいな書き方をすると、また不毛な返答が返ってくる気がするので

  "こっちは元々「fp16化+Tensorコアで高速化したリアルタイムwaifu2x(もどき)」を想定して書き込んでて、
   >>100でお前が勘違いとか言ってきたからそれに答えて詳細を説明しただけなのに、
   精度落としたらwaifu2xじゃないとか、後出しとか狡いとか利己的とか言われて迷惑してる。”

って書いてやった方がよい気がする。
0114名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/26(日) 17:18:48.39ID:BIBv3N7z0
>>113
指摘の弁解も理由も全部後出し
取り繕いばっかりじゃねーかよ

そんで、waifu2xの演算に精度不足というなのがTensorコアが機械学習用途に不適というこじつけなるか理由聞かせてくれよ
0115名無しさん@編集中 (ワッチョイWW 45c3-iM7h)
垢版 |
2018/08/26(日) 17:29:49.46ID:BIBv3N7z0
>>112
「可能性」とか言い出せばどっち前者だろうが後者だろうがイチャモン付けられるってか?

品質基準のVBRロジックなんだから、ビットレート指定時に品質基準での調整ロジックが動いて無く、ビットレート指定を無くした時にだけ稼働すなら、ビットレート指定時は品質基準のVBRじゃなくなるわな
nvidiaが品質基準VBRとして実装しているものすら疑いだしたら、何を基準で正否とするよの?

後者と判断するなら、その根拠を提示してくれよ
0116名無しさん@編集中 (ブーイモ MM01-AWmg)
垢版 |
2018/08/26(日) 18:05:10.01ID:k5cd80q8M
ffmpegでのエンコードパラメータを極めるスレはどこ?
0117名無しさん@編集中 (ワッチョイ d9ec-PcWx)
垢版 |
2018/08/26(日) 18:28:06.93ID:m7n2BMFu0
>>114
> waifu2xの演算に精度不足というなのがTensorコアが機械学習用途に不適というこじつけなるか理由聞かせてくれよ

そもそもその前の時点でお前が話を読み違えてるんだよ。>>107でお前が

  > 機械学習でTensorコアの効果を否定しているかの様に勝手に話置き換え始めたり

と書いてるが、106はTensorコアの効果の否定なんてしてないだろ。
下3行の解釈を、お前が間違えてるだけのように見えるが。

29c3-PcWx が言いたいのは、

 ・Tensorコアがfp16なのは、NVIDIAがfp16でもディープラーニングでは十分実用的だと判断したからではないか

 ・ならばwaifu2xのfp32処理の部分を、Tensorコアのfp16処理に変えてみるのももしかしたらアリではないか?

ってことでしょ。まあディープラーニングっつっても目的によって必要な精度は変わってくるんだろうから
そんな単純な話が成り立つかどうかは知らんけどね。

とりあえず落ち着いて、やりとりを最初から見直してみたほうがいいんじゃねえの。
0118名無しさん@編集中 (ワッチョイ d9ec-PcWx)
垢版 |
2018/08/26(日) 18:36:13.01ID:m7n2BMFu0
まあwaifu2xについて、「処理をfp16にしたらまともな品質にならない」みたいな検証が既にされてるのであれば
淡々とその結果を示してあげればいいと思うけど、これ以上続けたいなら
そろそろ画像拡大スレに移ったほうがいいんじゃないかとは思う。

 【超解像】画像拡大ソフト総合スレ2【waifu2x】
 https://egg.5ch.net/test/read.cgi/software/1462848853/
0119名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/26(日) 20:25:54.45ID:i4axf3T+0
>>115
ビットレート指定時は品質基準VBRじゃないでしょ
ビットレート指定のVBRなんだから
ビットレートを指定しなかったときに品質基準VBRになる

> nvidiaが品質基準VBRとして実装しているものすら疑いだしたら、何を基準で正否とするよの?

固定QPモードがあるんだから、ビットレート指定VBRは、
平均ビットレートが目標より大きくズレたら、適当にQP操作してるだけかもしれないじゃん
そこから、ビットレートを目標にあわせる処理を抜いたら、固定QPになっちゃう
NVEncCのデフォは固定QPだし

> 後者と判断するなら、その根拠を提示してくれよ

後者か前者かなんて分からないよ
中の実装がどうなってるかなんて知らないから
エンコード結果、どういう出力がされたかくらいでしか観測できない

ビットレート指定VBR時はビットレート指定VBRのレートコントロールが働いて
品質基準VBR時は品質基準VBRのレートコントロールが働くって考えるのが
最もシンプルな理解だと思うから、そうじゃないときはちゃんと書いてくれないと分からないよ
0121名無しさん@編集中 (ワッチョイ 29c3-PcWx)
垢版 |
2018/08/26(日) 21:11:24.15ID:i4axf3T+0
>>120
サンクス

この資料だと、Target Quality(固定品質)がVBRの一部って書き方じゃないんだよね

対応してるレートコントロールは以下の4つです
- CBR
- VBR
- 固定QP
- 固定品質

って感じ

あとVBRのレートコントロールについての記述は主に
> The encoder tries to conform to average bitrate of averageBitRate over the long term
これだけ
0124名無しさん@編集中 (ワッチョイWW 0b9a-r/q8)
垢版 |
2018/08/30(木) 18:15:44.74ID:h+nfkzzo0
76 名無しさん@編集中 (ワッチョイWW ea84-/kQw) sage 2018/08/25(土) 08:51:46.65 ID:A+XxIkPU0
どーせアニメだろw

122 名無しさん@編集中 (ワッチョイWW ea84-/kQw) sage 2018/08/27(月) 10:48:37.03 ID:KSUuDcZo0
紙芝居のためにご苦労さま

この間46レスと50時間w
0125名無しさん@編集中 (ワッチョイ 8bdc-P9Fo)
垢版 |
2018/09/02(日) 19:42:33.51ID:DuBTtQDB0
        
    r ‐、                   
    | ○ |         r‐‐、      良い子の諸君!
   _,;ト - イ、      ∧l☆│∧   
 (⌒`    ⌒ヽ   /,、,,ト.-イ/,、 l.   証拠を要求するネトヲタがいるが
  |ヽ  ~~⌒γ⌒) r'⌒ `i´ `⌒)   君がいくら証拠を開示しても
 │ ヽー―'^ー-' ( ⌒γ⌒~~ /|  そのネトヲタは絶対信じないぞ!
 │  〉    |│  |`ー^ー― r' |  おまけにそいつは自分側の証拠を出したことがない。
 │ /───| |  |/ |  l  ト、 |  
 |  irー-、 ー ,} |    /     i     自分の信じたいものしか信じなくなったらおしまいだな!
 | /   `X´ ヽ   /   入  |
0129名無しさん@編集中 (キュッキュ MM77-4kZw)
垢版 |
2018/09/09(日) 13:57:41.51ID:614xNICFM0909
劣化を感じるようなエンコードしかできないのは、ユーザーの能力不足による無理な設定によるところが大きい
いくら優秀なエンコーダーを用いたところで、フルHD動画を最大1Mbpsなんかに設定したら、どうやっても劣化は目につく
それに放送番組を再エンコードするのにノイズ除去すらもせずにエンコード直行など、愚かにもほどがある
0132名無しさん@編集中 (スプッッ Sd7a-HjvB)
垢版 |
2018/09/11(火) 10:44:00.24ID:CJzWO1xPd
ソースで多少前後するけど
静止画比較しないと気にならないレベルなら
固定量子化ベースの量子化係数設定値なら
H264 QSV 〜22
H264 NVEnc〜20
HEVC QSV 〜24
HEVC EVEnc Pascal 〜23 Maxwwll 〜22
あたりが画質に目立った劣化が知覚できるかの境界線あたりかと(あとは好みで1減らすなり、IPBで階段状に設定するなり

コーデック問わず画質容量比と処理時間でなら、PascalのNVEncが速度とのバランス的に優秀
H264→HEVCでの速度低下がQSVが1/3〜1/4にもなるけど、NVEncだとMaxwellで1/2、Pascalで2/3程度の速度にしか落ちないのがデカい

HWエンコーダで時間問わずならQSVのHEVCなんだろうけど
HEVCだと速度低下激しすぎて(GT2で40fps前後)CPUの方がOC4コア以上ならx264のfasterとかで処理しちまった方が良くなってくる

ただNVEncはGeforce/Titanだと同時処理が2件までなんで、TSの録画後に自動処理で録画タスク毎に処理するのには向かない(やりようはいくらでもあるけど)のが難点
0134名無しさん@編集中 (ワッチョイWW 9a87-vvm8)
垢版 |
2018/09/11(火) 16:32:00.96ID:gbdYj/Dq0
>>115
組める人には問題ないけどね(自分もそうやっている
フォルダ監視して順次エンコさせる場合には、リスト取得や録画中のファイルか録画完了したファイルかの判断とか
録画管理ソフトで録画終了時に実行する様なバッチみたいに、コマンドラインのエンコード命令にに毛の生えたぐらいのと違って、自分で組まなきゃならん部分多いから多少はハードル高くはなる

実際に他のスレで同時エンコ数の制限有るから使いづらいみたいな事書き込んでた奴も見かけてるし
0138名無しさん@編集中 (ワッチョイWW d7e9-kO1E)
垢版 |
2018/09/15(土) 00:24:18.61ID:6Guydu2D0
>>137
「また,エンコーダの圧縮アルゴリズムにも改良が入っており,Pascal世代と比較して,同じ画質ならH.264で15%,H.265なら25%も低ビットレート化できるようになった。
逆に言えば,同じビットレートならPascal世代のGPUを使うよりも高い画質を得られるということだ。」

おぉー!
これは期待しちゃうなぁ
0139名無しさん@編集中 (ワッチョイ 7feb-TNGn)
垢版 |
2018/09/15(土) 00:27:43.52ID:fy+82PFP0
AMDって今何してるの?

動画ならAMDなんて時代もあったのに…
0140名無しさん@編集中 (ワッチョイWW d7e9-kO1E)
垢版 |
2018/09/15(土) 00:33:21.67ID:6Guydu2D0
画像の中の表によると
1080・60pの動画をビットレート6Mbps設定でエンコードした場合に
x264のプリセットFastと、Turing世代のGPUでH.264(かと思われ)を比較すると、
PSNRの値が少しTuring世代のGPUのほうが上回っている

となると、x264のプリセットslowと比べるとしてもビットレートを2割増程度で充分対抗できるかも?

なんかすごいことになってきたな
0143名無しさん@編集中 (ワッチョイW 1716-BPXD)
垢版 |
2018/09/15(土) 00:46:40.52ID:rREhMZBO0
文脈読むならNVIDIAやインテルにGPUエンコでぼろ負けだけどGPUでエンコやる気ないの?だろ

どう見てもなさそうだねw
費用対効果で割りに合わないと思ってそう
0152名無しさん@編集中 (ワッチョイ b7e9-TNGn)
垢版 |
2018/09/15(土) 15:03:11.50ID:ycK06X7a0
>>151
・RTX 2080 Ti / 2080 / 2070が登場、スペックや性能、価格と発売日をまとめ
https://chimolog.co/bto-gpu-geforce-20-series/#GeForce_RTX_2080

・GTX 1080 Ti VS RTX 2080 Ti
理論上約20%の性能向上
・GTX 1080 Ti VS RTX 2080
理論上約13.4%の性能向上(GTX 1080 Tiに近い性能)
・GTX 1070 Ti VS RTX 2070
理論上約9%の低い性能低下(価格は1070Tiよりも100ドル程度上昇したにもかかわらず)
・GTX 1070 VS RTX 2070
理論上約16%の性能向上

コスパで考えると、1070Tiと2070の比較は分が悪い
1070との比較で性能向上したから良しとするならば性能については問題はないが、
今回の2080Ti、2080、2070はすべてチップが別々になっているところから言って、
細かいところで2070は省略されているものがあるのではないかと噂があるのは確か
0155名無しさん@編集中 (ワッチョイ 57ec-okpm)
垢版 |
2018/09/15(土) 18:05:15.54ID:J9FwwRkQ0
>>147
> 動画再生なら今もAMDだがな

動画再生におけるAMD GPU
  →メリット
     ・Fluid Motionがある。
  →デメリット
     ・VP9のDXVAに対応しているのが今のところRavenRidgeのみ。

他に何かあるっけ?
0161名無しさん@編集中 (ワッチョイ 6581-coYL)
垢版 |
2018/09/20(木) 04:45:35.71ID:wD9/jjC60
コピペ


836 名前:Socket774[sage] 投稿日:2018/09/17(月) 08:45:38.58 ID:qUO+QI5X0 (PC)
GTX1060とGTX1050はNVENCの速度一緒らいいんですけど、GTX1050とGTX950は変わりますか?どれくらい変わりますかね

884 名前:836[sage] 投稿日:2018/09/19(水) 10:43:23.58 ID:nm/uFXXB0 [1/4] (PC)
836ですけどあまりにも気になったので買って1時間の動画のNVENC速度を比較してみました


GTX950 2GB 7分43秒
http://i.imgur.com/BWC2skv.jpg
http://i.imgur.com/83Pnzm8.jpg
http://i.imgur.com/fEOzVgZ.jpg
http://i.imgur.com/eIrkJsy.jpg

GTX1060 6GB 4分33秒
http://i.imgur.com/MR7u0SY.jpg
http://i.imgur.com/n43YZgH.jpg
http://i.imgur.com/BZdGzVz.jpg
http://i.imgur.com/YVzC1sV.jpg


9世代のNVENCめちゃめちゃ遅いですね。ヤフオクで売ってきます
0163名無しさん@編集中 (ワッチョイ 01ec-coYL)
垢版 |
2018/09/20(木) 16:33:06.73ID:lKO/EpKZ0
>>161
【Pascal】NVIDIA GeForce GTX10XX総合 Part115
https://egg.5ch.net/test/read.cgi/jisaku/1535363555/836-884

・ソース 1440x1080、29.97fps
・コマンド ffmpeg.exe -i mpeg2.ts -c:v hevc_nvenc -b:v 3000k output.mp4
・結果
 GTX950  236fps
 GTX1060 399fps

どうせやるなら
 ffmpeg.exe -hwaccel cuvid -c:v mpeg2_cuvid -i mpeg2.ts -c:v hevc_nvenc -b:v 3000k output.mp4
にしてデコードもHWでやった方がよい気もするけど、MPEG2だとSWデコードと大して変わらないかな?
0165名無しさん@編集中 (ワッチョイ 01ec-coYL)
垢版 |
2018/09/20(木) 19:02:45.31ID:lKO/EpKZ0
>>164
CODEC SDKのドキュメントによると、NVENCも
 ・Two-pass rate control modes for high quality presets
 ・Look-ahead
 ・All adaptive quantization modes
 ・Weighted prediction
 ・Encoding of RGB contents
ではCUDAを使うけど、影響は最小限で気にするほどのことではないみたいだし、CUDAコア数は関係ないかな。
ffmpegのデフォルト設定で上記機能がどう有効/無効になるのか知らんけど。

ちなみに各世代のNVDEC/NVENCのパフォーマンスについてはSDKのドキュメントに表が載ってる。

 NVIDIA各世代GPU(Kepler〜Pascal)のNVDEC/NVENCのパフォーマンス(解像度1920x1080)
  ・NVDEC→ http://2sen.dip.jp/cgi-bin/upgun/up2/source/up3508.jpg
  ・NVENC→ http://2sen.dip.jp/cgi-bin/upgun/up2/source/up3509.jpg
  ※Video_Codec_SDK_8.2.15より。

>>161(>>163)で仮にSWデコードがボトルネックになってるとすると、
HWデコードにすればPascalはもう少し伸びる可能性はあるかも。
0169名無しさん@編集中 (ワッチョイWW 69c3-uD9k)
垢版 |
2018/09/20(木) 22:44:29.64ID:2H1c86eW0
今回もマクロブロック捜査部分が強化入っている
当該処理が重くなる、より高解像度での処理や、ブロックパターンの複雑なHEVCでより効果が大きいそうな

解像度による速度低下の緩和
複雑なマクロブロック配置の最適化でH264で1割強、HEVCで2割強の画質容量比の改善とからしい
0174名無しさん@編集中 (ワッチョイ f1e9-Y82R)
垢版 |
2018/09/21(金) 01:41:09.43ID:5ndzxww90
資料としてマクロブロックと明言しているものは確かに見当たらないね
ただ、H.264で15%、HEVCで25%もの改善を得るとの文面から考えると、H.264から強化された動き保障精度向上のための
マクロブロック(HEVCではCUとか言うのだったか?)の探索範囲の強化がキモであるわけだから、実質的にマクロブロック
関連の処理の改善がされているだろうことは容易に想像できる
もちろん、Bフレーム関連とかも手は入っているとは思われるが
0178名無しさん@編集中 (ワッチョイ 2dec-coYL)
垢版 |
2018/09/21(金) 15:26:42.06ID:lKRfOAqF0
>>177
>>75>>78のQSV H.264の例で
  A: --brframes 0
  B:--brframes 3 --b-pyramid
を比較すると

  A:3000kbps→B:2100kbps = 30%のビットレート削減 (SSIM=0.988ライン)

  A:36000kbps→B:30000kbps = 17%のビットレート削減 (SSIM=0.92ライン)

になってるけどな。

NVENCのH.264で同様の調査をしてくれる人がいるといいんだが。
0179名無しさん@編集中 (アウアウイー Sa31-jdBG)
垢版 |
2018/09/21(金) 15:46:40.15ID:7HD3xzwNa
>>177
そりゃ0と3を比較したらそうなるよ
NVENCはBフレ自体は既に対応しているのだから、改善したと発表するならば同じBフレ設定条件下でどれだけ変化するのかを比較しないと意味がない
0180名無しさん@編集中 (ワッチョイ 2dec-coYL)
垢版 |
2018/09/21(金) 16:00:58.80ID:lKRfOAqF0
>>179
いや、25%の改善と言ってるのはHEVCでしょ。

NVENCのHEVCは現状Bフレーム未対応なんだから、対応すればビットレート25%削減もできそうだねってことを
QSVのH.264の例を出して書いただけ。

まあHEVCでBフレーム対応するとは限らないし、H.264も改善されてるんだから
Bフレーム以外の改善もあるだろうし、まだなんとも言えんけどね。
0181名無しさん@編集中 (アウアウイー Sa31-jdBG)
垢版 |
2018/09/21(金) 16:31:03.94ID:7HD3xzwNa
>>180
勘違いしていた
NVENCのHEVCは、Bフレに対応していなかったな
対応しているのはQSVのほうだな
とは言え、すでにBフレ対応済のH.264でも15%の改善をし、さらにHEVCでは25%の改善となると、
共通して改善できる部分はマクロブロック関連が1番大きいだろうことは疑いようがない
エンコーダの動作の7割方はマクロブロックがらみなのだから
0183名無しさん@編集中 (アウアウイー Sa31-jdBG)
垢版 |
2018/09/21(金) 16:50:38.73ID:7HD3xzwNa
現物を買った人がマクロブロックの探索モードに、パスカル以前にはなかった新しいモードが搭載されたか確認してくれるのが1番手っ取り早い方法かと
あと、もちろんBフレの対応可否
Bフレについては公式発表が何もなかった時点で期待しにくいけれど…
0185名無しさん@編集中 (ワッチョイWW 69c3-uD9k)
垢版 |
2018/09/23(日) 02:42:30.46ID:j3oG3i0p0
HEVCのブロック捜査処理を最適化すすめて高速化したら、副次的に細部確認すれば解る程度の画質も改善してたという程度だけだったPascalの時もMaxwellから強化されていても捜査モードの追加なんて無かったし

そもそもエンジン側の処理でQSVみたいにGPGPU処理にしていないからモード切り換え意義が無いんだが
モードの有無で確認出来ると思っている理由が知りたい
0186名無しさん@編集中 (ワッチョイ 61ec-coYL)
垢版 |
2018/09/23(日) 03:29:43.62ID:bRzvZQZ60
>>185
その前に>>169

 > 今回もマクロブロック捜査部分が強化入っている
 > 当該処理が重くなる、より高解像度での処理や、ブロックパターンの複雑なHEVCでより効果が大きいそうな
 > 解像度による速度低下の緩和
 > 複雑なマクロブロック配置の最適化で

という話がどこで聞いたものなのか教えてもらえると嬉しいのだが・・・。

探索モード云々は>>183のちょっと先走った想像にすぎないから、情報の無い段階で考えてもしょうがないと思うけど、
こっそりTuringのNVENCコアに追加された(あるいは従来も実装されてたけど使ってなかった)とかで
今後のSDKの更新で新たに利用可能になるという可能性も・・・、うん、まあ無さそうだけど。
0187名無しさん@編集中 (ワッチョイ 5dc3-coYL)
垢版 |
2018/09/23(日) 03:51:56.86ID:HyLnLbY70
>>185
HWなんだから複数のモード実装して無駄に回路規模増やすとはあまり考えられないし、
新しいモードが追加されることをなんらかのルートを通じて知っていたとかかな

https://devtalk.nvidia.com/default/topic/1038493/video-codec-sdk/details-about-nvenc-in-turing-/post/5285387/#5285387

試した人によると、GTX1080とあまり変わらなかったらしい
25%の性能向上は、今後のドライバの更新、あるいは、新しいSDKでソフトウェア側の対応必須って感じかな

>>186
Turingに対応した新しいSDKがまだ出てないから、分からないよ
新しいモードが追加されるにしてもSDK出ないと使えるようにならないし
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況