X



【NVENC/VCE】ハードウェアエンコーダーを語るスレ【QSV】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@編集中 (ワッチョイ 4381-Xflc)
垢版 |
2018/08/08(水) 04:44:09.82ID:NnYmcXUx0
ソフトウェアエンコーダーに画質は劣るものの、エンコード完了までの処理速度が爆速なハードウェアエンコーダーを語りましょう

●Intel
https://software.intel.com/en-us/media-sdk
https://en.wikipedia.org/wiki/Intel_Quick_Sync_Video

●NVIDIA
https://developer.nvidia.com/nvidia-video-codec-sdk
・エンコード: https://en.wikipedia.org/wiki/Nvidia_NVENC
・デコード: https://en.wikipedia.org/wiki/Nvidia_PureVideo

●AMD
https://github.com/GPUOpen-LibrariesAndSDKs/AMF
・エンコード: https://en.wikipedia.org/wiki/Video_Coding_Engine
・デコード: https://en.wikipedia.org/wiki/Unified_Video_Decoder
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0523名無しさん@編集中 (ワッチョイ 9ab4-C0zt)
垢版 |
2018/12/04(火) 10:32:36.97ID:5/OfOFjj0
今の環境がi5 4460とGTX1060
Aviutlのnvencの設定デフォルトで1080pのFPSゲーム動画をエンコードすると50fpsくらいの速度
環境をi7 9700kとGTX1080にするとどれくらい早くなる?
0527名無しさん@編集中 (ワッチョイ 17a5-r3MB)
垢版 |
2018/12/04(火) 12:01:36.09ID:LekanMaU0
ちなみに>>524はAviutlでフィルタなし、入力プラグインはL-SMASH、ソースはShadowplayの1080Pゲーム録画データね。
最近GTX970から交換したから5割増しくらいの速度になった
0529名無しさん@編集中 (ワッチョイ 9ab4-C0zt)
垢版 |
2018/12/04(火) 12:40:40.49ID:5/OfOFjj0
>>527
1920x1080のBSのエンコードだとfps150くらいでるけどなあ
720pに変換してるから当然かもしれないけど
俺もshadowplayで録画してて設定は1080pでビットレートは130Mbpsにしてる(実際は50Mbpsくらいになる)
Aviutlも入力はL-SMASHで全く一緒
編集は拡張編集で20分くらいの動画を10か所くらい切り取ってフェードインアウトつけて15分の動画にするだけでほかのフィルタは一切なし
同じ編集データをPentium G4400でQSVでエンコードすると35〜38fpsくらいの速度
入力プラグインの優先度はL-SMASHを一番上にしても途中にしても一緒だからとりあえず一番上にしてる
システムの設定はこれ
https://i.imgur.com/WjhNvnb.png
0531名無しさん@編集中 (ワッチョイ e3ec-C0zt)
垢版 |
2018/12/04(火) 13:10:43.48ID:drsA15ra0
>>529
とりあえずAviUtlの出力プラグインへの引き渡し可能速度を計測してみればいいんでないかい。

 Ch's barn: Benchmark plugin
 http://csbarn.blogspot.com/2012/05/benchmark-plugin.html

拡張編集もフィルタの1つなんだから、拡張編集タイムラインに置くだけでも本体読みより遅くなる。
i7-4702MQで1080p24の14315フレームを読み込んで上記のベンチマークプラグインで計測すると
  本体読み:180fps  拡張編集読み:148fps 拡張編集で適当に6分割+フェード付加:99fps
って感じ。
更にそこから出力プラグインでの処理とGPUとのやり取りが行われるから、エンコ速度はこれより更に遅くなるし、
ShadowplayソースならL-SMASH WorksでVFR->CFRしてるだろうから、その影響も多少あるかもしれんし。
0533名無しさん@編集中 (ワッチョイ 9ab4-C0zt)
垢版 |
2018/12/05(水) 05:10:43.72ID:nzee0edK0
>>531
CPUがボトルネックになってたっぽいわ
エンコード中CPU使用率が80%でGPUが20%くらいだし
CPUとGPU変えたら早くなりそう
ありがとう
0534名無しさん@編集中 (ワッチョイ e3ec-C0zt)
垢版 |
2018/12/05(水) 11:30:04.85ID:UPL/wLc10
>>533
・AviUtlのLargeAddressAwareは有効にしておいたほうがいいと思う。

・NVEnc.auoの詳細設定タブの「パフォーマンスログ出力」(--perf-monitor all)が便利。

・rigaya氏のブログのNVEnc4.25の記事のコメント欄を読んでおくといいと思う。
  抜粋
   ・i9-7980XE+GTX1060、1920x1080(H.264 本体読み込み)
    encoded 2293 frames, 269.80 fps, 8510.76 kbps, 97.03 MB
    encode time 0:00:08, CPU: 0.8, GPU: 8.2, VE: 55.1, GPUClock: 1862MHz, VEClock: 1664MHz
   ・rigaya氏コメ
     「VE使用率 55%で、270fpsぐらい出ています。
      なお、Aviutl経由では、VEの使用率は50%前後行けばよいほうだと思います。」

・CPUを変えればAviUtl側のボトルネックを軽減することはできるだろうけど、
 どのみちAviUtl経由ではNVEncの能力をフルに生かすのは難しいので
 GPUをGTX1060→GTX1080にするのはあまり意味がない気がする。
 今から変えるなら圧縮効率等が良いTuringにした方が良い気が。
0537名無しさん@編集中 (ワッチョイ e3ec-C0zt)
垢版 |
2018/12/05(水) 15:51:44.52ID:UPL/wLc10
SDK 9.0がもうすぐ出るよってことで、図とかも更新されてた。アーリーアクセスの申し込みもあり。

NVIDIA VIDEO CODEC SDK | NVIDIA Developer
https://developer.nvidia.com/nvidia-video-codec-sdk

What's new with Turing GPUs (Video Codec SDK 9.0 coming soon)

Up to 3x Decode throughput with multiple decoders on professional cards (Quadro & Tesla)
Higher Quality Encoding - H.264 & H.265
Higher encoding efficiency (15% lower bitrate than Pascal)
HEVC B-frames support
HEVC 4:4:4 decoding support
0543名無しさん@編集中 (アウアウクー MM7b-3Mxu)
垢版 |
2018/12/05(水) 19:30:49.33ID:tDkXU26zM
Bフレーム対応したとはいえ、エンコードのフレームレート向上もビットレートの低減率も期待したほどでは?
Pascal持ちだと次の世代待ちでいいのかなぁ
0544名無しさん@編集中 (ワッチョイ dad4-C0zt)
垢版 |
2018/12/05(水) 20:01:17.27ID:fiDcotbi0
HEVCはBフレームサポートもあるから合計25%削減だよ

>>543
どんな期待を抱いていたのか知らんけど、Pascalの画質で満足ならそれでいいんじゃない?
サイズ25%増やせば同じ画質になるんだから
俺もゲーム用にRTX買ったけど、エンコードPCはPascalのままだわ
0545名無しさん@編集中 (ワッチョイ dad4-C0zt)
垢版 |
2018/12/05(水) 20:12:49.86ID:fiDcotbi0
25%削減でx265との差はかなり縮んだから、次の世代に期待って言っても、ここからさらに25%削減とかは不可能

既にx265との差は実写で20%、アニメで数%にまで縮んでるから、25%も減ったら余裕でx265を超える
0548名無しさん@編集中 (ワッチョイ 41eb-Po2/)
垢版 |
2018/12/06(木) 08:04:17.63ID:aWA5jheT0
60iソースはどうすりゃいいんだろ?
60pにすると容量増えまくるし、30pはガクガクで論外だし
色々やってみて60iは60iでエンコするしかないって結果だったんだけど
0553名無しさん@編集中 (ワッチョイ 9311-n9Ol)
垢版 |
2018/12/06(木) 13:47:34.46ID:JO0btjx90
前世代から画質(ビットレート効率)が25%上がったことに一喜一憂するすれで
Bob化によるファイルサイズ20%増しが受け入れられるとは思わない
0557名無しさん@編集中 (ワッチョイ 13d4-n9Ol)
垢版 |
2018/12/06(木) 22:19:32.85ID:4547mJc30
>>550
インタレエンコードができなくなってるんだが?
>>551
どうせ60pと30pしか試してないんだろう
VFRで問題のあるソースに出会ったことがないな
>>556
画質を求めるならインタレ解除は必須

リアルタイム処理には限界があるし
インタレ保持は未来の技術でインタレ解除できるってのが売りだけど、
今の時代どこもインタレ解除の性能を上げようなんてしてない
むしろ、HEVCがインタレ非サポートになったり、Turingでインタレエンコードがオミットされたりと、
インタレ周りの機能は削減されていくだろうね

もうインタレに未来はない
0558名無しさん@編集中 (アウアウカー Sa9d-Od6P)
垢版 |
2018/12/07(金) 09:56:26.34ID:9CvYzuKVa
そもそも制約があるから
仕方なくやってる処理だからな
4Kでようやく解放されたが
2Kの段階でMPEG2と一緒に
解放しといて欲しかった
まああの時期じゃしょうがないが
0568名無しさん@編集中 (ワッチョイ 81ec-n9Ol)
垢版 |
2018/12/09(日) 18:37:03.48ID:mhf9FFUb0
NVIDIAが既に実装済みだったインタレエンコ機能をわざわざ外すというのは正直考えにくいし、
Turingの NVEncC.exe --check-features で Field encoding が no で返ってくるのは
ドライバか何かのバグじゃないかなーという気がしてるのだけど、どうなんだろうねえ・・・。
0569名無しさん@編集中 (ワッチョイ 81ec-n9Ol)
垢版 |
2018/12/09(日) 21:20:46.11ID:mhf9FFUb0
そういえば>>522を見て少し気になったんだけど、NVEncのH.264で
 ・3840x2160p60 (--ref 5以下にする必要あり) (本来なら最低でもLevel 5.2)
 ・4096x4096p30 (多分 --ref 2以下にする必要あり) (本来なら最低でもLevel 6)
をエンコードした場合、ストリームに付与されるレベル(MediaInfoで見れるもの)ってどうなるんだろ?(うちはNV環境無し)
NVEncC.exe --check-features で Max Level が 51 になってるってことは、本来のレベルを無視して 5.1 になるのかな?

ちなみにHaswellのQSVの場合はLevel 5.2までとなるらしく、4096x4096p30もLevel 6ではなくLevel 5.2にされる。
refもLevel 5.2の基準で計算されて2に下げられる。
0575名無しさん@編集中 (ワッチョイWW d1c3-RvGO)
垢版 |
2018/12/10(月) 14:54:06.52ID:KZMVxCj20
>>571
殆ど無いと思って良いと思う
実質GPU側のメモリ帯域はボトルネックになっていない
そうでなければ、1050/1050tiのGDDR5 128bit帯域で速度低下起こしてるはずだが、そうはなっていない
0582名無しさん@編集中 (ワッチョイW f9c3-Z0Wu)
垢版 |
2018/12/11(火) 12:30:21.40ID:qL0J9Y7a0
いやGPUはフル全開アチアチでエンコードしてると思ったの
でもこんな少ない負荷で早いNVENCなら、長時間使用しても気にならない感じ
正直嬉しい発見
0584名無しさん@編集中 (ワッチョイ db5f-xqdQ)
垢版 |
2018/12/11(火) 12:47:50.87ID:dBeTBZys0
その勘違いってでた当初からずっとあるよね
NVENCがCUDAとかGPUのフル機能を使ってエンコしてるって。
ゲームが重くなるから使わないみたいな。

でも、実際のNVENCはグラフィックとかCUDA COREとかはほとんど使わずに
別にあるエンコード専用回路を使うだけだから
負荷も電力もほとんどかからない
0585名無しさん@編集中 (ワッチョイWW d1c3-RvGO)
垢版 |
2018/12/11(火) 13:38:36.31ID:wch3mPpU0
QSVやVCE/VCNと違って、基本的にエンコード処理でエンジンからのGPGPU処理しとらんからな
そりゃ電力消費は低いし、その分発熱も低い

NVEncはマルチメディアエンジンのみで勝負していて、Pascal世代でGPGPUも使っているQSVの足下まで来ただけでも十分変態じみてるのに
Turing世代のRTXでQSV越えどころか、x264の足下まで来たという度を超した変態ぶりを発揮して
これでGPGPU処理という最も強力な武器はまだ温存されてる始末

Maxwellで28nmのまま電力効率馬鹿みたいに改善してみたり
回路設計の悪魔と契約でもしてんじゃねぇかと思うレベル
0592名無しさん@編集中 (ワッチョイWW fbe9-95M7)
垢版 |
2018/12/13(木) 01:14:25.71ID:wyptRkAP0
Gen10世代はギブアップか
で、Gen11から小鳥効果出まくりと
エンコーダーの画質は実物出ないと何とも言えないねぇ
そんなに自身があるのならば、エンコーダーだけ生かして他の回路殺したチップをUSB接続できるアダプターみたいにして
Intel製エンコーダーとして大々的に売り出してみたらどうなんだと言いたくなる
0594名無しさん@編集中 (ワッチョイWW 83c3-NB0G)
垢版 |
2018/12/13(木) 01:48:11.45ID:cC+gfyVi0
単価の安い20nmあたりでNVEncボードとか
エンコードならDDR4でも間に合うし、20nmならTuringの12nmの7割ぐらいのクロックで回せるだろうし

とか思うけど、nvidiaは切り売り製品絶対出さねぇからなぁ
0596名無しさん@編集中 (ワッチョイWW 83c3-NB0G)
垢版 |
2018/12/13(木) 02:09:56.26ID:cC+gfyVi0
>>595
アレイは毎度4EUだから16アレイで64EUか
Skullみたいに18アレイで今回歩留まりで1アレイdisableなのかと勝手に思ってた

IGP性能としてはVega8とかGTX750無印ぐらいかねぇ
規模に対して描画性能が伸びてるのはクロックが高いのかTuringみたいに並列実行効率上げてきてるのか
0605名無しさん@編集中 (ワッチョイ d3b3-Z14q)
垢版 |
2018/12/13(木) 16:59:39.27ID:xWKhj+pW0
IntelオンボはCeleronですら使えるのが良いね
NVだとローエンドは機能制限して出し惜しみするからなあ
まあIntelもAVX2使えなかったりするのはあるが
0606名無しさん@編集中 (ワッチョイW 0f9f-f4pf)
垢版 |
2018/12/13(木) 18:05:56.87ID:XTySrbz90
本来ハイスペックのゲームをバリバリ動かす所を配信してハードウェアの宣伝してくれって機能だからな
ローエンドが足切りされるのも仕方ない、単体で動画エンコに使えてるだけありがたいと
0607名無しさん@編集中 (ワッチョイ 1e06-bkCm)
垢版 |
2018/12/13(木) 19:28:01.03ID:j3btBXW00
選別落ちのGPUとしては難ありだけど、それ以外は動くようなものもどこかに埋まってるんだろうな…
はよ、2060の追加情報をオクレ!
SnapdragonにNVIDIAを凌駕する!とかでもいいけどなw
それもx64が動くようになってからか。
0611名無しさん@編集中 (ワッチョイWW 3a6e-yjJW)
垢版 |
2018/12/13(木) 22:18:44.50ID:SVvlQOiu0
そう言えばARMのmari GPUチップは、4K H.265デコード対応!とか売り文句にして、格安な8000円くらいのAndroid STBとか売ってるけど
PC用のGPUとは違った方向付けなのかな?
スマホやタブレットに載せるから、省電力なのは間違いないけど
0613名無しさん@編集中 (ワッチョイ 2306-bkCm)
垢版 |
2018/12/14(金) 15:46:58.99ID:oaX1gJkd0
>>610
お、お高い感じが…(´・ω・`)
1070買ってまだ1年たってないんで買い替えるにはちょっとためらうなぁ
2060を4万、2050を3万っていう相場に落ち着くまでソフトエンコで我慢する
0616名無しさん@編集中 (中止 cba9-5YD5)
垢版 |
2018/12/24(月) 00:13:47.70ID:e2icRIJM0EVE
HandBrakeでNVENC H264エンコードしてみたけど30%位しかGPU使ってくれない
同時にCPUが80%位使われてる
A's Video ConverterではGPUが60%でCPUが6%位
やってる事はそんなに違わないと思ってるんだけど
何のためのNVENCなのかw
0617名無しさん@編集中 (中止 8dc3-q1e7)
垢版 |
2018/12/24(月) 01:21:53.03ID:j9qt5w7V0EVE
HandBrake遅すぎw最適化はこれからかな
A's Video Converterでも60%しか使ってくれないのか
AmatsukazeフィルタなしだとGPU95%くらい行く
ffmpegかNVEncCじゃないと本来の速度は出ないってことか
0620名無しさん@編集中 (中止 d50e-5YD5)
垢版 |
2018/12/24(月) 04:00:13.80ID:6uXX0K170EVE
>>614
RX580でVCE使ってみた、TS15分にQP21のバランス設定→4G越えのファイルw
平均74fps、CPU24%前後、GPU85%
インタレ解除が効いていないとか、全然使えない

CPUでエンコしたほうが速い、縮むとかどんな用途に向いてんだか?
0622名無しさん@編集中 (中止 9b9f-5YD5)
垢版 |
2018/12/24(月) 10:16:56.98ID:KBiZ9zIZ0EVE
NVENCの回路をフル利用しているかどうかはどうやってわかるんだ?
GPUもCPUも様々な用途の回路があって使用率が100%でも休んでいる回路があるんでしょ
だからマルチスレッドなんて考えが出てきた・・・とどこかで見た気がする
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況