X



【NVENC/VCE】ハードウェアエンコーダーを語るスレ2【QSV】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@編集中 (ワッチョイ 9f16-3oSp)
垢版 |
2019/03/01(金) 22:17:08.81ID:tc2s55ej0
高速なエンコード処理ができるハードウェアエンコーダーについて語るスレです。

●Intel
https://software.intel.com/en-us/media-sdk
https://01.org/linuxmedia
https://github.com/Intel-Media-SDK/MediaSDK
https://github.com/intel/media-driver
https://en.wikipedia.org/wiki/Intel_Quick_Sync_Video

●NVIDIA
https://developer.nvidia.com/nvidia-video-codec-sdk
https://developer.nvidia.com/video-encode-decode-gpu-support-matrix
・エンコード: https://en.wikipedia.org/wiki/Nvidia_NVENC
・デコード: https://en.wikipedia.org/wiki/Nvidia_PureVideo

●AMD
https://github.com/GPUOpen-LibrariesAndSDKs/AMF
・エンコード: https://en.wikipedia.org/wiki/Video_Coding_Engine
・デコード: https://en.wikipedia.org/wiki/Unified_Video_Decoder

■前スレ
【NVENC/VCE】ハードウェアエンコーダーを語るスレ【QSV】
https://mevius.5ch.net/test/read.cgi/avi/1533671049/

次スレは>>980が立ててください。
0209名無しさん@編集中 (JPWW 0Hff-CeDQ)
垢版 |
2019/03/14(木) 09:23:34.39ID:77Z+/Lt2H
NVEncが2基載ってると実際のエンコードスピードはどうなる?
単純に2倍にはならないよね。1.6倍くらいは期待できる?
0211名無しさん@編集中 (ワッチョイWW 035f-fHW7)
垢版 |
2019/03/14(木) 09:48:09.92ID:yvM0zr+M0
>>209
並列処理しても速度が落ちない
2基のエンジンが連携して速度が上がる訳じゃ無いので注意
GP106以下だと1基なんで、2並列処理をやると半分近くまで処理速度が落ちるけど
GP104以上は2基有るんで、2並列処理でも1基ずつ割り当てられるので処理速度が変わらない
通常はNVEncのエンジン基数に関わらず同時処理は2つまででQuadro P2000以上は同時処理数は無制限
0212名無しさん@編集中 (オーパイ ff8e-VnsJ)
垢版 |
2019/03/14(木) 14:36:40.04ID:jPmsAtRW0Pi
PCのバスやメモリ速度は変わらないし、フィルタ処理やCPU処理速度やSSDもあるから
GPUエンコード画面をシャドウプレイで録画できる程度だと思っておいた方がいい
0221名無しさん@編集中 (ワッチョイ cfaa-293F)
垢版 |
2019/03/15(金) 11:57:14.05ID:guuJUCme0
Pascal世代のチップは未だに余りまくっていて、暫くは平行して売るんだろうか
10xxと16xxの競合カード、価格もベンチスコアも刻み過ぎでお団子感が物凄いな
0224名無しさん@編集中 (ワッチョイWW 035f-fHW7)
垢版 |
2019/03/15(金) 12:46:47.62ID:XpJCAwRB0
1660無印がtiと同じTDP120Wだから、PowerLimit上限まで上げたうえでのOCすれば消費電力は上がりそうだけどね
ただメモリの帯域は最初から不足気味だから描画性能は頭打ちになりそうではあるけど

吊しで1408コアの1660無印で95〜100Wあたりなら、少しクロック落ちればワッパ的にスィートスポット寄りになるし1024コアで75Wあたりは望めそうではある(PowerLimitもあるし
FP16コアは削られるかもだが
0228名無しさん@編集中 (ワッチョイ ff8e-VnsJ)
垢版 |
2019/03/15(金) 18:58:56.90ID:TeBHf0Hk0
CUDAもメモリやバス周りががっつり減るもんなぁ
その分まともなFANが付けばクロックは上げやすいだろうけど
1060みたいに1660のメモリ半分の選別落ち版を補助電源なしで出してほしい
そうすれば1650はもうワンランクやすくなるに違いない!
0232名無しさん@編集中 (ワッチョイWW 7f3a-wGrT)
垢版 |
2019/03/16(土) 02:46:18.30ID:KfpCPc9l0
あまりに値段や消費電力高いとこのままでいいじゃんって思う1050Ti使い
まぁ暗いシーンが崩れがちなのは気になるけどこの傾向は改善されてるのかね
bフレでビットレート稼げる分の改善はもちろんあるんだろうけど
0233名無しさん@編集中 (ワッチョイWW f368-9GRz)
垢版 |
2019/03/16(土) 02:51:20.89ID:v3nna7ud0
Bフレーム使えるのは確かにメリットなんだけど、エンコードする前のどこかでインターレース解除しなきゃならないことのほうが処理速度含めてネックになってくるからなぁ
CUDAに最適化した高速高品質でいろんなファイルの入力に対応できる汎用性の高いインターレース解除ツールとかあればいいんだけど
0234名無しさん@編集中 (ワッチョイ cf44-B/CD)
垢版 |
2019/03/16(土) 02:51:55.66ID:MRLnd49q0
CPUにGPUが内蔵されて、
ビデオカードの存在価値アピールすると格段の処理能力を向上させるしかなくて、
結果、消費電流増大してしまうんだな。
アクションゲームなら使う人間がへばってしまうので、自然と歯止めがかかるんだkど、
AIだのマイニング用処理でフルに能力使うと、電気代だけで人生詰んでしまう
0238名無しさん@編集中 (ワッチョイ 83b0-B/CD)
垢版 |
2019/03/16(土) 08:48:33.21ID:d3NV0gVB0
>>232
Bフレームでビットレート稼げるようになっても暗部にビットレート割り振るようにアルゴリズムが変わらないと
品質指定では明るい部分に優先的にビットレート割り振るだけだから暗部の処理は変わらないような
0240名無しさん@編集中 (ワッチョイ cfaa-293F)
垢版 |
2019/03/16(土) 09:21:35.78ID:92RwGBNX0
>>237
そいうこと
厳密に言えばNVEncCに投げればインタレ解除もHW支援が効くけどね
ただそもそも論として、H264同士の比較では10xx系もRTXもQSV未満の残念画質なので、インタレ保持したい場合はQSV一択かな
0242名無しさん@編集中 (ワッチョイ cf44-B/CD)
垢版 |
2019/03/16(土) 10:38:54.63ID:MRLnd49q0
NVEncでインタレ保持エンコはできないってことなのかな?
ソースがインタレであってもプログレ保存であればNVEncでHWエンコ可能ってことでいいの?
0244名無しさん@編集中 (ワッチョイWW 7f3a-wGrT)
垢版 |
2019/03/16(土) 13:29:36.27ID:KfpCPc9l0
>>238
そのアルゴリズム自体pascal世代より暗部に割り振るように変わってないかなと
今は明部と暗部のバランスが悪いというか
bフレは同じビットレートになるようにしたら改善するだろうって意味です
0251名無しさん@編集中 (ワッチョイ 23e7-kdx8)
垢版 |
2019/03/16(土) 17:11:32.58ID:xyY/TqPu0
>>248
OBSでの配信はH.264で行うのでH.265は関係ない。
1650の情報なんてNVEncのことに限らずまだ何も発表されてないんだから確定情報なんて誰も書きようがない。
記事の目的も考えずに「僕ちゃんの知りたい情報がないから糞」とか言って編集者の容姿まで貶すのは控えめに言ってクズの所業。
0253名無しさん@編集中 (ワッチョイ e344-B/CD)
垢版 |
2019/03/16(土) 17:30:08.89ID:7PDaDtb70
>>251
もひとついっといてやろう
>編集者の容姿まで貶すのは控えめに言ってクズの所業。

自分の記事に、ツイアカリンク張ってるんだからさらしてくださいってこった。
常識ないのか?wwww
0255名無しさん@編集中 (ワッチョイ ff2c-03sp)
垢版 |
2019/03/16(土) 18:00:24.37ID:s7BgfShs0
どっちかつーと次のページのこれのほうが・・・
Bフレームはデータ量が増える、すなわち実質ビットレートを下げてしまう

>>252
その理屈だと世の大多数からすりゃNVENC(どころかPC一般)の記事自体が糞記事になるんじゃない
0256名無しさん@編集中 (スププ Sd1f-RJnd)
垢版 |
2019/03/16(土) 18:13:50.67ID:B3JfQZ+Cd
>>253
リンクあるんだからリンク貼るのは別にいいけどさ
人の容姿の事言ってるのが屑って言われてるのにそんな理解力が低い頭でエンコードとかわかるのか疑問だわ
0258名無しさん@編集中 (ワッチョイWW 035f-fHW7)
垢版 |
2019/03/17(日) 04:30:09.54ID:6FcsBDSw0
volta自体がスパコン向けに出した中間世代みたいなもんだし
下位モデルに限って設計引き継ぐのも逆に不自然な気がするけどもな
結局メモコンから作り直しでアンコア別物になるのだし、クラスタ構成も規模小さすぎて組み直しだし
0261名無しさん@編集中 (ワッチョイ 9302-B/CD)
垢版 |
2019/03/17(日) 18:17:10.73ID:NG7nrTnG0
1060から1660でBフレーム対応エンコードしたら、同じ設定でどれくらい速度早くなるんだろ。
Amatsukazeのスレで2割ほど短くなるかも、ってレスはあったけど。
0264名無しさん@編集中 (ワッチョイ 9302-B/CD)
垢版 |
2019/03/17(日) 20:03:37.08ID:NG7nrTnG0
すまん、よくわかってないんだが、Bフレーム対応以外は同じ設定という意味だけど、
そういうのはできないのかな。ちょっとぐぐってくるわ。
0267名無しさん@編集中 (ワッチョイ cf8e-VnsJ)
垢版 |
2019/03/17(日) 22:58:09.63ID:RDpTx2SN0
>>261
2割早くなるって言われてるんだからそれでいいじゃん
Amatsukazeのレスにもあるように、おま環次第ってあるだろうに、なんで向こうで聞けないんだろうな
コーデックやオプションやCPU次第で1割にも3割になっても不思議はないけどな
0268名無しさん@編集中 (ワッチョイ 7309-h1+v)
垢版 |
2019/03/18(月) 17:43:27.67ID:C9OWg8020
>>233
亀レスですまんがLAVでCUDAデコード出来て倍速フレームレート化出来るから
それをHWエンコする方法で俺はエンコしてる。AVIUTLで完結するのが楽だしね。

HEVCでインタレ的な保存って相当イレギュラーだと思うんだが、そうでもないの?
0269名無しさん@編集中 (ワッチョイ 23e7-kdx8)
垢版 |
2019/03/18(月) 21:37:00.88ID:fAQSTeL90
>>268
> LAVでCUDAデコード〜AVIUTLで完結

よくわからんけど、AviUtlにDirectShow File Readerで読み込んでるってこと?
そんなことするくらいなら、D3DVPとか、NVEncCの--vpp-deinterlaceを使った方がいいのでは。

> HEVCでインタレ的な保存って相当イレギュラーだと思う

流れを読めばHEVCでのインタレ保持の話はしていないのはわかると思う。
0270名無しさん@編集中 (アウアウクー MM07-9GRz)
垢版 |
2019/03/19(火) 20:13:10.87ID:brW1IuVsM
・NVIDIA、AI/RTXなどのライブラリをまとめた「CUDA-X」でCUDAを拡張 - PC Watch
https://pc.watch.impress.co.jp/docs/news/1175502.html

「CUDA-Xは、CUDAの上に位置するソフトウェアライブラリだ。
従来はcuDNNなど複数の製品から構成されていたAIのライブラリを1つにまとめた「CUDA-X AI」や、
リアルタイムレイトレーシング用のRTXなどから構成されており、ソフトウェア開発者はそれらを活用することで、容易にGPUを利用した開発を行なえる。」
これを活用した高速高精度なインターレース解除ソフトを誰か作ってくれ〜
0275名無しさん@編集中 (ワッチョイ 8344-B/CD)
垢版 |
2019/03/20(水) 07:53:42.01ID:UPS/MLTy0
MSIの1660買ったんだが装着でしくじった。
補助電源ケーブル引っ張り出してきて装着。
電源入れたらガガガガ・・・
電源off待ってたらファンが壊れそうだったんでACコード引き抜く
調べてみたら、ビデオカードのファンがその下にカードと干渉してる。
ちなみに今までクロシコの1050Tiが挿さってて何の問題もなかった。その前はZotac 750Ti
MSIのカードが厚いのか?それとも重みで垂れ下がって干渉したのか?
持ち上げて、ビス留めすれば大丈夫かもしれんが、念のため干渉したカードの位置変えた。
ビデオカードの上のスロットしかあいてなかったんで熱で早死にするかも。
念のためクリップファンつけといた。
0281名無しさん@編集中 (ワッチョイ 7309-h1+v)
垢版 |
2019/03/20(水) 11:59:45.86ID:VVUB0p2S0
>>275
2.5スロット使うGPU割と多い
干渉する場合は素直に下のカードを撤去するべき

熱が籠もってGPUが壊れる。ソースは俺
カードの価格を考えて配置をしたほうが良いと思う
0283名無しさん@編集中 (ワッチョイ a38e-VnsJ)
垢版 |
2019/03/20(水) 22:39:23.30ID:9DHHlChJ0
カバー外して換気扇用の網付けてケースファン2つとも排気方向につけるとか、ゲームPCでよくある下電源とか
ま、スリムや省スペースで窒息してそうなケースじゃ何をしても・・・
0286名無しさん@編集中 (ワッチョイ 0344-rXtv)
垢版 |
2019/03/21(木) 00:56:32.39ID:fEYG+ZAB0
>>281
MSIの1660の仕様が間違って広まってしまって商売の邪魔になっちゃまずいので一応きちんと説明しとく

挿すとき下にカードがあっても何の問題もなく挿せたんで、2.5スロットではないと思う。
2.5だと挿せないか、無理矢理挿しこむことになるので、そもそも干渉してることがわかるでしょ。
何も違和感なく挿せて、電源onでファン回転して初めて気づいたんで、
厚みにバラつきあるのか、
それとも、
1050Tiカードと比べるとずっしり重いので、
カードを持ち上げながらビス留めしないと垂れ下がったままになって干渉したと思われ。
ただ
2つ下のスロットに挿したボードとのクリアランスが極小ってのは間違いない。
遊び、ビス留め具合で干渉したりしなかったりがMSI 1660だと思う
0287名無しさん@編集中 (ワッチョイ 0344-rXtv)
垢版 |
2019/03/21(木) 01:00:28.91ID:fEYG+ZAB0
あとmsiのは補助電源コネクタ以外の全コネクタにカバーがついてる
基板のPCIE端子にまでカバーがついてるので忘れずにはずすこと。
挿そうとして
あれ、挿せねー?
で基板そのものにカバーついてるのそこで初めて気づいた
0289名無しさん@編集中 (ワッチョイ 4e02-0o94)
垢版 |
2019/03/21(木) 03:40:55.07ID:ImfJjNo40
ガチガチ情弱で申し訳ない
OBSでVCEで設定してたんだけど、アップデートしたらx264だけになってたんだが
誰か理由わかるだろうか…ネット初心者で申し訳ない
0290名無しさん@編集中 (ワッチョイ 4e02-0o94)
垢版 |
2019/03/21(木) 03:43:34.27ID:ImfJjNo40
>>289
ごめん!これは自己解決しました!

自分は低スペ配信者なんだけど、Streamlabs OBSとOBSStudioどっちのほうが負担少ないかとかあったら教えていただけるとありがたいです!
0292名無しさん@編集中 (ワッチョイ 4e02-0o94)
垢版 |
2019/03/21(木) 03:50:40.26ID:ImfJjNo40
>>291
すいません、ありがとうございます。
0294名無しさん@編集中 (ワッチョイ 9fe7-0zLl)
垢版 |
2019/03/21(木) 21:24:30.92ID:wJCoecLB0
 Intel Publishes Icelake "Gen 11" Graphics Architecture Overview
 https://www.phoronix.com/scan.php?page=news_item&;px=Intel-Gen11-Graphics-Overview

 Intel Processor Graphics Gen11 Architecture Version 1.0
 https://software.intel.com/sites/default/files/managed/db/88/The-Architecture-of-Intel-Processor-Graphics-Gen11_R1new.pdf

Icelakeの情報。HWエンコ絡みの記述は以下のような感じ。

・Gen9ではデコード/エンコードを行う Multi-format Codec (MFX) が1つだったけど
 Gen11ではMFXが2つになるので、再生とエンコードの並列性が上がるよ。

・VP9の10bitデコードに対応するよ。

・HEVCもVP9も4:2:2/4:4:4デコードに対応するよ。

・VP9エンコードをサポートするよ。

・HEVCエンコードの圧縮効率がGen9よりかなり上がるよ。

・Visual Quality Enhancement (VQE) ではハードウェアデノイズが10bit深度になるよ。
 あとHDR2HDRやHDR2SDRのトーンマッピングができる software programmable 3DLUT tables でHDRの扱いが容易になるよ。
0296名無しさん@編集中 (ワッチョイWW 635f-L9W/)
垢版 |
2019/03/21(木) 22:36:12.09ID:rC8NkPmY0
MFXの連装化は64EU規模に合わせての増強かね
現場でGT2でのエンコードの場合、24EUの方がボトルネックでGPGPU100%ロードさせてもメディアエンジンの4割方は遊んでるしMFX側は結構余裕ある
倍規模だと80EUぐらい賄えそうだし、ノート向けに上位EU規模のでもあるのか?

それよりデスクトップ向けSKUでもQSVでのエンコードで無駄にMFXのロード制限するのは次世代では止めて欲しい
安静状態からシングルでのエンコード負荷程度だとMFX側の負荷30%程度で制限されるから、GT2の24EUも全然使い切らない
断続的にエンコード続けるか2並列で一時的にでも負荷掛ければ、その後はシングルでもMFXのロード上がりやすくなって、EU側も7〜80%使う様になるんよね
それでも2並列で24EUですらフルロードに張り付けられないし、MFX側は全然余裕有るんだから、もうちょい回って欲しい

お陰で6770HQの72EUもシングルでの処理速度には反映しづらくて、4〜5本並列処理させにゃならん
0297名無しさん@編集中 (ワッチョイ cb8e-WX4v)
垢版 |
2019/03/22(金) 00:09:29.88ID:pGRHUhIM0
「リロースを100%使いきるエンコーダー=理想」っていうのがそもそもの間違い
エンコーダーと演算エンジンは別物

rigaya氏のバグ修正の更新乙です
0299名無しさん@編集中 (ワッチョイWW ff68-b0GN)
垢版 |
2019/03/22(金) 02:04:38.67ID:HGdrPbsr0
>>294
NVIDIA VS Intelになるのかな?
HEVCでNVIDIA超えとかになれば事件ですぞ
VP9についてはprofile 2.0まできちんとサポートされているのだろうか?

別件だが、現行のIntelエンコーダーはNVEncみたいに可逆圧縮に対応してないんだっけ?
対応していないのであれば、新型で対応してほしい
Intelが可逆圧縮に対応すれば編集用の中間素材用のファイル作成がdGPUなしのノートPCでもできて便利になるから
0302名無しさん@編集中 (ワッチョイ 0668-5HBQ)
垢版 |
2019/03/22(金) 18:07:49.69ID:goEw6xiL0
>>299
VP9のprofile 2は10bit-12bitで4:2:0対応、profile 3は10bit-12bitで4:2:0、4:2:2、4:4:4対応のことだよね?
現状確認すると

■Intel
・第7世代(Kaby Lake)以降、10bit、profile 2まで対応

■NVIDIA
・手元のGeForce 965M(Maxwell GM206)にてDXVA Checkerにて10bit、profile2まで対応確認済み
※GM206以外のMaxwellはVP9のハードウェア再生支援機能は搭載されていない
当然、この後のPascal世代やTuring世代も対応

続く
0303名無しさん@編集中 (ワッチョイ 0668-5HBQ)
垢版 |
2019/03/22(金) 18:08:11.66ID:goEw6xiL0
■ARM
・Snapdragon 845→profile 2まで対応確認済み
・Snapdragon 855→明確な記述が見つからないが、Android 9がprofile 2止まりであることと、Snapdragon 845の対応状況を鑑みると、profile 2までかと思われる

(なお、再生だけであれば10bit-12bit、4:2:0まででもおおよそ問題はないかと思われるが、4K、HDR、10bitで編集前提の素材撮りだと物足りないかも
profile 3まで対応できるハードウェアは登場するのだろうか?)

■資料
https://software.intel.com/en-us/articles/enable-10bpp
https://www.cnx-software.com/2019/02/28/robotics-dragonboard-845c-96boards-sbc-snapdragon-845-soc/
https://urashita.com/archives/25161
http://www.wikiwand.com/en/VP9
https://en.wikipedia.org/wiki/VP9

なので、Intelの新型CPUもprofile2までは対応するかと思われる
0304名無しさん@編集中 (ワッチョイ 0668-5HBQ)
垢版 |
2019/03/22(金) 18:26:32.33ID:goEw6xiL0
追記
なお、Snapdragonについては、再生だけであればSnapdragon 820世代以降であればVP9は対応していたかと思われるが、
profile 2まで対応かどうかの明確な資料が見当たらない
0306名無しさん@編集中 (ワッチョイ 9fe7-0zLl)
垢版 |
2019/03/22(金) 20:14:16.48ID:CLQgc/Uo0
>>302
そういえばVP9の10bitデコードはKaby Lakeで対応済みだっけか。
なんで>>294のIce Lakeの説明で「VP9の10bitデコードに対応する」なんてことが書かれてるんだろ。

原文は
  With Gen11, MFX VP9 decode bitdepth support is increased up to10bits which is required for HDR video scenarios.
なんだけど、「これまでは10bitのデコード結果を8bitで出力してました〜」なんてこともさすがにないだろうし・・・ないよね?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況