【NVENC/VCE】ハードウェアエンコーダーを語るスレ2【QSV】
■ このスレッドは過去ログ倉庫に格納されています
>>205
元からこの価格で売ってりゃ良かったものを マイニング需要前の1060 6Gの底値がこれぐらいだったと思うけど、一応GDDR5X版に刷新されてるね
旨く行けばGP104版なんでNVEncが2基載ってるかも NVEncが2基載ってると実際のエンコードスピードはどうなる?
単純に2倍にはならないよね。1.6倍くらいは期待できる? >>209
同時に二本並列でエンコできるってことじゃないの? >>209
並列処理しても速度が落ちない
2基のエンジンが連携して速度が上がる訳じゃ無いので注意
GP106以下だと1基なんで、2並列処理をやると半分近くまで処理速度が落ちるけど
GP104以上は2基有るんで、2並列処理でも1基ずつ割り当てられるので処理速度が変わらない
通常はNVEncのエンジン基数に関わらず同時処理は2つまででQuadro P2000以上は同時処理数は無制限 PCのバスやメモリ速度は変わらないし、フィルタ処理やCPU処理速度やSSDもあるから
GPUエンコード画面をシャドウプレイで録画できる程度だと思っておいた方がいい 1660無印きてんじゃん!
まぁ2060買ったからあれだけど・・・ 1660は問題なくBフレ使えるじゃろ
不明なのは1650 1660どこにきてんだよぼけ
とおもたらちゃんと来てた。やっぱ情報はやいわ 1660無印は今のところZOTACが最安か
実消費電力は概ね100Wぐらいみたいやね
同じ12nmで多分同等性能のRX590が225Wとか、何の冗談かと思うわ Pascal世代のチップは未だに余りまくっていて、暫くは平行して売るんだろうか
10xxと16xxの競合カード、価格もベンチスコアも刻み過ぎでお団子感が物凄いな まぁGP106自体はデベロッパーへ供給済み分だけだから
GP104使ったGDDR5X版以外は各メーカーが在庫出し切ったら終わりやね >>220
でも1660も補助電源は8pinだった
1650Ti、1650は6ピンの可能性大
75W未満は無理そう 1660無印がtiと同じTDP120Wだから、PowerLimit上限まで上げたうえでのOCすれば消費電力は上がりそうだけどね
ただメモリの帯域は最初から不足気味だから描画性能は頭打ちになりそうではあるけど
吊しで1408コアの1660無印で95〜100Wあたりなら、少しクロック落ちればワッパ的にスィートスポット寄りになるし1024コアで75Wあたりは望めそうではある(PowerLimitもあるし
FP16コアは削られるかもだが CUDAもメモリやバス周りががっつり減るもんなぁ
その分まともなFANが付けばクロックは上げやすいだろうけど
1060みたいに1660のメモリ半分の選別落ち版を補助電源なしで出してほしい
そうすれば1650はもうワンランクやすくなるに違いない! 1660もbフレ対応なんだな
もうちょい待てば良かったな あまりに値段や消費電力高いとこのままでいいじゃんって思う1050Ti使い
まぁ暗いシーンが崩れがちなのは気になるけどこの傾向は改善されてるのかね
bフレでビットレート稼げる分の改善はもちろんあるんだろうけど Bフレーム使えるのは確かにメリットなんだけど、エンコードする前のどこかでインターレース解除しなきゃならないことのほうが処理速度含めてネックになってくるからなぁ
CUDAに最適化した高速高品質でいろんなファイルの入力に対応できる汎用性の高いインターレース解除ツールとかあればいいんだけど CPUにGPUが内蔵されて、
ビデオカードの存在価値アピールすると格段の処理能力を向上させるしかなくて、
結果、消費電流増大してしまうんだな。
アクションゲームなら使う人間がへばってしまうので、自然と歯止めがかかるんだkど、
AIだのマイニング用処理でフルに能力使うと、電気代だけで人生詰んでしまう >>233
>エンコードする前のどこかでインターレース解除しなきゃならない
詳しく
インタレ保持のままNVEncでエンコするの何か問題あるの? >>235
H.264 field encodingはTuringで使えなくなりました
でもBフレームの有無うんうんってHEVCでの話だよな…? NVENC使う前にプログレッシブに変換しとかないとだめってこと? >>232
Bフレームでビットレート稼げるようになっても暗部にビットレート割り振るようにアルゴリズムが変わらないと
品質指定では明るい部分に優先的にビットレート割り振るだけだから暗部の処理は変わらないような >>237
RTXとGTX1660TiとGTX1660は、h.265はもちろんh.264でもインタレ保持には対応してないのですよ
1650以降のGPUはまだわからん >>237
そいうこと
厳密に言えばNVEncCに投げればインタレ解除もHW支援が効くけどね
ただそもそも論として、H264同士の比較では10xx系もRTXもQSV未満の残念画質なので、インタレ保持したい場合はQSV一択かな >>230
下げたいならNvidia Inspector等で
クロックの制限、温度上限設定とかやっとけばいいと思う NVEncでインタレ保持エンコはできないってことなのかな?
ソースがインタレであってもプログレ保存であればNVEncでHWエンコ可能ってことでいいの? >>238
そのアルゴリズム自体pascal世代より暗部に割り振るように変わってないかなと
今は明部と暗部のバランスが悪いというか
bフレは同じビットレートになるようにしたら改善するだろうって意味です なんか知りたいことの思いっきり斜め上
Turingでh265のBフレネタ触れず、1650のNVenc仕様の確定情報外して何糞記事書いてんの?って感じ
加藤勝明てのは、
https://twitter.com/kato_kats
この目つきの悪いやつか?
https://twitter.com/5chan_nel (5ch newer account) rigayaさんとこのコメ欄にすごい要望ってか質問してるやついるなw
あんなのまで相手にしなきゃらんって大変だね グラボの王道はゲームやけんね!(笑)
エンコードの話題はどうしてもニッチな話しになる。 >>248
OBSでの配信はH.264で行うのでH.265は関係ない。
1650の情報なんてNVEncのことに限らずまだ何も発表されてないんだから確定情報なんて誰も書きようがない。
記事の目的も考えずに「僕ちゃんの知りたい情報がないから糞」とか言って編集者の容姿まで貶すのは控えめに言ってクズの所業。 >>251
ネット上で自分が知りたい情報以外はくそだろ
ましてやここはDTVスレ
DTVと関係ない記事を糞記事と言ってなにが悪いんだ?クズのお前www >>251
もひとついっといてやろう
>編集者の容姿まで貶すのは控えめに言ってクズの所業。
自分の記事に、ツイアカリンク張ってるんだからさらしてくださいってこった。
常識ないのか?wwww 商業ライターなんて提灯記事あたりまえだから軽く参考程度で流すのが吉 どっちかつーと次のページのこれのほうが・・・
Bフレームはデータ量が増える、すなわち実質ビットレートを下げてしまう
>>252
その理屈だと世の大多数からすりゃNVENC(どころかPC一般)の記事自体が糞記事になるんじゃない >>253
リンクあるんだからリンク貼るのは別にいいけどさ
人の容姿の事言ってるのが屑って言われてるのにそんな理解力が低い頭でエンコードとかわかるのか疑問だわ 2月初めまで1650はvoltaのリネームにしようと思ったんだろうな…
Turing世代とは言えないから大人の事情で今に至る感じか。 volta自体がスパコン向けに出した中間世代みたいなもんだし
下位モデルに限って設計引き継ぐのも逆に不自然な気がするけどもな
結局メモコンから作り直しでアンコア別物になるのだし、クラスタ構成も規模小さすぎて組み直しだし 1060から1660でBフレーム対応エンコードしたら、同じ設定でどれくらい速度早くなるんだろ。
Amatsukazeのスレで2割ほど短くなるかも、ってレスはあったけど。 同じ設定(Bフレーム対応)と言うことはH.264なのでは? すまん、よくわかってないんだが、Bフレーム対応以外は同じ設定という意味だけど、
そういうのはできないのかな。ちょっとぐぐってくるわ。 Bフレームあると、圧縮率や効率やビットレートにモロ影響するから、同じにならないかな Bフレ有る無し以外同じ設定って言ってんだから結果はどうでも良いんじゃね >>261
2割早くなるって言われてるんだからそれでいいじゃん
Amatsukazeのレスにもあるように、おま環次第ってあるだろうに、なんで向こうで聞けないんだろうな
コーデックやオプションやCPU次第で1割にも3割になっても不思議はないけどな >>233
亀レスですまんがLAVでCUDAデコード出来て倍速フレームレート化出来るから
それをHWエンコする方法で俺はエンコしてる。AVIUTLで完結するのが楽だしね。
HEVCでインタレ的な保存って相当イレギュラーだと思うんだが、そうでもないの? >>268
> LAVでCUDAデコード〜AVIUTLで完結
よくわからんけど、AviUtlにDirectShow File Readerで読み込んでるってこと?
そんなことするくらいなら、D3DVPとか、NVEncCの--vpp-deinterlaceを使った方がいいのでは。
> HEVCでインタレ的な保存って相当イレギュラーだと思う
流れを読めばHEVCでのインタレ保持の話はしていないのはわかると思う。 ・NVIDIA、AI/RTXなどのライブラリをまとめた「CUDA-X」でCUDAを拡張 - PC Watch
https://pc.watch.impress.co.jp/docs/news/1175502.html
「CUDA-Xは、CUDAの上に位置するソフトウェアライブラリだ。
従来はcuDNNなど複数の製品から構成されていたAIのライブラリを1つにまとめた「CUDA-X AI」や、
リアルタイムレイトレーシング用のRTXなどから構成されており、ソフトウェア開発者はそれらを活用することで、容易にGPUを利用した開発を行なえる。」
これを活用した高速高精度なインターレース解除ソフトを誰か作ってくれ〜 NVEnc 4.33でCUDA 10.1を使って --vpp-nnedi を実装してくれたから使ってみればっていう。 >>273
CUDAとインタレ解除つながりついでに実装されたよアナウンスをしただけ。 MSIの1660買ったんだが装着でしくじった。
補助電源ケーブル引っ張り出してきて装着。
電源入れたらガガガガ・・・
電源off待ってたらファンが壊れそうだったんでACコード引き抜く
調べてみたら、ビデオカードのファンがその下にカードと干渉してる。
ちなみに今までクロシコの1050Tiが挿さってて何の問題もなかった。その前はZotac 750Ti
MSIのカードが厚いのか?それとも重みで垂れ下がって干渉したのか?
持ち上げて、ビス留めすれば大丈夫かもしれんが、念のため干渉したカードの位置変えた。
ビデオカードの上のスロットしかあいてなかったんで熱で早死にするかも。
念のためクリップファンつけといた。 >>276
積んでるものが違うから無理に決まってるだろ >>275
2.5スロット使うGPU割と多い
干渉する場合は素直に下のカードを撤去するべき
熱が籠もってGPUが壊れる。ソースは俺
カードの価格を考えて配置をしたほうが良いと思う だいたいケースの下のほうってエアフロー無いようなもんだからなぁ カバー外して換気扇用の網付けてケースファン2つとも排気方向につけるとか、ゲームPCでよくある下電源とか
ま、スリムや省スペースで窒息してそうなケースじゃ何をしても・・・ 今時のタワーケースは、下に独立したエリアに電源が普通で、通気性よく考えられてるよな
ファンの増設もしやすいし >>281
MSIの1660の仕様が間違って広まってしまって商売の邪魔になっちゃまずいので一応きちんと説明しとく
挿すとき下にカードがあっても何の問題もなく挿せたんで、2.5スロットではないと思う。
2.5だと挿せないか、無理矢理挿しこむことになるので、そもそも干渉してることがわかるでしょ。
何も違和感なく挿せて、電源onでファン回転して初めて気づいたんで、
厚みにバラつきあるのか、
それとも、
1050Tiカードと比べるとずっしり重いので、
カードを持ち上げながらビス留めしないと垂れ下がったままになって干渉したと思われ。
ただ
2つ下のスロットに挿したボードとのクリアランスが極小ってのは間違いない。
遊び、ビス留め具合で干渉したりしなかったりがMSI 1660だと思う あとmsiのは補助電源コネクタ以外の全コネクタにカバーがついてる
基板のPCIE端子にまでカバーがついてるので忘れずにはずすこと。
挿そうとして
あれ、挿せねー?
で基板そのものにカバーついてるのそこで初めて気づいた >>284
それ一昔前じゃね?
今は全部繋がってるのが主流やぞ ガチガチ情弱で申し訳ない
OBSでVCEで設定してたんだけど、アップデートしたらx264だけになってたんだが
誰か理由わかるだろうか…ネット初心者で申し訳ない >>289
ごめん!これは自己解決しました!
自分は低スペ配信者なんだけど、Streamlabs OBSとOBSStudioどっちのほうが負担少ないかとかあったら教えていただけるとありがたいです! Intel Publishes Icelake "Gen 11" Graphics Architecture Overview
https://www.phoronix.com/scan.php?page=news_item&px=Intel-Gen11-Graphics-Overview
Intel Processor Graphics Gen11 Architecture Version 1.0
https://software.intel.com/sites/default/files/managed/db/88/The-Architecture-of-Intel-Processor-Graphics-Gen11_R1new.pdf
Icelakeの情報。HWエンコ絡みの記述は以下のような感じ。
・Gen9ではデコード/エンコードを行う Multi-format Codec (MFX) が1つだったけど
Gen11ではMFXが2つになるので、再生とエンコードの並列性が上がるよ。
・VP9の10bitデコードに対応するよ。
・HEVCもVP9も4:2:2/4:4:4デコードに対応するよ。
・VP9エンコードをサポートするよ。
・HEVCエンコードの圧縮効率がGen9よりかなり上がるよ。
・Visual Quality Enhancement (VQE) ではハードウェアデノイズが10bit深度になるよ。
あとHDR2HDRやHDR2SDRのトーンマッピングができる software programmable 3DLUT tables でHDRの扱いが容易になるよ。 MFXの連装化は64EU規模に合わせての増強かね
現場でGT2でのエンコードの場合、24EUの方がボトルネックでGPGPU100%ロードさせてもメディアエンジンの4割方は遊んでるしMFX側は結構余裕ある
倍規模だと80EUぐらい賄えそうだし、ノート向けに上位EU規模のでもあるのか?
それよりデスクトップ向けSKUでもQSVでのエンコードで無駄にMFXのロード制限するのは次世代では止めて欲しい
安静状態からシングルでのエンコード負荷程度だとMFX側の負荷30%程度で制限されるから、GT2の24EUも全然使い切らない
断続的にエンコード続けるか2並列で一時的にでも負荷掛ければ、その後はシングルでもMFXのロード上がりやすくなって、EU側も7〜80%使う様になるんよね
それでも2並列で24EUですらフルロードに張り付けられないし、MFX側は全然余裕有るんだから、もうちょい回って欲しい
お陰で6770HQの72EUもシングルでの処理速度には反映しづらくて、4〜5本並列処理させにゃならん 「リロースを100%使いきるエンコーダー=理想」っていうのがそもそもの間違い
エンコーダーと演算エンジンは別物
rigaya氏のバグ修正の更新乙です 演算エンジンはハードのポテンシャルを使い切ってくれってことだろ >>294
NVIDIA VS Intelになるのかな?
HEVCでNVIDIA超えとかになれば事件ですぞ
VP9についてはprofile 2.0まできちんとサポートされているのだろうか?
別件だが、現行のIntelエンコーダーはNVEncみたいに可逆圧縮に対応してないんだっけ?
対応していないのであれば、新型で対応してほしい
Intelが可逆圧縮に対応すれば編集用の中間素材用のファイル作成がdGPUなしのノートPCでもできて便利になるから rigaya様の新nppライブラリはNVEncC64.exeと同じフォルダに置いとけばいいの?
旧8.0ライブラリは削除でいいの? >>299
VP9のprofile 2は10bit-12bitで4:2:0対応、profile 3は10bit-12bitで4:2:0、4:2:2、4:4:4対応のことだよね?
現状確認すると
■Intel
・第7世代(Kaby Lake)以降、10bit、profile 2まで対応
■NVIDIA
・手元のGeForce 965M(Maxwell GM206)にてDXVA Checkerにて10bit、profile2まで対応確認済み
※GM206以外のMaxwellはVP9のハードウェア再生支援機能は搭載されていない
当然、この後のPascal世代やTuring世代も対応
続く ■ARM
・Snapdragon 845→profile 2まで対応確認済み
・Snapdragon 855→明確な記述が見つからないが、Android 9がprofile 2止まりであることと、Snapdragon 845の対応状況を鑑みると、profile 2までかと思われる
(なお、再生だけであれば10bit-12bit、4:2:0まででもおおよそ問題はないかと思われるが、4K、HDR、10bitで編集前提の素材撮りだと物足りないかも
profile 3まで対応できるハードウェアは登場するのだろうか?)
■資料
https://software.intel.com/en-us/articles/enable-10bpp
https://www.cnx-software.com/2019/02/28/robotics-dragonboard-845c-96boards-sbc-snapdragon-845-soc/
https://urashita.com/archives/25161
http://www.wikiwand.com/en/VP9
https://en.wikipedia.org/wiki/VP9
なので、Intelの新型CPUもprofile2までは対応するかと思われる 追記
なお、Snapdragonについては、再生だけであればSnapdragon 820世代以降であればVP9は対応していたかと思われるが、
profile 2まで対応かどうかの明確な資料が見当たらない 再追記
https://urashita.com/archives/25161
をよく読むと
・Snapdragon 820/821→VP9 UHD/60fps デコーディング
・Snapdragon 835→VP9 UHD/60fps 10bit デコーディング
の記述があるので、profile 2対応はSnapdragon 835世代からということになりそう >>302
そういえばVP9の10bitデコードはKaby Lakeで対応済みだっけか。
なんで>>294のIce Lakeの説明で「VP9の10bitデコードに対応する」なんてことが書かれてるんだろ。
原文は
With Gen11, MFX VP9 decode bitdepth support is increased up to10bits which is required for HDR video scenarios.
なんだけど、「これまでは10bitのデコード結果を8bitで出力してました〜」なんてこともさすがにないだろうし・・・ないよね? ■ このスレッドは過去ログ倉庫に格納されています