【NVENC/VCE】ハードウェアエンコーダーを語るスレ【QSV】
レス数が950を超えています。1000を超えると書き込みができなくなります。
A's VIDEO Converterもsdk9.0対応しねーかな たぶん>>850の言うとおり、実用的な速度が出るとはおもえない >>851
A'sはSDKを使って開発してるわけじゃなく、MediaFoundationのエンコーダを呼び出してるだけじゃなかったっけ? 速さ的にもデコードもエンコードもHWでやった方が速いんだけども
デコードされたデータをGPUに受け渡すよりデコードされていないデータ渡す方が接続バス通すデータ量小さいし、CPUの処理を待つ事自体がボトルネックなる
要は「丸投げ」が一番速くて電気も食わないのよ
CPUとHWのやりとりする量を手数を最小限にするすれば、バスを通してのデータのやりとりする量も、処理待ちや伝達待ちも発生しないのだから、電気も食わないし処理も速い
Bフレームの処理だけCPUってのも、それが出来たとしてもHWで中途まで処理した内容(生のフレーム情報だから無圧縮で肥大化している)をバス通してCPUに戻して、CPUで処理した内容をまたバスを通して戻すという手間が増えまくるうえ
HWはCPUの処理を待つ間処理が止まるし、I/P/Bフレームの比率考えればBフレームが多いほどCPU処理比率上がってHWエンコードの意味が無くなっていって、品質も速度も極めて半端にしかならんのよ ffmpeg+QSVでH.264とHEVC両方使ってみたけど
意外とCPU負荷もあるんだな
GPUに全部お任せできるくらいに思ってたわ H.265エンコだとどのハードとどのソフトの組み合わせがいいの? >>855
ソフトウェアデコードしてるせいでデコード負荷がかかってるってことはない?
ソースにもよるけど、-i の前に -hwaccel qsv -c:v h264_qsv とかつけてる?
Hardware/QuickSync ? FFmpeg
https://trac.ffmpeg.org/wiki/Hardware/QuickSync レトロゲー(640x480)の実況動画をつべにアップしようと思うんだけど
せっかくつべがFullHDや4kアップに対応してるんだから低解像度のレトロゲー実況動画も
FullHDか4kくらいにアップスケールしてからアップロードしてみたい
ハードウェアの力を使って低解像度動画を高解像度動画に綺麗にアップスケールしてくれる技術って無い?
ちなみにグラボはAMDのR9 290 >>859
おそらくあなたの想像や、このスレの趣旨とはズレるが教えてあげよう。
480pソースでもGV-USBのようなSDキャプチャではなく
初めからから720pまたは1080pにアプコンして収録するのが一番綺麗になるよ
レトロゲーム機
↓
フレームマイスター
https://www.amazon.co.jp/dp/B00FC38XDQ/
↓
HDMIキャプチャ >>859
レトロゲーならいっそのこと Nearest Neighbor で拡大するとか。
waifu2x系は
https://github.com/YSRKEN/aviutl-waifu2x-w2xc
とかならOpenCLの利用も可能らしいから一応AMD GPUを使うと言えるかな。
自分で使ったことは無いし、レトロゲーの拡大に向いてるかどうかは知らない。
ちなみにNVIDIAのRTXシリーズなら、NGX SDKが公開されればDLVSR(Deep Learning Video Super Resolution)ってのが
使えるようになるらしい。まだアーリーアクセスの段階だから無理だけど。
まあこれもレトロゲーの拡大に向いてるかどうかはわからないけど。
https://developer.nvidia.com/rtx/ngx
https://docs.nvidia.com/rtx/ngx/programming-guide/index.html#dlvsr >>860
エミュレーター使ってるから直接画面キャプチャしちゃってるのよね(小さな声
>>861
waifu2って始めて聞いたからググってみたけど
アニメ調の画像を高品質に拡大できるツール。与えられた画像を“縮小されたもの”と解釈し、
その元の姿を機械学習を利用した人工知能で推測、復元する仕組み。
https://forest.watch.impress.co.jp/library/software/waifu2xcaffe/
ほえー、こんなもの出来てたんだ
機械学習でスケールアップする、それもGPUを使って高速に
面白そうなのね >>862
一応書いては見たものの、waifu2xは動画に適用すると死ぬほど時間がかかると聞くので、
多分実況動画のために使う気にはなれないと思ふ・・・。 AMD VCEってNvencみたいに同時エンコード制限(上限?)的なのってあるの?
Nvencのチップ別仕様表はあるんだけど、VCEの仕様表は見つけられなくて
誰か知ってたら教えて欲しい。
できればPolarisアーキとVegaアーキ 25分程度のDVDアニメを全コマ画像化してwaifu2x-caffeでgtx1080ti使って拡大してから再度動画にしたら2日がかりだったぞ
そんなことしなくてもエミュ自体に大抵は拡大処理機能が付いてるだろうから画面を拡大した状態でキャプチャしたほうが綺麗だよ
あたりまえだけど違法ダウンロードしたソフトで遊んでる証拠動画はアップしないようにね >>865
エミュのことはよく知らんけど、そんなに複雑な拡大アルゴリズムを実装してるとも思えないし、
だとしたら元解像度でキャプチャしたものをLanczosなりなんなりで拡大したほうが綺麗になるのでは? >>857
はえ^〜サンガツ
デコードのほうもQSV指定する必要があったんすね
>>859
エミュレーターに描画の時点で内部解像度を変更できる設定があるから「機種名 高画質化」でぐぐると幸せになれるゾ >>866
そう、時間かけてソフトでアップスケールする方が、きれいになると思う >>866
そもそも前提となる条件があやふやなのに断定するような書き方するのは良くなかったね、すまない
元動画を何かしら圧縮して保存していたら拡大したときにノイズが目立ちやすいから
元からFHDなりでキャプチャしたほうがいいと考えたんだ
エミュの拡大アルゴリズムまで考えが至らなくて恥ずかしいよ >>862
そうか。
他の人にも言われてるけど、エミュをフルスクリーン表示にして、それをそのままフルスクリーンキャプチャするのが一番楽に高解像度ソース作れるんじゃないか
片方全画面ゲーム、片方PC画面にできるデュアルディスプレイ環境にすると尚良し >>869
たしかに、元の動画を非圧縮AVIで保存してるか、h.264などに圧縮してるかで変わりますね >>594
> 単価の安い20nmあたりでNVEncボードとか
> エンコードならDDR4でも間に合うし、
いいね! 素晴らしいアイデア。
ぜひ”NEW Product Requirement”として
nVidia にメールしてください! SpursEngineとかあったけど
もうああいうのは出ないやろ 専用ボード出したところで月何枚売れるのか
天下のNVIDIAにとっては糞みたいな売り上げでしょ あれは余剰チップの消化先的な面もあったからなぁ
リリース時の単価も安くないし >>875
あれはCUDAと比べりゃマシ程度のもんだった
それよりQuadroでNVENC使えばエンコ本数も制限無くて良い Tensorコア使った超解像フィルタどうなったんだろうかね
メモリ上でフレームを低解像度化後にソースとの比較学習させた成果をnvidiaにタレ込むプログラムとか出してくれれば、いくらでも協力するのにな
今年から国内法的に研究用途や機械学習用途で作成する複製は、視聴可能な状態で保持しなければ著作権を問われなくなったから
パイプに対応してくれれば、放送波流し込んでやれば延々学習させてられるし >>877
なるほど
放送波を延々と機械学習か
間違いなく素材の質が問われるけど、BSだとTVショッピングにめっぽう強くなるとかw
CSならchの選び方で、ドラマ、映画、MV、スポーツ、アニメ、ニュースなど特化したものに育つかな?
成果をみてみたい気もする >>863
そっか、もともと静止画用の技術なのか
ハードウェアの力を借りても動画を拡大するのは大変と・・・ あれ昔のアニメに使ってみるとデジタルリマスターみたいになるからすごい >>862
こういう意見もあるから
エミュの段階で拡大するのがベストっぽい
個人的な経験則でもドット絵は少しでもリサイズしようとすると
絵が崩れたりするからエミュで拡大して等倍(リサイズなし)エンコがいいと思う >>883
これ(xBR)の動画版って無いのかな?
綺麗にドット絵拡大していて驚愕 >>884
そういう場合はffmpegやAvisynth回りを探すといい。
FFmpeg Filters Documentation
https://ffmpeg.org/ffmpeg-filters.html#xbr
mysteryx93/AviSynthShader: Run HLSL Shaders in AviSynth with GPU Acceleration
https://github.com/mysteryx93/AviSynthShader 実装されてるんだ
すごいな
>>884
その記事での効果は凄いけど
そういう記事では最も優れた効果の画像を使うものだから
実際の利用ではちょっと違うものになるのはよくある RTX20x0世代のnvencでドライバ&ソフト側の最適化が完了したら
10x0世代より30%以上速くなるってどっかで見たけど
全然、来ないな… 1440x1080でいろいろ盛って360fpsくらいだけどまだパワーアップするのか…
古いHDDだと読み込み間に合わない このままGPUの性能が上がっていったらリアルタイムにwaifu2xでアプコン再生する動画姿勢支援機能とか出そう >>885
> FFmpeg Filters Documentation
> https://ffmpeg.org/ffmpeg-filters.html#xbr
イイネこれ
QSVなりVCEなりハードウェア使ってくれればなおのこと(・∀・)イイ!! SDKのページからリンクされてたけど、NVIDIA公式ブログでH.264とlibx264の比較記事が出てた。
Turing H.264 Video Encoding Speed and Quality | NVIDIA Developer Blog
https://devblogs.nvidia.com/turing-h264-video-encoding-speed-and-quality/ >>891訂正
× H.264とlibx264の比較記事が出てた。
〇 TuringのNVENC H.264とlibx264の比較記事が出てた。 >>891
これ、同じ条件での比較って言えるのか? amatsukazeとNVENCのおかげで溜まってた録画データだいぶ軽くなったわ。
作者さんありがとう。 ラデ570と580だとそんな差でない?メモリも4GBでいい?
2019/2/15
Unleash the Power of Turing with NVIDIA Driver 418
https://news.developer.nvidia.com/unleash-the-power-of-turing-with-nvidia-driver-418/
→ドライバ418と、様々なTuring向けSDKについて。
記事を見て知ったけど、Optical Flow SDKというのも公開されてたようだ。
TuringはOptical Flow用の専用回路を持っていて、高速で高品質なモーションベクトルが得られるらしい。
オブジェクトの認識や追跡、フレーム補間とかに利用できるとか。
NVIDIA Optical Flow SDK | NVIDIA Developer
https://developer.nvidia.com/opticalflow-sdk
An Introduction to the NVIDIA Optical Flow SDK | NVIDIA Developer Blog
https://devblogs.nvidia.com/an-introduction-to-the-nvidia-optical-flow-sdk/
これを利用したFluidMotion的な機能とか実装されたりするのかな。 レイトレ関連の機能の一部だろうから一概にTuringの機能と言っては弊害あるのでは? >>898
opticalって単語からレイトレを連想したのかもしれないけど、関係ないよ。
---
オプティカルフロー - Wikipedia
https://ja.wikipedia.org/wiki/%E3%82%AA%E3%83%97%E3%83%86%E3%82%A3%E3%82%AB%E3%83%AB%E3%83%95%E3%83%AD%E3%83%BC
オプティカルフロー(英: optical flow)とは、視覚表現(通常、時間的に連続するデジタル画像)の中で
物体の動きをベクトルで表したものである。
オプティカルフローは、パターン認識、コンピュータビジョンあるいは他の画像処理技術において利用されている。
その抽出にはブロックマッチング法、勾配法などが用いられる。
--- いろんな新技術来ても非エンジニアの自分は指をくわえて待つしかねぇ! リアルタイムは無理でもっぱら静止画だったな
FPUなしで一枚出すだけで一週間とか
今思えばそんなんよくやってたなと思うわw 22日(金)23時に販売解禁を迎えるNVIDIAの新型GPU「GeForce GTX 1660 Ti」(GDDR6 6GB)搭載グラフィックスカード
予価は税込約36,000円〜約45,000円になる模様。
うーん、高い
1060の上だからしょーがないんだろうけど メモリ3Gのとtiじゃないやつがいくらになるか…
ご祝儀価格やめて 経済を回すために皆頑張ってくれ
俺は中古の1060-6G使いながら値下がりを待つから 1660無印がnvencでBフレ対応の最廉価なんだろうからそれを待つわ RTコアがないのはいいけどTensorコアもないのか 1660ti tensorなくてがっかりだな。
cpuエンコとpascalのnvencで遊んでるけど、今になって画面出力なしのRX470も気になってきたわ。
VCEってssimとかのグラフどこかにあげられてたっけ?むしろ悪すぎて退場食らったのかな・・・ >>911
いや〜、RX460のVCEで比較ってのがね >>911
ありがとう。すごい助かる。
これだけひどいとお遊び用に買おうとも思わんな・・・pascalでいいや >>911
x265もv3.0超えてプリセット変わってるし、slowよりveryfast出したほうがHWエンコには参考になるだろうし
1660(またはRTX)追加してBフレの比較を待ちたいところですな >>911
QSVも結構酷いなこれ
アプコンエンコに使おうかと思ったけど素直にx265使っておくわ VCEの話題になってるから自分も前に取ったデータ出してみる
2400GとHaswell 4200Mとの比較
ソース サクラノ詩 OP
https://i.imgur.com/Ugwt0mN.png
https://i.imgur.com/ndJiN8d.png
https://i.imgur.com/3J5xdiW.png
エンコード速度
QSV 120fps前後
VCE h264 180fps前後
VCE h265 270fps前後 RTX20XXのNVENCのH.264を測定したデータってあるかな?
NVIDIAはプリセットmidiumでキーフレーム2秒なx264と同等の画質と言っているのだけど >>921
スイートスポットを狙ったTuring GPU「GeForce GTX 1660 Ti」を試す
https://pc.watch.impress.co.jp/docs/column/hothot/1170679.html
RTコアとTensorコアが非搭載のTU116コアだが、GPU内蔵ハードウェアビデオエンコーダ「NVENC」は、
ほかのTuring世代GPUと同等。H.265/HEVC形式へのエンコードで、Bフレームが利用可能となっており、
GeForce GTX 10シリーズ以前のGPUより圧縮率が向上している。 >>922
ありがとう 1660ti買ってみようかな GT630(GK208)ってOBSでNVENC使えますかね? >>924
GT630持ってないから試せないんで予想になるが、
GT630(GK208)はNVENC対応してるし使えるんじゃね? 二ヶ月後あたりからRTX2060が在庫減って、RTX2060の需要がGTX1660/TiとRTX2070に分散して巻き沿い売れしすから買い時に注意だな(特にGTX1660/Ti
買うなら決算、新入学・就職セール中までに済ませるか、夏ボのセールまで待った方が良いかも >>924
使えるけど初期のNVEncだからHEVC非対応なので注意ね
速度最優先でも無い限り、Haswell以降のIntel環境ならQSVのH264方が画質容量比の性能はいいので、環境によってはQSV使う方が良いかも
ただ、ビットレート高いほど性能差が出ずらくなるので
録画TSソースの圧縮目的で馬鹿みたいに圧縮せずに1440x1080で5〜6Mbps程度(2〜3倍録画相当)な程度ならKepler世代のNVEncでも十分な画質にはなる >>924
あ、obsというのを見過ごしてた、すまん
QSVのが画質稼げるが、遅延はNVEncより多少大きいので視聴者とのやりとり多い場合にはNVEncのがいいかも エンコードの遅延と配信の遅延は区別して考えないとね。 今960でリアルタイムエンコで使ってるんだけど1050Tiに変えるか1660Tiに変えるかで
迷ってるんだが良くなるのかわからない。
実質、差って出るもんなのかな?
ちな 3D描画はほとんど使わないという状況で 新しい世代ほど高解像度出力での速度低下が少なくて画質が良い
1660ti買える予算が捻出できるなら1660tiでいいけど
待てるなら、より安い
1660無印待ち(3Gモデルが出れば更に安価になるし
あとPascal世代で良いなら1050tiである必要すら無いから1050無印でも可
注意点はリアルタイム配信用のアプリ側で対応していないと1660以上のBフレーム対応の効果は得られない(ブロック配置性能向上での画質向上の効果は得られる >>932
助言助かりました
予算ギリギリではあるけど性能差は出るようだし1660ti明日にでも検討します
たぶんpalitが一番安いでしょうし
先を見越して買うしかないかな
アプリはOBSかXsplitあるんで問題なさそうかなって思ってます。 1650はHEVCでBフレ使えないから、HEVC目当てだと微妙だったり
H264もPascalから品質は上がってはいるけどHEVCほど極端な性能向上ではないし、未だSkylake以降のQSVのH264に勝るほどじゃないんで
近年のIntel環境ならH264目当てなら馬鹿みたいな処理速度欲しない限りはQSVのH264使っていた方がいい 今の環境はRyzen1700XなんでQSVが使えないという
intelの所持はIvyなんでスペック不足かな。
今日明日使いたいという考えだとやっぱ1660か1050なんだろうね。
MaxwellよりPascalの方が良いもしくはそれ以上のものを購入すれば
いいということですね?
今のところはH264だけですけど H265が生放送向きになることを想定すればやっぱ
1660って感じなんだろうな・・・・ >>937
RTXでアニメエンコードをしているけどh265の10bitが凄く良いよ
リサイズしないで品質固定低めにしているけどかなりきれい 来月下旬に来る1660無印はti付きより6000円くらい安くなって買いやすくなる
NVEncの速度は少し落ちるのだろうか nvだけなら変わらんのでは?
前処理でCUDA使ったりするなら遅くなるが 931です。
買いました1660Ti 生放送とかで変わればよいなぁとwktkしてます。 配信でHEVCを使えるところなんてあるの?
H.264は退化してる部分もあるようだが 配信でインタレース出力出来ない事がデメリットになると思えないんだが
国内ならTS抜きやってる内の極一部のユーザーがインタレ保持エンコしてるってぐらいで
なおかつx264では無くNVEncでそれやってる奴がどれほど居るかという インタレ解除については、よほど細かい違いを気にするのでなければだけど、TVMW7の適応補間 (高精度)で解除してから
RTX20*0のNVEnc使ってエンコードすれば充分だと思うけどねぇ
ほんのわずかでもきれいにしないと気が済まないというのであればAmatsukaze使うか、自分でAvisynthを使いこなすかになるけれど
正直そこまでするような素材があるのかという根本的な問題が…
2Kのインタレ素材を4Kテレビとかに表示するときにインタレ解除の品質がしょぼいと極めて残念なことになるのは事実だけど、
それは、テレビのリアルタイムアップコンバートを使わず、あらかじめ手間暇かけてアップコンバートするなどの方法で回避するなどの
方法自体を駆使することで、これもまた改善することはできなくもない
※ただし、アップコンバートした4Kファイルは当然大容量になるけど
続く 今後、2Kや480i時代の素材を4K、HDRテレビできれいに見ようとすると、またいろいろテクを駆使する必要が出るのかもしれないねぇとは思うけど
※WOWOWで今放送中のふしぎの海のナディアなんか、SDR→HDR変換もやれば、ブラウン管時代に見たような突き抜けた青空感とかも得られそうな気もするし まぁCUDAもセットで使えるからデインタレフィルタに困る事は無いってのもあるね
NVDecやVCE/VCNのHWデインタレはまだマシだが、QSVの糞さ加減(特にテレシネ時)は何時になったら改善するのやら 1660に変えたのはいいけど OBSで2パスのチェックなくなってるんだね。
ただ2項目ふえて looh-ahead と 心理視覚チューニングがチェックボックスついてる
先読みってことなんだろうけど、チェック入れて動かすとフレーム落ちるw
なんなんだこりゃ〜 レス数が950を超えています。1000を超えると書き込みができなくなります。