[GPGPU] GPUレンダラはまだですか?[CUDA]
CUDAはnVIDIAが提供するC言語ベースの開発言語。処理内容はビデオメモリに転送され、CPUはGPUに命令の指示を出すのみ。
既に百以上の研究・医療機関の現場では、多くの現場がGPGPU化されている。
パフォーマンス面でも100倍以上の速度になったという報告もいくつかある。(nVIDIAのCudaZone参照)
また、巨大なクラスタシステムがデスクトップPC規模の小型なシステムに置き換わるため、導入コスト・維持費で大幅にメリットになる。
またCPUの性能アップは足踏み状態なのに対し、GPUの世代ごとの速度向上は数倍規模。
ちなみに従来のDirectX10世代のゲーム用グラフィック(非GPGPU)も
Depth of Field 、コーティクス、グローバルイルミネーション、ボリュームフォグ、アンビエントオクリュージョン等も可能になっている。
CalcUA(530万ドル、512コア分のCPU)で一時間かかっていた3D化処理が、
8GPUを使ったCUDAシステムのデスクトップPC一台なら30秒@アントワープ大学
http://jp.youtube.com/watch?v=AgoEri9UX7o
nVIDIAによるリアルタイムレイトレーシング
一億ポリゴンのシーン1920x1080サイズのレンダリングを毎秒30回
http://guru3d.com/news/nvidia-shows-interactive-gpu-raytracer/
レイトレーシングデモ
Core2Duo(3GHz)×2 = 最大 1.89FPS CUDA(GTX 280) = 最大52.48FPS
http://noridon.seesaa.net/category/5430830-1.html
CUDAカンファレンス2008
http://www.4gamer.net/games/032/G003263/20080306051/
物理演算
http://www.4gamer.net/games/022/G002233/20080812039/
PhysXやCUDAの最新状況を紹介
http://hyobans.technorati.jp/article/8418#article
nVIDIAが買収したGPUレンダソフト「RayScale」
http://rayscale.com/
http://www.betamagasinet.com/wp-content/uploads/2008/05/nvidia-ray.jpeg ArionてMaxwellに似すぎじゃね?
スピンアウトってやつ? ここで話してるのって
グラボの動画再生支援のDXVAと同じようなものなんかな? どのレベルで「同じようなもの」と言いたいのか知らんが、
動画再生支援とレンダラじゃ計算内容が全然違うだろ。 LuxRenderのフォーラム( ttp://www.luxrender.net/forum/viewtopic.php?f=34&t=3781 )
からLuxRenderのOpenCLテスト版、SmallLuxGPUのレンダリング結果見てたけど、思ったより速くならないみたい。
自分でもバイナリ落として計測してみたけど、速度的にこんな感じ。
自分の構成
XP32bit Q8400 9600GT DDR2 4GB
で、Q8400をx1.0としたとき・・・
9600GT x0.51
Q8400+9600GT x1.22
以下の値はフォーラムの結果を相対値で。
GT240 x1.1
HD4890 x1.22
HD5770 x1.64
GTX260 x1.76
GTX285 x2.36
HD5850 x2.8
i7 860 x2.85
HD5870 x3.27
GTX480 x4.92
GTX480が鬼のように速いけど、電力がネックすぎる。
電力を考えると、i7 860にショボイグラボ付けたマシンを複数台のほうが良いのかも。
というかi7がなんでこんなに速いのか意味不明 >>318
Core i7けっこう速いよね。
最近はTesla(一世代古い?)を4枚搭載したワークステーションとかで、
http://gpgpu.dospara.co.jp/XE.html
4.92x4=>約20倍
の性能が出るなら使い方も変わるレベルの高速化じゃないですか。
それも残念ながら…
GTX480を7つ搭載+i7の結果もフォーラムに上がってたけど、
GTX480を1つに比べてたったの1.6倍程度。
GTX480を7枚刺しの場合、1枚あたりの仕事量は1枚刺しにたいして、たった23%。
CPUがデータ流し込むだけでいっぱいいっぱいの域を超えて追いつかなくなって、どんどん効率が落ちていく模様。 あ、間違い。
GTX480x7枚+XEON E5520x2個だった Octane render買っちゃった。
6/4まで半額セール(1ライセンス5600円くらい)やってるみたい。
先月470GTX買ったのもあってつい・・・(´・ω・`)
俺もOctaneRender買ってみた
日本語の情報に飢えてる >>326
それにしても凄まじいスピードでレンダされるね。(470GTX)
上の方で報告されてるLuxRenderと違ってGTX480x8でも
ほとんどリニアにスピードアップ(8個搭載で7.3倍)される
みたいだね。(フォーラムで報告されてる)
でも期間限定とはいえ定価の1/4にしちゃって余程資金ぶりが
やばいんだろうか・・・
頑張ってほしいなぁ・・・(´・ω・`) サンプルをそのままレンダしてみた。(C2Q6600 470GTX 1台)
10秒
ttp://nagoya.axfc.net/uploader/Img/l/9938338575/v/Img_84329.jpg
30秒
ttp://nagoya.axfc.net/uploader/Img/l/6741413455/v/Img_84330.jpg
90秒
ttp://berlin.axfc.net/uploader/Img/l/8681096775/v/Img_84331.jpg
10秒でほとんど全体像を把握できて、30秒でもかなりノイズが消えてる。
凄いなぁ
よしGeForce9400Mだけどデモ版DLしてみy ダウンロードのページで
OctaneRender_v1_b22_DemoSuite.zip (13 MB)
ってやつ。 同じOctaneBenchmarkで
8600GTだと0.55 Megasamples/secだった
470GTXのが8.84 Megasamples/sec
って書いてあるから16倍ちげえw
つかCPUフル回転しててマウスカーソルもとろくなる
CUDAレンダ専用にもう1枚買ってきて挿すか・・・! レンダリングってGPU積んでたらGPUがやってると思ってたんだが、
GPUレンダラっての以外はCPUが全部やってたの?
それとも元々GPUつかってるけどGPUレンダラはさらにGPU使うようになったって事? >>335
かなり差があるね・・・(´・ω・`)
>>336
普通3Dソフトでのレンダリングって言われてるのは
CPUのみでやってる。
グラフィックカードの性能はプレビュー表示でしか使われてない感じ。
>>335
gtx260やgtx480だとどんくらいなのかなこれ 8600はSPがやたら少なくて当時叩かれてたぐらいだから、
レンダリングは苦手だろうな。
妥当な差だと思うよ。
9600や9800からはもっとマシになってるとオモワレ >>340
ごめん、ここのうpローダって直接リンクはすぐに見られなくなるんだね。
ローダにまだデータは残ってるけど、他の所にうpしてみた。
直リン出来るところの方がいいんだろうけど、それだとすぐに流れてしま
うロダばかりなので、ちょっとめんどいけど長く保存されてるところにうpしてみた。
(このスレ過疎ってるから)
10秒
ttp://www.csync.net/service/file/view.cgi?id=1275499706
30秒
ttp://www.csync.net/service/file/view.cgi?id=1275499897
90秒
ttp://www.csync.net/service/file/view.cgi?id=1275499985
>>342
おお、さんくす。
すまんのう。年寄りだでロダのことはよくわからんのじゃ。
30秒で普通に使えるレベルだね。
シンプルなシーンとはいえすごいな!これは時代きたか?
SPと値段のバランスがよさそうなGTX260探してみたけど
もうほとんど売ってないんだね。
GTX465も値段微妙だし、選択肢が実質GTX470しかないじゃんw max2011が来たのでquicksilverをいじってみた。
MetaSLがGPUで走るというだけの,単なるリッチシェーダーレンダラ。
GPGPUレンダラではない。
もちろんirayとは別物。
フェイクの間接光,スクリーンスペースのAO/DOF,アダプティブシャドウ,etc
シーンを選べば使えないことはないけども。
正直ショボン。
GTX460くらいでいいから3Gくらい搭載したのが欲しいな Octane,現状では光源がIBL一発ってことで
それならこの速度は納得ていうか特に速いとは思わない。
パストレが苦手な,点光源とかコースティクスとかどうする気なのか
他人事ながら心配だ。 >特に速いとは思わない。
速いよ
http://www.refractivesoftware.com/features.html
V-Ray含めコーティクスとかもGPUで速いよ
さんざんCUDAレンダラで動画出てる
俺はレイトレが最適化されやすいと思ってたけど 買ったはいいけどDLがわかりづらいな。
フォーラムで発注しろって事なんかな。 Octane render もう安売りは終わっちゃったの?
ちい。出遅れたか 今までDiscount Beta 1 license 99.00 euroより安かったんだっけ?
十分安い気がするw beta外れる頃にはもっと高くなるのかな……
あーマシンごと新調してぇー これいいなぁww
欲しいけどデモ版じゃでかいデータ読んだ時の動作がどうかわからんから
レンダサイズ制限つけてくれてもいいからobj読めるようにしてくれないかなぁ
>>339
もうどっかで出てるかもしれないけど、GTX260(SP216)で4.6ぐらいだったよ
>>353
上に59ユーロとかかいてあったよ
>あーマシンごと新調してぇー
おぷてろん×4とか? オプ4発憧れるなあ。けど稟議通らないなw
このスレ的にはGPUモンスター構成を重視したいけどもハードル高くなる一方だお マルチGPUキタコレと思ったけど
ボードの前にマザー(PCI-Eスロット)と電源をなんとかしないといけないので
結構ハードル高い。
グレード高いもの使っても同時2枚がいいとこだなあ・・・ だよねえ
マルチGPUってみんな電源どのくらいのつかってんのかな?
1300とか? >>350
なんか綺麗になるとこまで見せてくれないけど、
やっぱそれなりに時間かかるのかな。 >>359
暇だったんで>>342のレンダリングやってみた。(C2DE8600 480GTX2台)
ttp://up2.iyhoo.net/up/download/1276868566.png
SS見れば判るが、完了するまで30分みたい。
3DCGやらないのでこれが早いのか遅いのか正直ピンと来ない。 …ちょっと検証してみたらシングル動作の方が早いみたい。
ちゃんと有効に出来たらもう一回アップします。 SLIとPhysX無効にしてQuadro用ドライバinf変更にしたらmultiGPUレンダ出来た。
ttp://up2.iyhoo.net/up/download/1276880622.png
ほぼ二倍のスピードなので体感もかなり早くなってます。 >>342(GTX470)は90秒で1360 samples/pixel (15.1 samples/pixel/sec)
>>363(GTX480×2)は941秒で16000 samples/pixel (17.0 samples/pixel/sec)
あまり速くなってないな 今、470gtxで16000samplesまで回してみたけど、1068秒で終わった。
スピード的に>>363は1台分の480しか効いてないみたいだね・・・(´・ω・`)
でも、>>361と>>363を比べると2倍になってるからmultiになってるっぽいよねぇ。
あと考えられる原因は、当方のCPUはQ6600@3.0GHz(4コア)なんだけど
CPUの違い(4コアと2コア)で差が出たのかなぁ?・・・(´・ω・`)
今、CPUを2CPUのみ有効にしてやってみても1072秒でほとんど変わらなかった。・・・(´・ω・`)
ちなみに当方はwin7Ulti 64bit 8GBです。
ビデオカードのドライバは257.21_desktop_win7_winvista_64bit_international_whql
仕事で使おうと思ったら1フレームあたり1分切らないとキツイ 再度検証した所、1枚で>>363と同じ時間でレンダリング完了。
結論「SLIを有効にするとmultiではなくhalfになる」ふざけろ
設定がよくないのか…うーん。 >>370 二つ起動させてDeviceを別々にして、同時にレンダリングを始めた場合どうなりますか? >>371
どうやら問題なく並列動作可能なようです。
ttp://up2.iyhoo.net/up/download/1277039214.png
その処理能力を一つにまとめたいんですけど…。 GPUが主流になってレンダが早くなるのはいいけど
今のドライヤーみたいなグラボ何個もつけなきゃならなくなるのは嫌だなあ >>372
現在のCUDAには2つのデバイス(GPU)間でメモリーを直接コピーする機能がないので
ちょこっと工夫しないと、処理能力をまとめるが難しいんですよねー
ソフトがうまく対応するように要望出して待つしかないですよ。 静止画高解像度(4000*3000くらい)とかは不向きですか?
メモリの問題などで。 snalluxGPUってMACだけなんだな、WINDOWS版はないのかね? 最近はゲーム会社のサラリーマンモデラーの意見ばかりだからなココ。 だって静止画でレンダリング速くしたいとか甘えだろ。
世の中にはもっとシビアに時間と戦ってる人がいるのに。 別に甘えでもなんでもないと思うけどな
使えるものならなんでも使えばいい >>378
どこをどう見ればMACだけなんて思うんだ。
Linux,Win,Macに対応してますよ ____
/ \
/ノ \ \
/ /゚\ /゚\ \
| (__人__) | ウボッウボボボボッガビビビビッ
\ .` ⌒´|'| / パネェパネェッッッッッッッッwwww
ノ .U \
470とかは並の2コアCPUの何倍くらい速いの?9500とかでもCPUより速いの? GTX460で4.9〜5.2 megasamples/sec
>>342
470ずいぶん速いね
>>387
ほぉ、460はCUDAはだめっぽいのかな。
GTX460 1Gメモリ版でやった
ttp://journal.mycom.co.jp/articles/2010/07/12/gf104/index.html
ここみると、そんなに差がでると思えないんだけど
値段分の差が出ちゃってる
OCしてみるか SLG (SmallLuxGPU) v1.6beta2
中のバッチファイルでサンプルシーンをレンダできる
俺のPCではCPUコア3つ、GPUの使用率50%で動いてた
32bit
http://www.luxrender.net/release/slg/slg-v1.6beta2.tgz
64bit
http://www.luxrender.net/forum/download/file.php?id=9526
要:http://www.luxrender.net/forum/download/file.php?id=8144
What's new 1.6beta2:
* added a comand to the telnet interface to redefine a material;
* recursion replaced with iterative traversal for SPPM kd-trees (quite faster);
* SPPM eye pass work is now split over multiple threads;
* batch.periodicsave property now works even in no batch mode;
* added telnet support for all scene.camera.* properties;
* Chiaroscuro's patch for windows always-on-top option;
* first SPPM eye pass work is split among multiple thread too;
* the CPU and GPU work in SPPM is now asynchronous;
* added support for scene.infinitelight.gain, scene.infinitelight.shift, scene.skylight.gain, scene.skylight.turbidity, scene.sunlight.dir, scene.sunlight.relsize, scene.sunlight.turbidity to the telnet interface;
* added support for portals to SPPM;
* First working MQBVH kernel: instances support (on NVIDIA, ATI compiler still crash);
* Added Alloy material;
* updated to latest Chiaroscuro's Blender exporter; グラボのメモリって具体的に何が関係してくるの?
ベンチや極端に負荷がかかるゲームでもないかぎり
512MBも1GBも大差ないと聞いたけど
レンダラだと1GBと2GBだとかなり違う?
レンダが止まるのはメモリーの影響大きい?
無知ですまん CUDAだとVRAMがメインのメモリみたいになる
VRAM搭載以上のデータは扱えない
にxNromalの焼付けでハイポリのサイズがでかすぎてメモリ不足エラーが出る ターボキャッシュみたいに
メインメモリの領域をVRAMの延長みたいに予約するのは
無理なん?今って標準でそうじゃなく? GPU<->メインメモリ間の受け渡しがどれだけ遅いかわかってますか
VRAMに乗り切らないデータをメインメモリから参照しようとすうと、GPUを死ぬほど待たせることになる Mayaでポリゴンのデータを全部GPUで扱うことによって
Nurbusとか使ったハイポリのアニメーションも快適になるらしいな
レンダラよりこのへんも浸透してほしい そろそろVGAもマザボみたいにGPUとメモリの交換とかできるようにしようぜ Intelのララビーが成功してればそうしやすいMBの規格とか出てたかもな
VGAを冷却しやすいスペース配置とか >>398
その辺はぼちぼち色んなソフトで対応してる
スキニングとか使ったアニメーションとかも軽くなるらしい VRay RT GPUベータテスト開始
真打ちきたこれ VRAY RT GPU 早くラデ対応してくれ・・・ Maxのサブスクで今年中に付くよ>メンタレGPU版 付くのはirayじゃない?
irayはカスタムシェーダーが使えないようなことが書いてあった気がする
だから建築やプロダクト関係以外はメンタレのGPU版が出て欲しいんだと思う >>409
1GPUでこの波はすごいね。480GTXかquadro6000あたりかな? irayって2011専用なのかな?明日になればわかることだが。 >>412
MRのバージョンに依存しちゃうから2011以降じゃないかなあ。 2011なんて重くて会社の誰も使ってないよ。
PC買い換えないと無理