X



[GPGPU] GPUレンダラはまだですか?[CUDA]
0001名無しさん@お腹いっぱい。
垢版 |
2008/09/08(月) 02:44:01ID:jii8HpTB
CUDAはnVIDIAが提供するC言語ベースの開発言語。処理内容はビデオメモリに転送され、CPUはGPUに命令の指示を出すのみ。
既に百以上の研究・医療機関の現場では、多くの現場がGPGPU化されている。
パフォーマンス面でも100倍以上の速度になったという報告もいくつかある。(nVIDIAのCudaZone参照)
また、巨大なクラスタシステムがデスクトップPC規模の小型なシステムに置き換わるため、導入コスト・維持費で大幅にメリットになる。
またCPUの性能アップは足踏み状態なのに対し、GPUの世代ごとの速度向上は数倍規模。
ちなみに従来のDirectX10世代のゲーム用グラフィック(非GPGPU)も
Depth of Field 、コーティクス、グローバルイルミネーション、ボリュームフォグ、アンビエントオクリュージョン等も可能になっている。

CalcUA(530万ドル、512コア分のCPU)で一時間かかっていた3D化処理が、
8GPUを使ったCUDAシステムのデスクトップPC一台なら30秒@アントワープ大学
http://jp.youtube.com/watch?v=AgoEri9UX7o

nVIDIAによるリアルタイムレイトレーシング
一億ポリゴンのシーン1920x1080サイズのレンダリングを毎秒30回
http://guru3d.com/news/nvidia-shows-interactive-gpu-raytracer/

レイトレーシングデモ
Core2Duo(3GHz)×2 = 最大 1.89FPS  CUDA(GTX 280) = 最大52.48FPS
http://noridon.seesaa.net/category/5430830-1.html

CUDAカンファレンス2008
http://www.4gamer.net/games/032/G003263/20080306051/
物理演算
http://www.4gamer.net/games/022/G002233/20080812039/

PhysXやCUDAの最新状況を紹介
http://hyobans.technorati.jp/article/8418#article

nVIDIAが買収したGPUレンダソフト「RayScale」
http://rayscale.com/
http://www.betamagasinet.com/wp-content/uploads/2008/05/nvidia-ray.jpeg
0317名無しさん@お腹いっぱい。
垢版 |
2010/04/22(木) 17:01:09ID:j32UCd/B
どのレベルで「同じようなもの」と言いたいのか知らんが、
動画再生支援とレンダラじゃ計算内容が全然違うだろ。
0318名無しさん@お腹いっぱい。
垢版 |
2010/05/13(木) 01:37:18ID:bBXLe68T
LuxRenderのフォーラム( ttp://www.luxrender.net/forum/viewtopic.php?f=34&t=3781 )
からLuxRenderのOpenCLテスト版、SmallLuxGPUのレンダリング結果見てたけど、思ったより速くならないみたい。

自分でもバイナリ落として計測してみたけど、速度的にこんな感じ。
自分の構成
XP32bit Q8400 9600GT DDR2 4GB
で、Q8400をx1.0としたとき・・・

9600GT x0.51
Q8400+9600GT x1.22

以下の値はフォーラムの結果を相対値で。
GT240 x1.1
HD4890 x1.22
HD5770 x1.64
GTX260 x1.76
GTX285 x2.36
HD5850 x2.8
i7 860 x2.85
HD5870 x3.27
GTX480 x4.92

GTX480が鬼のように速いけど、電力がネックすぎる。
電力を考えると、i7 860にショボイグラボ付けたマシンを複数台のほうが良いのかも。
というかi7がなんでこんなに速いのか意味不明
0322名無しさん@お腹いっぱい。
垢版 |
2010/05/22(土) 03:50:09ID:bNKj/ovp
それも残念ながら…

GTX480を7つ搭載+i7の結果もフォーラムに上がってたけど、
GTX480を1つに比べてたったの1.6倍程度。
GTX480を7枚刺しの場合、1枚あたりの仕事量は1枚刺しにたいして、たった23%。
CPUがデータ流し込むだけでいっぱいいっぱいの域を超えて追いつかなくなって、どんどん効率が落ちていく模様。
0325名無しさん@お腹いっぱい。
垢版 |
2010/06/01(火) 21:15:33ID:DX0Yx2CO
Octane render買っちゃった。
6/4まで半額セール(1ライセンス5600円くらい)やってるみたい。

先月470GTX買ったのもあってつい・・・(´・ω・`)

0327325
垢版 |
2010/06/02(水) 21:58:48ID:XX80kAr+
>>326
それにしても凄まじいスピードでレンダされるね。(470GTX)

上の方で報告されてるLuxRenderと違ってGTX480x8でも
ほとんどリニアにスピードアップ(8個搭載で7.3倍)される
みたいだね。(フォーラムで報告されてる)

でも期間限定とはいえ定価の1/4にしちゃって余程資金ぶりが
やばいんだろうか・・・
頑張ってほしいなぁ・・・(´・ω・`)
0328325
垢版 |
2010/06/02(水) 22:00:14ID:XX80kAr+
サンプルをそのままレンダしてみた。(C2Q6600 470GTX 1台)

10秒
ttp://nagoya.axfc.net/uploader/Img/l/9938338575/v/Img_84329.jpg

30秒
ttp://nagoya.axfc.net/uploader/Img/l/6741413455/v/Img_84330.jpg

90秒
ttp://berlin.axfc.net/uploader/Img/l/8681096775/v/Img_84331.jpg

10秒でほとんど全体像を把握できて、30秒でもかなりノイズが消えてる。
0332325
垢版 |
2010/06/02(水) 22:34:12ID:XX80kAr+
ダウンロードのページで

OctaneRender_v1_b22_DemoSuite.zip (13 MB)

ってやつ。
0333325
垢版 |
2010/06/02(水) 22:34:54ID:XX80kAr+
被った・・・(´・ω・`)
0335名無しさん@お腹いっぱい。
垢版 |
2010/06/02(水) 22:54:16ID:hnchKfEB
同じOctaneBenchmarkで
8600GTだと0.55 Megasamples/secだった
470GTXのが8.84 Megasamples/sec
って書いてあるから16倍ちげえw
つかCPUフル回転しててマウスカーソルもとろくなる
CUDAレンダ専用にもう1枚買ってきて挿すか・・・!
0336名無しさん@お腹いっぱい。
垢版 |
2010/06/02(水) 23:35:43ID:MecAhu53
レンダリングってGPU積んでたらGPUがやってると思ってたんだが、
GPUレンダラっての以外はCPUが全部やってたの?
それとも元々GPUつかってるけどGPUレンダラはさらにGPU使うようになったって事?
0337325
垢版 |
2010/06/02(水) 23:39:41ID:XX80kAr+
>>335
かなり差があるね・・・(´・ω・`)

>>336
普通3Dソフトでのレンダリングって言われてるのは
CPUのみでやってる。
グラフィックカードの性能はプレビュー表示でしか使われてない感じ。
0338336
垢版 |
2010/06/02(水) 23:59:13ID:MecAhu53
>>337
そうだったんだorzありです。
0341名無しさん@お腹いっぱい。
垢版 |
2010/06/03(木) 02:09:51ID:bd/Q6d6P
8600はSPがやたら少なくて当時叩かれてたぐらいだから、
レンダリングは苦手だろうな。
妥当な差だと思うよ。
9600や9800からはもっとマシになってるとオモワレ
0342325
垢版 |
2010/06/03(木) 02:35:59ID:ndvp5AGR
>>340
ごめん、ここのうpローダって直接リンクはすぐに見られなくなるんだね。
ローダにまだデータは残ってるけど、他の所にうpしてみた。

直リン出来るところの方がいいんだろうけど、それだとすぐに流れてしま
うロダばかりなので、ちょっとめんどいけど長く保存されてるところにうpしてみた。
(このスレ過疎ってるから)

10秒
ttp://www.csync.net/service/file/view.cgi?id=1275499706

30秒
ttp://www.csync.net/service/file/view.cgi?id=1275499897

90秒
ttp://www.csync.net/service/file/view.cgi?id=1275499985
0343名無しさん@お腹いっぱい。
垢版 |
2010/06/03(木) 03:06:45ID:bd/Q6d6P
>>342
おお、さんくす。
すまんのう。年寄りだでロダのことはよくわからんのじゃ。
30秒で普通に使えるレベルだね。
シンプルなシーンとはいえすごいな!これは時代きたか?
SPと値段のバランスがよさそうなGTX260探してみたけど
もうほとんど売ってないんだね。
GTX465も値段微妙だし、選択肢が実質GTX470しかないじゃんw
0345名無しさん@お腹いっぱい。
垢版 |
2010/06/03(木) 17:43:14ID:obBs1ZW6
max2011が来たのでquicksilverをいじってみた。
MetaSLがGPUで走るというだけの,単なるリッチシェーダーレンダラ。
GPGPUレンダラではない。
もちろんirayとは別物。

フェイクの間接光,スクリーンスペースのAO/DOF,アダプティブシャドウ,etc
シーンを選べば使えないことはないけども。
正直ショボン。
0349名無しさん@お腹いっぱい。
垢版 |
2010/06/04(金) 13:15:55ID:CroMgPMQ
Octane,現状では光源がIBL一発ってことで
それならこの速度は納得ていうか特に速いとは思わない。

パストレが苦手な,点光源とかコースティクスとかどうする気なのか
他人事ながら心配だ。
0353名無しさん@お腹いっぱい。
垢版 |
2010/06/09(水) 22:40:03ID:u4Lnytyp
今までDiscount Beta 1 license 99.00 euroより安かったんだっけ?
十分安い気がするw beta外れる頃にはもっと高くなるのかな……
あーマシンごと新調してぇー
0354名無しさん@お腹いっぱい。
垢版 |
2010/06/09(水) 23:20:20ID:10+kOmRg
これいいなぁww
欲しいけどデモ版じゃでかいデータ読んだ時の動作がどうかわからんから
レンダサイズ制限つけてくれてもいいからobj読めるようにしてくれないかなぁ

>>339
もうどっかで出てるかもしれないけど、GTX260(SP216)で4.6ぐらいだったよ
0356名無しさん@お腹いっぱい。
垢版 |
2010/06/12(土) 02:46:24ID:Vqd6Gs9k
オプ4発憧れるなあ。けど稟議通らないなw
このスレ的にはGPUモンスター構成を重視したいけどもハードル高くなる一方だお
0357名無しさん@お腹いっぱい。
垢版 |
2010/06/12(土) 06:14:46ID:hNhtHrwP
マルチGPUキタコレと思ったけど
ボードの前にマザー(PCI-Eスロット)と電源をなんとかしないといけないので
結構ハードル高い。
グレード高いもの使っても同時2枚がいいとこだなあ・・・
0361名無しさん@お腹いっぱい。
垢版 |
2010/06/18(金) 22:48:07ID:511RBGn2
>>359
暇だったんで>>342のレンダリングやってみた。(C2DE8600 480GTX2台)
ttp://up2.iyhoo.net/up/download/1276868566.png
SS見れば判るが、完了するまで30分みたい。
3DCGやらないのでこれが早いのか遅いのか正直ピンと来ない。
0362名無しさん@お腹いっぱい。
垢版 |
2010/06/18(金) 23:01:17ID:511RBGn2
…ちょっと検証してみたらシングル動作の方が早いみたい。
ちゃんと有効に出来たらもう一回アップします。
0363名無しさん@お腹いっぱい。
垢版 |
2010/06/19(土) 02:06:13ID:FVTrKtnp
SLIとPhysX無効にしてQuadro用ドライバinf変更にしたらmultiGPUレンダ出来た。
ttp://up2.iyhoo.net/up/download/1276880622.png
ほぼ二倍のスピードなので体感もかなり早くなってます。
0364名無しさん@お腹いっぱい。
垢版 |
2010/06/19(土) 04:11:36ID:VO1XsU7N
>>342(GTX470)は90秒で1360 samples/pixel (15.1 samples/pixel/sec)
>>363(GTX480×2)は941秒で16000 samples/pixel (17.0 samples/pixel/sec)
あまり速くなってないな
0365325
垢版 |
2010/06/19(土) 05:57:58ID:eKWh5h4Z
今、470gtxで16000samplesまで回してみたけど、1068秒で終わった。
スピード的に>>363は1台分の480しか効いてないみたいだね・・・(´・ω・`)
0366325
垢版 |
2010/06/19(土) 06:09:00ID:eKWh5h4Z
でも、>>361>>363を比べると2倍になってるからmultiになってるっぽいよねぇ。
あと考えられる原因は、当方のCPUはQ6600@3.0GHz(4コア)なんだけど
CPUの違い(4コアと2コア)で差が出たのかなぁ?・・・(´・ω・`)
0367325
垢版 |
2010/06/19(土) 06:32:06ID:eKWh5h4Z
今、CPUを2CPUのみ有効にしてやってみても1072秒でほとんど変わらなかった。・・・(´・ω・`)
0368325
垢版 |
2010/06/19(土) 08:45:32ID:eKWh5h4Z
ちなみに当方はwin7Ulti 64bit 8GBです。
ビデオカードのドライバは257.21_desktop_win7_winvista_64bit_international_whql
0370363
垢版 |
2010/06/19(土) 21:30:37ID:FVTrKtnp
再度検証した所、1枚で>>363と同じ時間でレンダリング完了。

結論「SLIを有効にするとmultiではなくhalfになる」ふざけろ

設定がよくないのか…うーん。
0372363
垢版 |
2010/06/20(日) 22:09:17ID:dBAkKNbp
>>371
どうやら問題なく並列動作可能なようです。
ttp://up2.iyhoo.net/up/download/1277039214.png
その処理能力を一つにまとめたいんですけど…。
0373名無しさん@お腹いっぱい。
垢版 |
2010/06/21(月) 03:18:03ID:nk1GbHNP
GPUが主流になってレンダが早くなるのはいいけど
今のドライヤーみたいなグラボ何個もつけなきゃならなくなるのは嫌だなあ
0374371
垢版 |
2010/06/22(火) 18:19:44ID:3PifDbUi
>>372
現在のCUDAには2つのデバイス(GPU)間でメモリーを直接コピーする機能がないので
ちょこっと工夫しないと、処理能力をまとめるが難しいんですよねー

ソフトがうまく対応するように要望出して待つしかないですよ。
0381名無しさん@お腹いっぱい。
垢版 |
2010/07/02(金) 12:04:06ID:Vi+FOkzz
だって静止画でレンダリング速くしたいとか甘えだろ。
世の中にはもっとシビアに時間と戦ってる人がいるのに。
0385名無しさん@お腹いっぱい。
垢版 |
2010/07/13(火) 08:18:40ID:6VrRI6ig
         ____
        /      \    
       /ノ  \    \
      / /゚\  /゚\    \
    |   (__人__)        | ウボッウボボボボッガビビビビッ
     \  .` ⌒´|'|      / パネェパネェッッッッッッッッwwww
     ノ     .U     \
0389名無しさん@お腹いっぱい。
垢版 |
2010/07/21(水) 17:57:45ID:zxbG+MVh
GTX460 1Gメモリ版でやった
ttp://journal.mycom.co.jp/articles/2010/07/12/gf104/index.html
ここみると、そんなに差がでると思えないんだけど 
値段分の差が出ちゃってる

OCしてみるか
0390名無しさん@お腹いっぱい。
垢版 |
2010/07/29(木) 01:45:54ID:ZlVMrRch
SLG (SmallLuxGPU) v1.6beta2
中のバッチファイルでサンプルシーンをレンダできる
俺のPCではCPUコア3つ、GPUの使用率50%で動いてた

32bit
http://www.luxrender.net/release/slg/slg-v1.6beta2.tgz

64bit
http://www.luxrender.net/forum/download/file.php?id=9526
要:http://www.luxrender.net/forum/download/file.php?id=8144


What's new 1.6beta2:

* added a comand to the telnet interface to redefine a material;
* recursion replaced with iterative traversal for SPPM kd-trees (quite faster);
* SPPM eye pass work is now split over multiple threads;
* batch.periodicsave property now works even in no batch mode;
* added telnet support for all scene.camera.* properties;
* Chiaroscuro's patch for windows always-on-top option;
* first SPPM eye pass work is split among multiple thread too;
* the CPU and GPU work in SPPM is now asynchronous;
* added support for scene.infinitelight.gain, scene.infinitelight.shift, scene.skylight.gain, scene.skylight.turbidity, scene.sunlight.dir, scene.sunlight.relsize, scene.sunlight.turbidity to the telnet interface;
* added support for portals to SPPM;
* First working MQBVH kernel: instances support (on NVIDIA, ATI compiler still crash);
* Added Alloy material;
* updated to latest Chiaroscuro's Blender exporter;
0394名無しさん@お腹いっぱい。
垢版 |
2010/08/08(日) 11:40:51ID:Bs0QY8Ae
グラボのメモリって具体的に何が関係してくるの?
ベンチや極端に負荷がかかるゲームでもないかぎり
512MBも1GBも大差ないと聞いたけど
レンダラだと1GBと2GBだとかなり違う?
レンダが止まるのはメモリーの影響大きい?
無知ですまん
0395名無しさん@お腹いっぱい。
垢版 |
2010/08/09(月) 22:40:49ID:tRD8HTbA
CUDAだとVRAMがメインのメモリみたいになる
VRAM搭載以上のデータは扱えない
にxNromalの焼付けでハイポリのサイズがでかすぎてメモリ不足エラーが出る
0396名無しさん@お腹いっぱい。
垢版 |
2010/08/09(月) 23:01:28ID:jAbtazHn
ターボキャッシュみたいに
メインメモリの領域をVRAMの延長みたいに予約するのは
無理なん?今って標準でそうじゃなく?
0397名無しさん@お腹いっぱい。
垢版 |
2010/08/12(木) 11:36:24ID:piYhP9H7
GPU<->メインメモリ間の受け渡しがどれだけ遅いかわかってますか
VRAMに乗り切らないデータをメインメモリから参照しようとすうと、GPUを死ぬほど待たせることになる
0398名無しさん@お腹いっぱい。
垢版 |
2010/08/12(木) 16:32:25ID:3ppQ7wOJ
Mayaでポリゴンのデータを全部GPUで扱うことによって
Nurbusとか使ったハイポリのアニメーションも快適になるらしいな
レンダラよりこのへんも浸透してほしい
0400名無しさん@お腹いっぱい。
垢版 |
2010/08/21(土) 09:21:16ID:vhtH3aqw
Intelのララビーが成功してればそうしやすいMBの規格とか出てたかもな
VGAを冷却しやすいスペース配置とか
0408名無しさん@お腹いっぱい。
垢版 |
2010/09/15(水) 00:20:33ID:63Q7w8KT
付くのはirayじゃない?
irayはカスタムシェーダーが使えないようなことが書いてあった気がする

だから建築やプロダクト関係以外はメンタレのGPU版が出て欲しいんだと思う
レスを投稿する


ニューススポーツなんでも実況