X



[GPGPU] GPUレンダラはまだですか?[CUDA]
0001名無しさん@お腹いっぱい。
垢版 |
2008/09/08(月) 02:44:01ID:jii8HpTB
CUDAはnVIDIAが提供するC言語ベースの開発言語。処理内容はビデオメモリに転送され、CPUはGPUに命令の指示を出すのみ。
既に百以上の研究・医療機関の現場では、多くの現場がGPGPU化されている。
パフォーマンス面でも100倍以上の速度になったという報告もいくつかある。(nVIDIAのCudaZone参照)
また、巨大なクラスタシステムがデスクトップPC規模の小型なシステムに置き換わるため、導入コスト・維持費で大幅にメリットになる。
またCPUの性能アップは足踏み状態なのに対し、GPUの世代ごとの速度向上は数倍規模。
ちなみに従来のDirectX10世代のゲーム用グラフィック(非GPGPU)も
Depth of Field 、コーティクス、グローバルイルミネーション、ボリュームフォグ、アンビエントオクリュージョン等も可能になっている。

CalcUA(530万ドル、512コア分のCPU)で一時間かかっていた3D化処理が、
8GPUを使ったCUDAシステムのデスクトップPC一台なら30秒@アントワープ大学
http://jp.youtube.com/watch?v=AgoEri9UX7o

nVIDIAによるリアルタイムレイトレーシング
一億ポリゴンのシーン1920x1080サイズのレンダリングを毎秒30回
http://guru3d.com/news/nvidia-shows-interactive-gpu-raytracer/

レイトレーシングデモ
Core2Duo(3GHz)×2 = 最大 1.89FPS  CUDA(GTX 280) = 最大52.48FPS
http://noridon.seesaa.net/category/5430830-1.html

CUDAカンファレンス2008
http://www.4gamer.net/games/032/G003263/20080306051/
物理演算
http://www.4gamer.net/games/022/G002233/20080812039/

PhysXやCUDAの最新状況を紹介
http://hyobans.technorati.jp/article/8418#article

nVIDIAが買収したGPUレンダソフト「RayScale」
http://rayscale.com/
http://www.betamagasinet.com/wp-content/uploads/2008/05/nvidia-ray.jpeg
0353名無しさん@お腹いっぱい。
垢版 |
2010/06/09(水) 22:40:03ID:u4Lnytyp
今までDiscount Beta 1 license 99.00 euroより安かったんだっけ?
十分安い気がするw beta外れる頃にはもっと高くなるのかな……
あーマシンごと新調してぇー
0354名無しさん@お腹いっぱい。
垢版 |
2010/06/09(水) 23:20:20ID:10+kOmRg
これいいなぁww
欲しいけどデモ版じゃでかいデータ読んだ時の動作がどうかわからんから
レンダサイズ制限つけてくれてもいいからobj読めるようにしてくれないかなぁ

>>339
もうどっかで出てるかもしれないけど、GTX260(SP216)で4.6ぐらいだったよ
0356名無しさん@お腹いっぱい。
垢版 |
2010/06/12(土) 02:46:24ID:Vqd6Gs9k
オプ4発憧れるなあ。けど稟議通らないなw
このスレ的にはGPUモンスター構成を重視したいけどもハードル高くなる一方だお
0357名無しさん@お腹いっぱい。
垢版 |
2010/06/12(土) 06:14:46ID:hNhtHrwP
マルチGPUキタコレと思ったけど
ボードの前にマザー(PCI-Eスロット)と電源をなんとかしないといけないので
結構ハードル高い。
グレード高いもの使っても同時2枚がいいとこだなあ・・・
0361名無しさん@お腹いっぱい。
垢版 |
2010/06/18(金) 22:48:07ID:511RBGn2
>>359
暇だったんで>>342のレンダリングやってみた。(C2DE8600 480GTX2台)
ttp://up2.iyhoo.net/up/download/1276868566.png
SS見れば判るが、完了するまで30分みたい。
3DCGやらないのでこれが早いのか遅いのか正直ピンと来ない。
0362名無しさん@お腹いっぱい。
垢版 |
2010/06/18(金) 23:01:17ID:511RBGn2
…ちょっと検証してみたらシングル動作の方が早いみたい。
ちゃんと有効に出来たらもう一回アップします。
0363名無しさん@お腹いっぱい。
垢版 |
2010/06/19(土) 02:06:13ID:FVTrKtnp
SLIとPhysX無効にしてQuadro用ドライバinf変更にしたらmultiGPUレンダ出来た。
ttp://up2.iyhoo.net/up/download/1276880622.png
ほぼ二倍のスピードなので体感もかなり早くなってます。
0364名無しさん@お腹いっぱい。
垢版 |
2010/06/19(土) 04:11:36ID:VO1XsU7N
>>342(GTX470)は90秒で1360 samples/pixel (15.1 samples/pixel/sec)
>>363(GTX480×2)は941秒で16000 samples/pixel (17.0 samples/pixel/sec)
あまり速くなってないな
0365325
垢版 |
2010/06/19(土) 05:57:58ID:eKWh5h4Z
今、470gtxで16000samplesまで回してみたけど、1068秒で終わった。
スピード的に>>363は1台分の480しか効いてないみたいだね・・・(´・ω・`)
0366325
垢版 |
2010/06/19(土) 06:09:00ID:eKWh5h4Z
でも、>>361>>363を比べると2倍になってるからmultiになってるっぽいよねぇ。
あと考えられる原因は、当方のCPUはQ6600@3.0GHz(4コア)なんだけど
CPUの違い(4コアと2コア)で差が出たのかなぁ?・・・(´・ω・`)
0367325
垢版 |
2010/06/19(土) 06:32:06ID:eKWh5h4Z
今、CPUを2CPUのみ有効にしてやってみても1072秒でほとんど変わらなかった。・・・(´・ω・`)
0368325
垢版 |
2010/06/19(土) 08:45:32ID:eKWh5h4Z
ちなみに当方はwin7Ulti 64bit 8GBです。
ビデオカードのドライバは257.21_desktop_win7_winvista_64bit_international_whql
0370363
垢版 |
2010/06/19(土) 21:30:37ID:FVTrKtnp
再度検証した所、1枚で>>363と同じ時間でレンダリング完了。

結論「SLIを有効にするとmultiではなくhalfになる」ふざけろ

設定がよくないのか…うーん。
0372363
垢版 |
2010/06/20(日) 22:09:17ID:dBAkKNbp
>>371
どうやら問題なく並列動作可能なようです。
ttp://up2.iyhoo.net/up/download/1277039214.png
その処理能力を一つにまとめたいんですけど…。
0373名無しさん@お腹いっぱい。
垢版 |
2010/06/21(月) 03:18:03ID:nk1GbHNP
GPUが主流になってレンダが早くなるのはいいけど
今のドライヤーみたいなグラボ何個もつけなきゃならなくなるのは嫌だなあ
0374371
垢版 |
2010/06/22(火) 18:19:44ID:3PifDbUi
>>372
現在のCUDAには2つのデバイス(GPU)間でメモリーを直接コピーする機能がないので
ちょこっと工夫しないと、処理能力をまとめるが難しいんですよねー

ソフトがうまく対応するように要望出して待つしかないですよ。
0381名無しさん@お腹いっぱい。
垢版 |
2010/07/02(金) 12:04:06ID:Vi+FOkzz
だって静止画でレンダリング速くしたいとか甘えだろ。
世の中にはもっとシビアに時間と戦ってる人がいるのに。
0385名無しさん@お腹いっぱい。
垢版 |
2010/07/13(火) 08:18:40ID:6VrRI6ig
         ____
        /      \    
       /ノ  \    \
      / /゚\  /゚\    \
    |   (__人__)        | ウボッウボボボボッガビビビビッ
     \  .` ⌒´|'|      / パネェパネェッッッッッッッッwwww
     ノ     .U     \
0389名無しさん@お腹いっぱい。
垢版 |
2010/07/21(水) 17:57:45ID:zxbG+MVh
GTX460 1Gメモリ版でやった
ttp://journal.mycom.co.jp/articles/2010/07/12/gf104/index.html
ここみると、そんなに差がでると思えないんだけど 
値段分の差が出ちゃってる

OCしてみるか
0390名無しさん@お腹いっぱい。
垢版 |
2010/07/29(木) 01:45:54ID:ZlVMrRch
SLG (SmallLuxGPU) v1.6beta2
中のバッチファイルでサンプルシーンをレンダできる
俺のPCではCPUコア3つ、GPUの使用率50%で動いてた

32bit
http://www.luxrender.net/release/slg/slg-v1.6beta2.tgz

64bit
http://www.luxrender.net/forum/download/file.php?id=9526
要:http://www.luxrender.net/forum/download/file.php?id=8144


What's new 1.6beta2:

* added a comand to the telnet interface to redefine a material;
* recursion replaced with iterative traversal for SPPM kd-trees (quite faster);
* SPPM eye pass work is now split over multiple threads;
* batch.periodicsave property now works even in no batch mode;
* added telnet support for all scene.camera.* properties;
* Chiaroscuro's patch for windows always-on-top option;
* first SPPM eye pass work is split among multiple thread too;
* the CPU and GPU work in SPPM is now asynchronous;
* added support for scene.infinitelight.gain, scene.infinitelight.shift, scene.skylight.gain, scene.skylight.turbidity, scene.sunlight.dir, scene.sunlight.relsize, scene.sunlight.turbidity to the telnet interface;
* added support for portals to SPPM;
* First working MQBVH kernel: instances support (on NVIDIA, ATI compiler still crash);
* Added Alloy material;
* updated to latest Chiaroscuro's Blender exporter;
0394名無しさん@お腹いっぱい。
垢版 |
2010/08/08(日) 11:40:51ID:Bs0QY8Ae
グラボのメモリって具体的に何が関係してくるの?
ベンチや極端に負荷がかかるゲームでもないかぎり
512MBも1GBも大差ないと聞いたけど
レンダラだと1GBと2GBだとかなり違う?
レンダが止まるのはメモリーの影響大きい?
無知ですまん
0395名無しさん@お腹いっぱい。
垢版 |
2010/08/09(月) 22:40:49ID:tRD8HTbA
CUDAだとVRAMがメインのメモリみたいになる
VRAM搭載以上のデータは扱えない
にxNromalの焼付けでハイポリのサイズがでかすぎてメモリ不足エラーが出る
0396名無しさん@お腹いっぱい。
垢版 |
2010/08/09(月) 23:01:28ID:jAbtazHn
ターボキャッシュみたいに
メインメモリの領域をVRAMの延長みたいに予約するのは
無理なん?今って標準でそうじゃなく?
0397名無しさん@お腹いっぱい。
垢版 |
2010/08/12(木) 11:36:24ID:piYhP9H7
GPU<->メインメモリ間の受け渡しがどれだけ遅いかわかってますか
VRAMに乗り切らないデータをメインメモリから参照しようとすうと、GPUを死ぬほど待たせることになる
0398名無しさん@お腹いっぱい。
垢版 |
2010/08/12(木) 16:32:25ID:3ppQ7wOJ
Mayaでポリゴンのデータを全部GPUで扱うことによって
Nurbusとか使ったハイポリのアニメーションも快適になるらしいな
レンダラよりこのへんも浸透してほしい
0400名無しさん@お腹いっぱい。
垢版 |
2010/08/21(土) 09:21:16ID:vhtH3aqw
Intelのララビーが成功してればそうしやすいMBの規格とか出てたかもな
VGAを冷却しやすいスペース配置とか
0408名無しさん@お腹いっぱい。
垢版 |
2010/09/15(水) 00:20:33ID:63Q7w8KT
付くのはirayじゃない?
irayはカスタムシェーダーが使えないようなことが書いてあった気がする

だから建築やプロダクト関係以外はメンタレのGPU版が出て欲しいんだと思う
0417名無しさん@お腹いっぱい。
垢版 |
2010/11/01(月) 17:19:20ID:qq6W2RNY
CUDAが改善されてる開発向けの261.0ドライバ試したけどLuxGPU(OpenCL)も速くなってる
Ray/secが1825kだったところが2033kになって稼働率が97.7%から75%に低くなって
余力すらある感じだ
0421名無しさん@お腹いっぱい。
垢版 |
2010/11/18(木) 20:19:13ID:W/CjoLJT
SmallLuxGpuで旧世代のグラボ比較したら、
GeForce9600GTよりRADEON HD4670のほうが3倍くらい性能良かった
加えて画面更新間隔を50msにすると、
HD4670は元の8割くらいの速度なんだけど、9600GTは5割くらい。
割り込みに弱い印象だった。

LuxRenderは0.8からOpenCLでGPGPU対応するけど、レンダ性能だけみるとRADEONが良さそうだ。
0422421
垢版 |
2010/11/18(木) 21:16:31ID:W/CjoLJT
書き込みしたあとに417読んで、263.06ベータ入れてみたら劇的に改善したわ。
画面更新感覚50msでも8割くらい出てる。
全体的にHD4670=9600GTくらいにはなった。
0424@1127
垢版 |
2010/12/04(土) 17:52:07ID:DspklJB6
質問:GPUの稼働率ってどうやれば分かりますか?
ちゃんと動いてるのかどうか知りたいです。
0438名無しさん@お腹いっぱい。
垢版 |
2011/10/28(金) 21:20:50.15ID:Uf9SSmCF
そこのレンダーファームよりTesla一つのほうが速い件
0445名無しさん@お腹いっぱい。
垢版 |
2011/12/08(木) 22:45:16.74ID:JV/JOZcn
まあ完成度上がれば上がるほど価格も上がるけどな
Maxwellだって最初は確か一万円台じゃなかったっけ。
0446名無しさん@お腹いっぱい。
垢版 |
2011/12/18(日) 06:07:31.38ID:yhIEzwTV
また,NVIDIAは同時に,「CUDAプラットフォームのオープン化」を明言し,LLVMベースとなるCUDAコンパイラのソースコードを研究者やツールベンダーに公開している。

要するに,NVIDIAのGPUでしか利用できなかったCUDA環境が,ほかのCPUやGPUに広がっていく可能性が出てきたのだ。たとえば,CPUや,それこそRadeonなどの他社製GPUでもCUDAを利用できる可能性が出てきたわけで,CUDAの標準化をさらに推し進める起爆剤となり得るのである

4Gamer.net
http://www.4gamer.net/games/076/G007660/20111214033/
0449名無しさん@お腹いっぱい。
垢版 |
2011/12/28(水) 18:06:36.19ID:K8G/edUP
買ったけどアクチベーションでエラーが出る。
スタンドアロンも買わないといかんのか?これ
0453名無しさん@お腹いっぱい。
垢版 |
2013/04/10(水) 18:15:09.76ID:z6qhtOAU
CUDA5をインストールする際に、現行バージョンよりも低いバージョンのグラフィックドライバーが強制的にインストールされたのですが
あくまで安定版という位置付けであって、最新のドライバへ変更しても相性などの不具合がない限りCUDAが使えなくなるといった事にはなりませんよね?

つまり何が聞きたいかというと「ドライバーを最新版に更新しても大丈夫ですか?」
レスを投稿する


ニューススポーツなんでも実況