【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
2014/11/20(木) 23:14:46.66ID:jr3oZn27
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
2016/02/04(木) 23:21:52.01ID:zdF89aL0
いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん
2016/02/04(木) 23:28:29.99ID:3r7tJtQx
深層学習がはやったらGPGPUももっと市民権を得るかな?
2016/02/05(金) 00:42:53.10ID:TcXSJNY1
半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ
2016/02/05(金) 01:21:13.26ID:p946S2WD
>>339
>ゲームで倍精度なんて使わないじゃん


団子!
お前はインテルスレとワッチョイIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ
2016/02/05(金) 04:09:45.89ID:iPwofUfz
倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>341
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。


住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。
2016/02/05(金) 07:52:28.94ID:X6eE9Wue
すまんがゲーマーは帰ってくれないか?
345デフォルトの名無しさん
垢版 |
2016/02/05(金) 08:26:49.67ID:23YXKvG1
なぜ団子がここにいる?

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。
346デフォルトの名無しさん
垢版 |
2016/02/05(金) 08:45:35.15ID:bTIbnCX4
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
2016/02/05(金) 08:50:46.42ID:KXdvQQGq
1スレ目に三色団子おるな
348デフォルトの名無しさん
垢版 |
2016/02/05(金) 12:16:48.26ID:bTIbnCX4
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&;d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー(GPU)と同様、SIMD(single instruction multiple data)などから成る
プロセッサー・エレメント(PE)を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

 作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
2016/02/05(金) 12:55:11.71ID:p946S2WD
>>346
だからお前はインテルスレに帰れっつってんだろ団子!
350デフォルトの名無しさん
垢版 |
2016/02/05(金) 13:02:33.01ID:bTIbnCX4
また病気か
2016/02/05(金) 13:44:39.13ID:p946S2WD
>>350
倍精度イラネ、ここは管スレだぞ!と言ってたのはお前だったのか、団子!
2016/02/05(金) 14:31:20.41ID:3SvgNTFs
団子ってなに?
2016/02/05(金) 14:36:57.91ID:3a93fntK
どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね
2016/02/05(金) 16:33:49.39ID:3vmCyKKd
倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに
2016/02/05(金) 16:34:59.76ID:3vmCyKKd
バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい
356デフォルトの名無しさん
垢版 |
2016/02/05(金) 16:48:34.33ID:bTIbnCX4
ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
2016/02/05(金) 23:50:50.50ID:TcXSJNY1
はやく4倍精度のせろ!
2016/02/06(土) 12:36:05.76ID:pRi/vsC+
それをPEZYに言ってくれ
2016/02/06(土) 18:18:06.14ID:xHoLN9eE
お前その会社好きだな
一般向けに売ってもいないのに
2016/02/06(土) 20:15:07.20ID:pRi/vsC+
PEZY以外に応じてくれないぞ
2016/02/06(土) 20:47:57.74ID:xHoLN9eE
それでそこの製品は使ってるのか?
2016/02/08(月) 05:05:55.45ID:z0FWqNRt
いい加減にないものねだりはやめろ。
2016/02/08(月) 22:05:16.73ID:ZbGdhM32
「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ
2016/02/08(月) 22:24:56.08ID:lyi6FC/t
もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ?
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな
2016/02/09(火) 00:34:13.76ID:LI1PJjMq
>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。
2016/02/09(火) 13:10:44.06ID:i8FfOnoz
>>364
あなたはどこの大学ですか?
2016/02/09(火) 14:10:52.05ID:rPxo0Z4x
最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎!って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は
2016/02/09(火) 17:12:26.87ID:CgzlKX4i
そこそこの分解能ならTeslaやTitanで十分だろ
369デフォルトの名無しさん
垢版 |
2016/02/09(火) 17:14:02.43ID:uHp67F+7
べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無
2016/02/09(火) 17:32:39.26ID:i8FfOnoz
登場かな
2016/02/09(火) 18:40:55.41ID:OHQNRB+7
nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる
2016/02/09(火) 19:05:34.27ID:Z0SOCsIU
でも他GPUでは使えないんでしょ?ってのが重すぎる
GPGPUはnvidiaの私物ではない
2016/02/09(火) 19:07:27.62ID:dBPqK+gq
まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな
2016/02/09(火) 19:15:52.47ID:CgzlKX4i
>>372
黎明期はデファクトスタンダードの取り合いだから当然の流れ
2016/02/09(火) 19:20:58.08ID:OHQNRB+7
>>372
よそが勝手に投げ出しただけじゃん
2016/02/09(火) 19:27:05.49ID:C4h+tGmi
>>372
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん?
2016/02/09(火) 19:32:42.77ID:OHQNRB+7
dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を1とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな
2016/02/09(火) 20:43:41.18ID:YFSBhYG5
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk
2016/02/09(火) 21:14:42.66ID:q4H41fNH
米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという
2016/02/09(火) 21:20:54.23ID:IR1D3KHq
単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。
2016/02/09(火) 21:34:25.12ID:DH+vdKhf
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな
2016/02/09(火) 21:47:11.85ID:SI3uOwiZ
どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが
2016/02/09(火) 22:14:14.05ID:5ErhaZ8p
今日は団子がいっぱいいるなあ
384デフォルトの名無しさん
垢版 |
2016/02/10(水) 00:25:10.96ID:u83LBvNZ
倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない
2016/02/10(水) 00:37:19.11ID:ZwcaN/9X
団子分身の術か
もうここもワッチョイの時期かね?
2016/02/10(水) 00:56:31.15ID:pL5WuRkY
だから団子ってなんだよ?
2016/02/10(水) 01:41:12.63ID:JsTfqJoq
団子は団子。
2016/02/10(水) 02:29:40.13ID:FSPq21yA
amd信者っていう精神病患ってるよな
2016/02/10(水) 08:25:30.16ID:gHO8h5ZQ
倍精度ハードフル実装マンセー

トランジスタが増える

ウエハ1枚あたりのチップ採れる数が減る(&歩止まり率も減る)

製造コスト上がる

(,,・´∀`・,,)
2016/02/10(水) 08:35:12.26ID:IPR+3W8l
倍精度の話しないと死んじゃう人は点呼取ってくれる?
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。
391デフォルトの名無しさん
垢版 |
2016/02/10(水) 08:39:26.22ID:5rSlusQ0
バカはhello worldから始めなさい
2016/02/10(水) 08:48:59.74ID:gHO8h5ZQ
件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ
393デフォルトの名無しさん
垢版 |
2016/02/10(水) 08:57:23.58ID:5rSlusQ0
まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど
2016/02/10(水) 12:31:36.49ID:zvpoME6O
何とか倍精度不要論に持っていこうと必死な団子でした
2016/02/10(水) 12:36:21.64ID:qcpMLBSZ
アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ
2016/02/10(水) 13:03:35.72ID:VS1+7AWR
>>390
団子だけ隔離出来れば良い
2016/02/10(水) 23:12:49.82ID:7x9wHVqL
>>393
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね


EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ?
2016/02/10(水) 23:48:08.15ID:pL5WuRkY
ここだけの話
K10はシェールガス探査特化モデルだよ
2016/02/10(水) 23:52:02.41ID:7x9wHVqL
倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね
2016/02/11(木) 03:51:57.10ID:Q8jkKaXt
eyerissはgpuじゃなくdl専用
2016/02/11(木) 09:23:41.72ID:pqlF/R5A
団子は倍精度に親でも殺されたか?
2016/02/11(木) 09:24:20.60ID:pqlF/R5A
豚に真珠
団子に倍精度
2016/02/11(木) 09:27:55.02ID:qHP8+I1C
>>399に答えてね
2016/02/11(木) 09:37:09.50ID:qHP8+I1C
俺は必要だっていう人の言い分は理解してるし
それに合わせたチップを選べばいいと思うのだけどね

倍精度ハードウェアがTeslaはともかく一般消費者向けのGeForceに
載らないといけない理由はない
一般消費者が倍精度のスループットを見てGPUを選ぶトレンドを作りたいなら
まずてめえが倍精度載せる価値のあるソフト作って示せばいい
2016/02/11(木) 13:14:12.26ID:Dgt4YBtM
科学技術演算に倍精度は必要不可欠

はい論破完了
簡単だったね
406デフォルトの名無しさん
垢版 |
2016/02/11(木) 13:23:19.60ID:U2ZcAFvs
へー
それって
一般消費者向けの
GeForceに?
2016/02/11(木) 13:27:04.20ID:yn/CS7EG
一般消費者が科学技術計算する必要あることがまったく示せていない
2016/02/11(木) 13:28:21.16ID:pqlF/R5A
豚に真珠
団子に倍精度
409デフォルトの名無しさん
垢版 |
2016/02/11(木) 13:35:33.57ID:U2ZcAFvs
あたまわるそう
2016/02/11(木) 13:37:15.86ID:Dgt4YBtM
ここは何スレだったっけ?
単発団子よ
411デフォルトの名無しさん
垢版 |
2016/02/11(木) 13:39:04.93ID:U2ZcAFvs
また病気か?
2016/02/11(木) 13:42:27.10ID:yn/CS7EG
TSMCのウェハ価格体系的に用途別に倍精度が削れる用途向けには削ったほうが
コストダウンになるからそうするでしょうよ

Maxwell世代のTeslaがないのは大型スパコン案件もないからっての大きいと思う
2016/02/11(木) 13:45:25.92ID:yn/CS7EG
>>410
お前理解してないから出てけよ
414デフォルトの名無しさん
垢版 |
2016/02/11(木) 13:47:41.45ID:U2ZcAFvs
Tesla M40「・・・」
Teala M4 「・・・」
2016/02/11(木) 13:56:21.86ID:yn/CS7EG
すまん、倍精度版ね
2016/02/11(木) 15:18:50.25ID:FNR4nKd2
今年の流行語大賞は売精奴
2016/02/11(木) 17:25:56.22ID:R5nKPKgb
普通に考えて一般向けGPUに倍精度はいらないよな
32bitと16bit浮動小数点しか使わねーよ
それでも贅沢なぐらい
2016/02/11(木) 18:10:05.08ID:0bpwaMQp
ほんとそれ
一般向けとしてはオーバースペックなくらい
2016/02/11(木) 18:51:28.54ID:pqlF/R5A
団子がいっぱい
2016/02/11(木) 20:13:55.90ID:Dgt4YBtM
駄目だ、団子の性でここも腐ってきた
2016/02/11(木) 21:01:08.64ID:yn/CS7EG
だからお前の発言のどこが論破なんだよ

論理破綻の略か?
2016/02/12(金) 02:22:44.00ID:m8Kq2x0U
シールズ脳
2016/02/12(金) 13:14:15.71ID:10CGBYPs
ここがCUDAスレだと何度言えば分かるんだ!団子
科学技術演算も出来ないGPUじゃ話にならんわ
2016/02/12(金) 17:49:19.72ID:igghQz0I
まあ、倍精度じゃないと、イタレーティブソルバーは収束しないわな。4倍精度ぐらいあれは、CG法で反復回数が極端に減るかもね。
2016/02/12(金) 20:54:47.44ID:okDGKGY+
売性奴
2016/02/12(金) 21:37:49.48ID:ws+NUeAo
風俗業みたいな書き方だな
2016/02/12(金) 22:41:27.77ID:10CGBYPs
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ
2016/02/12(金) 22:42:28.23ID:okDGKGY+
じゃあ倍精度使ってんの?
2016/02/12(金) 22:42:32.12ID:7+E8+eHE
100倍精度くらいいるな
2016/02/12(金) 22:43:21.37ID:7+E8+eHE
倍精度なんて普通に使う
水や空気のように
2016/02/13(土) 00:10:37.29ID:KZpZDJLQ
ただし、グラフィックスには要らない
432デフォルトの名無しさん
垢版 |
2016/02/13(土) 00:16:44.75ID:X+VeUhDc
@No double precision, no life.
ADouble precision make me happy.
2016/02/13(土) 00:47:18.16ID:vQuqpgIG
ここではMaxwellやPascalはおよびじゃない
2016/02/13(土) 00:48:53.57ID:dx+PFg0T
CUDAをなんのために使うかだよなあ。
グラフィックスだけならOPENGLだけでええんのとちゃうか?
2016/02/13(土) 00:54:32.58ID:LMFsV4x8
>>427
だったら何
そんなのはGPUであつかう問題じゃないから
2016/02/13(土) 01:59:47.65ID:KZpZDJLQ
GPUはグラフィックスを扱うのが本分なので
一般向けGPUは倍精度無しでも文句は言えない
2016/02/13(土) 05:22:35.21ID:zAv3sSPP
BSD! BSD! BSD!
2016/02/13(土) 11:28:45.10ID:EDACvSC3
>>436
お前の文句なんかどうでもいい
GPGPUってのはこういうことのために使うんだぜ!?団子

-----------------------------------------------------------------------
645 : 名無しのひみつ@転載は禁止2016/02/12(金) 22:56:12.20 ID:oUDSwd87
>>626
別に2ちゃんだから適当に幾らでも変なことでも聞いていいんじゃね?

人間の頭で考えないと絶対にダメな部分が最も大きい

相対論も標準理論も量子力学も計算機だけでは絶対無理

計算機が答を出すというより、計算機は望遠鏡とか温度計のような「測定器の一種」という感覚が近いと思う

GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり

スパコンに関してはそれ自体がすごいというより、スパコン目当てに優秀な人が集まる効果のほうが大事という気がする、2020年のオリンピックみたいにスパコンという祭りに人が集まるから、良い方にも悪い方にも転ぶだろう
646 : 名無しのひみつ@転載は禁止2016/02/12(金) 22:57:56.72 ID:eXgf7vm3
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況