【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

**デフォルトの名無しさん** · 2014/11/20(木) 23:14:46.66

このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/

**,,・´∀｀・,,）っ-○○○** · 2016/02/04(木) 23:21:52.01

いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん

**デフォルトの名無しさん** · 2016/02/04(木) 23:28:29.99

深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？

**デフォルトの名無しさん** · 2016/02/05(金) 00:42:53.10

半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ

**デフォルトの名無しさん** · 2016/02/05(金) 01:21:13.26

>>339
＞ゲームで倍精度なんて使わないじゃん

団子！
お前はインテルスレとﾜｯﾁｮｲIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ

**デフォルトの名無しさん** · 2016/02/05(金) 04:09:45.89

倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>341
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。

**デフォルトの名無しさん** · 2016/02/05(金) 07:52:28.94

すまんがゲーマーは帰ってくれないか？

**デフォルトの名無しさん** · 2016/02/05(金) 08:26:49.67

なぜ団子がここにいる？

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。

**デフォルトの名無しさん** · 2016/02/05(金) 08:45:35.15

いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から

**デフォルトの名無しさん** · 2016/02/05(金) 08:50:46.42

1スレ目に三色団子おるな

**デフォルトの名無しさん** · 2016/02/05(金) 12:16:48.26

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&;d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。

**デフォルトの名無しさん** · 2016/02/05(金) 12:55:11.71

>>346
だからお前はインテルスレに帰れっつってんだろ団子！

**デフォルトの名無しさん** · 2016/02/05(金) 13:02:33.01

また病気か

**デフォルトの名無しさん** · 2016/02/05(金) 13:44:39.13

>>350
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！

**デフォルトの名無しさん** · 2016/02/05(金) 14:31:20.41

団子ってなに？

**デフォルトの名無しさん** · 2016/02/05(金) 14:36:57.91

どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね

**デフォルトの名無しさん** · 2016/02/05(金) 16:33:49.39

倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに

**デフォルトの名無しさん** · 2016/02/05(金) 16:34:59.76

バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい

**デフォルトの名無しさん** · 2016/02/05(金) 16:48:34.33

ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html

**デフォルトの名無しさん** · 2016/02/05(金) 23:50:50.50

はやく4倍精度のせろ！

**デフォルトの名無しさん** · 2016/02/06(土) 12:36:05.76

それをPEZYに言ってくれ

**デフォルトの名無しさん** · 2016/02/06(土) 18:18:06.14

お前その会社好きだな
一般向けに売ってもいないのに

**デフォルトの名無しさん** · 2016/02/06(土) 20:15:07.20

PEZY以外に応じてくれないぞ

**デフォルトの名無しさん** · 2016/02/06(土) 20:47:57.74

それでそこの製品は使ってるのか？

**デフォルトの名無しさん** · 2016/02/08(月) 05:05:55.45

いい加減にないものねだりはやめろ。

**,,・´∀｀・,,）っ-○○○** · 2016/02/08(月) 22:05:16.73

「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ

**,,・´∀｀・,,）っ-○○○** · 2016/02/08(月) 22:24:56.08

もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな

**デフォルトの名無しさん** · 2016/02/09(火) 00:34:13.76

>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。

**デフォルトの名無しさん** · 2016/02/09(火) 13:10:44.06

>>364
あなたはどこの大学ですか？

**デフォルトの名無しさん** · 2016/02/09(火) 14:10:52.05

最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は

**デフォルトの名無しさん** · 2016/02/09(火) 17:12:26.87

そこそこの分解能ならTeslaやTitanで十分だろ

**デフォルトの名無しさん** · 2016/02/09(火) 17:14:02.43

べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無

**デフォルトの名無しさん** · 2016/02/09(火) 17:32:39.26

登場かな

**デフォルトの名無しさん** · 2016/02/09(火) 18:40:55.41

nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる

**デフォルトの名無しさん** · 2016/02/09(火) 19:05:34.27

でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない

**デフォルトの名無しさん** · 2016/02/09(火) 19:07:27.62

まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな

**デフォルトの名無しさん** · 2016/02/09(火) 19:15:52.47

>>372
黎明期はデファクトスタンダードの取り合いだから当然の流れ

**デフォルトの名無しさん** · 2016/02/09(火) 19:20:58.08

>>372
よそが勝手に投げ出しただけじゃん

**デフォルトの名無しさん** · 2016/02/09(火) 19:27:05.49

>>372
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？

**デフォルトの名無しさん** · 2016/02/09(火) 19:32:42.77

dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな

**デフォルトの名無しさん** · 2016/02/09(火) 20:43:41.18

>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk

**デフォルトの名無しさん** · 2016/02/09(火) 21:14:42.66

米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという

**デフォルトの名無しさん** · 2016/02/09(火) 21:20:54.23

単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。

**デフォルトの名無しさん** · 2016/02/09(火) 21:34:25.12

>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな

**,,・´∀｀・,,）っ-○○○** · 2016/02/09(火) 21:47:11.85

どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが

**デフォルトの名無しさん** · 2016/02/09(火) 22:14:14.05

今日は団子がいっぱいいるなあ

**デフォルトの名無しさん** · 2016/02/10(水) 00:25:10.96

倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない

**デフォルトの名無しさん** · 2016/02/10(水) 00:37:19.11

団子分身の術か
もうここもワッチョイの時期かね？

**デフォルトの名無しさん** · 2016/02/10(水) 00:56:31.15

だから団子ってなんだよ？

**デフォルトの名無しさん** · 2016/02/10(水) 01:41:12.63

団子は団子。

**デフォルトの名無しさん** · 2016/02/10(水) 02:29:40.13

amd信者っていう精神病患ってるよな

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 08:25:30.16

倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)

**デフォルトの名無しさん** · 2016/02/10(水) 08:35:12.26

倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。

**デフォルトの名無しさん** · 2016/02/10(水) 08:39:26.22

バカはhello worldから始めなさい

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 08:48:59.74

件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ

**デフォルトの名無しさん** · 2016/02/10(水) 08:57:23.58

まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど

**デフォルトの名無しさん** · 2016/02/10(水) 12:31:36.49

何とか倍精度不要論に持っていこうと必死な団子でした

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 12:36:21.64

アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ

**デフォルトの名無しさん** · 2016/02/10(水) 13:03:35.72

>>390
団子だけ隔離出来れば良い

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 23:12:49.82

>>393
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？

**デフォルトの名無しさん** · 2016/02/10(水) 23:48:08.15

ここだけの話
K10はシェールガス探査特化モデルだよ

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 23:52:02.41

倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね

**デフォルトの名無しさん** · 2016/02/11(木) 03:51:57.10

eyerissはgpuじゃなくdl専用

**デフォルトの名無しさん** · 2016/02/11(木) 09:23:41.72

団子は倍精度に親でも殺されたか？

**デフォルトの名無しさん** · 2016/02/11(木) 09:24:20.60

豚に真珠
団子に倍精度

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 09:27:55.02

>>399に答えてね

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 09:37:09.50

俺は必要だっていう人の言い分は理解してるし
それに合わせたチップを選べばいいと思うのだけどね

倍精度ハードウェアがTeslaはともかく一般消費者向けのGeForceに
載らないといけない理由はない
一般消費者が倍精度のスループットを見てGPUを選ぶトレンドを作りたいなら
まずてめえが倍精度載せる価値のあるソフト作って示せばいい

**デフォルトの名無しさん** · 2016/02/11(木) 13:14:12.26

科学技術演算に倍精度は必要不可欠

はい論破完了
簡単だったね

**デフォルトの名無しさん** · 2016/02/11(木) 13:23:19.60

へー
それって
一般消費者向けの
GeForceに？

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 13:27:04.20

一般消費者が科学技術計算する必要あることがまったく示せていない

**デフォルトの名無しさん** · 2016/02/11(木) 13:28:21.16

豚に真珠
団子に倍精度

**デフォルトの名無しさん** · 2016/02/11(木) 13:35:33.57

あたまわるそう

**デフォルトの名無しさん** · 2016/02/11(木) 13:37:15.86

ここは何スレだったっけ？
単発団子よ

**デフォルトの名無しさん** · 2016/02/11(木) 13:39:04.93

また病気か？

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 13:42:27.10

TSMCのウェハ価格体系的に用途別に倍精度が削れる用途向けには削ったほうが
コストダウンになるからそうするでしょうよ

Maxwell世代のTeslaがないのは大型スパコン案件もないからっての大きいと思う

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 13:45:25.92

>>410
お前理解してないから出てけよ

**デフォルトの名無しさん** · 2016/02/11(木) 13:47:41.45

Tesla M40「・・・」
Teala M4 「・・・」

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 13:56:21.86

すまん、倍精度版ね

**デフォルトの名無しさん** · 2016/02/11(木) 15:18:50.25

今年の流行語大賞は売精奴

**デフォルトの名無しさん** · 2016/02/11(木) 17:25:56.22

普通に考えて一般向けGPUに倍精度はいらないよな
32bitと16bit浮動小数点しか使わねーよ
それでも贅沢なぐらい

**デフォルトの名無しさん** · 2016/02/11(木) 18:10:05.08

ほんとそれ
一般向けとしてはオーバースペックなくらい

**デフォルトの名無しさん** · 2016/02/11(木) 18:51:28.54

団子がいっぱい

**デフォルトの名無しさん** · 2016/02/11(木) 20:13:55.90

駄目だ、団子の性でここも腐ってきた

**,,・´∀｀・,,）っ-○○○** · 2016/02/11(木) 21:01:08.64

だからお前の発言のどこが論破なんだよ

論理破綻の略か？

**デフォルトの名無しさん** · 2016/02/12(金) 02:22:44.00

シールズ脳

**デフォルトの名無しさん** · 2016/02/12(金) 13:14:15.71

ここがCUDAスレだと何度言えば分かるんだ！団子
科学技術演算も出来ないGPUじゃ話にならんわ

**デフォルトの名無しさん** · 2016/02/12(金) 17:49:19.72

まあ、倍精度じゃないと、イタレーティブソルバーは収束しないわな。4倍精度ぐらいあれは、CG法で反復回数が極端に減るかもね。

**デフォルトの名無しさん** · 2016/02/12(金) 20:54:47.44

売性奴

**デフォルトの名無しさん** · 2016/02/12(金) 21:37:49.48

風俗業みたいな書き方だな

**デフォルトの名無しさん** · 2016/02/12(金) 22:41:27.77

今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ

**デフォルトの名無しさん** · 2016/02/12(金) 22:42:28.23

じゃあ倍精度使ってんの？

**デフォルトの名無しさん** · 2016/02/12(金) 22:42:32.12

100倍精度くらいいるな

**デフォルトの名無しさん** · 2016/02/12(金) 22:43:21.37

倍精度なんて普通に使う
水や空気のように

**デフォルトの名無しさん** · 2016/02/13(土) 00:10:37.29

ただし、グラフィックスには要らない

**デフォルトの名無しさん** · 2016/02/13(土) 00:16:44.75

①No double precision, no life.
②Double precision make me happy.

**デフォルトの名無しさん** · 2016/02/13(土) 00:47:18.16

ここではMaxwellやPascalはおよびじゃない

**デフォルトの名無しさん** · 2016/02/13(土) 00:48:53.57

CUDAをなんのために使うかだよなあ。
グラフィックスだけならOPENGLだけでええんのとちゃうか？

**デフォルトの名無しさん** · 2016/02/13(土) 00:54:32.58

>>427
だったら何
そんなのはGPUであつかう問題じゃないから

**デフォルトの名無しさん** · 2016/02/13(土) 01:59:47.65

GPUはグラフィックスを扱うのが本分なので
一般向けGPUは倍精度無しでも文句は言えない

**デフォルトの名無しさん** · 2016/02/13(土) 05:22:35.21

BSD!　BSD!　BSD!

**デフォルトの名無しさん** · 2016/02/13(土) 11:28:45.10

>>436
お前の文句なんかどうでもいい
GPGPUってのはこういうことのために使うんだぜ！？団子

-----------------------------------------------------------------------
645 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:56:12.20 ID:oUDSwd87
>>626
別に2ちゃんだから適当に幾らでも変なことでも聞いていいんじゃね？

人間の頭で考えないと絶対にダメな部分が最も大きい

相対論も標準理論も量子力学も計算機だけでは絶対無理

計算機が答を出すというより、計算機は望遠鏡とか温度計のような「測定器の一種」という感覚が近いと思う

GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり

スパコンに関してはそれ自体がすごいというより、スパコン目当てに優秀な人が集まる効果のほうが大事という気がする、2020年のオリンピックみたいにスパコンという祭りに人が集まるから、良い方にも悪い方にも転ぶだろう
646 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:57:56.72 ID:eXgf7vm3