【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

**デフォルトの名無しさん** · 2014/11/20(木) 23:14:46.66

このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/

**デフォルトの名無しさん** · 2016/02/01(月) 12:33:46.47

こうなったらこのスレの住人が声を上げて、PEZYに倍々精度のMPUを造ってもらおうよ
もうNVは金輪際倍精度に手を出さないよ

**デフォルトの名無しさん** · 2016/02/01(月) 14:17:42.51

倍精度が必要な要件って
例えば何があるんだ？
2.0e+38を超えるスケールで
2.0e-38以下の誤差を必要とするプロジェクト？
そんなのあんの？
そりゃー誤差が小さくなれば
破綻する可能性は減るけどさ
おたくらが求めてるのってそれだけじゃねえの？

**デフォルトの名無しさん** · 2016/02/01(月) 14:48:07.70

いらん
DNNではな

**デフォルトの名無しさん** · 2016/02/01(月) 14:59:29.79

>>296
でもシミュレーションにGPGPU使ってる人いるだろ
たいして速度でないのに倍精度でやってんのか
xeon phi使った方が良さそう

**デフォルトの名無しさん** · 2016/02/01(月) 15:05:12.00

>>300
指数分の大きさではなくて仮数部の大きさ(幅)だよね。
仮数部の幅分大きさの違う数値を加減算すると0を加減算したのと同じになると思うけど。

**デフォルトの名無しさん** · 2016/02/01(月) 15:07:09.85

増分解法では致命的になる場合あり。

**デフォルトの名無しさん** · 2016/02/01(月) 15:07:56.23

装置もんで数万枚/日のリアルタイム画像処理に使ってるけど、普通にdoubleが使えると楽なんだけどな。
速度も考慮すると大きい数と小さい数の計算前、画像処理の前後でdouble、float変換してるからCPU圧迫してくる。
でも、シンプルで意図した通りに動くからCUDAは組みやすい。
んー、この辺がジレンマだな。

**デフォルトの名無しさん** · 2016/02/01(月) 15:44:31.42

それは倍精度が必要な理由になってないような
やっぱ盲信が多そうだな

**デフォルトの名無しさん** · 2016/02/01(月) 16:07:14.05

>>299
そこの製品一般人で買えるルートあんのかよ

**デフォルトの名無しさん** · 2016/02/01(月) 18:24:22.88

大きな行列の計算、FFT、急峻なカーブの音声フィルター、レイトレーシング、物理シミュレーション、空間認識、...
倍精度以上の精度が必要な用途はいろいろとある

単精度のハードで倍精度相当の演算をすると、十数倍の時間がかかる
倍精度のハードで4倍精度相当の演算も同様に十数倍
多倍長演算も倍精度や4倍精度ハードがあれば、単精度よりもずっと速く計算が可能

**デフォルトの名無しさん** · 2016/02/01(月) 18:32:19.85

簡単な画像フィルターや音声フィルターなら単精度でいいし、ディープラーニングなら半精度でも良かったりする

半精度～4倍精度までのハードがあるのが一番なんだけど

倍精度演算ハードがあれば単精度も同じ速度で計算が可能だが、単精度のハードで倍精度相当の演算をするには十数倍の時間がかかる
ゲーム用途など、単精度を使うことがはっきりしてる時じゃなければ倍精度を積んでおくのが無難

4倍精度はさすがにGPUに積むのは規模が大きくなりすぎるが、CPUには積んで欲しい
半精度は、単精度との変換だけでとりあえずは良い

**デフォルトの名無しさん** · 2016/02/01(月) 20:19:15.33

http://www.4gamer.net/games/251/G025177/20160105002/
http://www.4gamer.net/games/251/G025177/20160105002/
＞また，Huang氏が示したスライドで，第2世代Maxwellアーキテクチャベースの「GeForce GTX TITAN X」とDrive PX 2を比較すると，
＞単精度浮動小数点演算性能は前者が7TFLOPSなのに対して後者は8TFLOPSと，
＞劇的には高速化していない点も気になった。

↓その一方で…
＞ちなみにHuang氏は，Drive PX 2の性能指標として，ディープラーニング処理の演算性能を示す
＞「DL TOPS」を示しているが，これだとデュアルPascalはGeForce GTX TITAN Xの3倍以上というスコアになっている。

これ、完全にゲーム特化とビッグデータ特化GPUじゃん、Pascalwwwwww
俺の言ったとおりもう科学技術GPGPUはオワコンなんだよ
完全に半精度依存、完全にワットパフォーマンス/描画特化GPU路線だはwwwwww 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)

**デフォルトの名無しさん** · 2016/02/01(月) 21:46:57.46

>>309
倍精度乗算器の回路コストは単精度の約4倍

**デフォルトの名無しさん** · 2016/02/01(月) 22:30:54.71

バカが住み着いてる

**デフォルトの名無しさん** · 2016/02/01(月) 22:58:36.28

実際に業務で使ってる人は倍精度で運用してるのか？

**デフォルトの名無しさん** · 2016/02/01(月) 23:10:33.37

>>311
まあ純粋に乗算器だけでいえばそうだけど...

>>310
半精度はさすがにゲームでも足りない
半精度専用GPUなんて出ない
少なくともPC用には

**デフォルトの名無しさん** · 2016/02/01(月) 23:17:23.47

>>313
業務っていろいろあるが
おれの範疇は単精度、倍精度、疑似4倍精度、多倍長といろいろ
多倍長も、筆算レベルからカラツバ、DFTレベルとさまざま
もちろん普通のレジスタサイズの整数演算も
特殊なジャンルであることは否定しない

**デフォルトの名無しさん** · 2016/02/01(月) 23:19:49.62

半精度もIEEE754じゃない独自フォーマットなら使った事はあるが、使った事があるって程度

**デフォルトの名無しさん** · 2016/02/01(月) 23:27:26.75

>>314
>半精度はさすがにゲームでも足りない

そんなこと分かるかよ
HDRで16bit浮動小数点フォーマットとか普通に使うだろ
メモリ帯域が半分で済むんだぞ
ゲームなんか正確さより速さ優先だから、色を表現するのに16bitで十分な場合がほとんどだろ

**デフォルトの名無しさん** · 2016/02/02(火) 01:51:42.07

だから違うよ
使ったことがあるかじゃねーよ
何でその精度が必要なのかってところよ
4倍精度とか軽々しく言うが
このスケールが本当にわかってるのか
疑わしいぜ

**デフォルトの名無しさん** · 2016/02/02(火) 03:08:21.02

4倍精度とか専用ハード作れとしか言いようがない
汎用品に求めるものじゃない

**デフォルトの名無しさん** · 2016/02/02(火) 12:53:46.97

>>314
よく嫁
Pascalは基本混合精度
PK104は単精度と半精度の混合
PK100は倍精度の混合らしいが、多分これはテスラ新シリーズとして販売だと思う

もうグラボ価格の倍精度CUDA組はむりぽ

>>319
もうPEZYにお願いするしかないよ、倍々精度
これはマジでそう思ってる
逆を言えば理研＝PEZYの特殊HPCはそこしか生き残りが出来ないのではないか

どうしてもというならARMカスタムとか

倍精度はNVはもうだめぽだから、AMDに期待するしかない

**デフォルトの名無しさん** · 2016/02/02(火) 13:17:56.85

混合精度って単精度と半精度が両方載ってるって事だよな

仮に1個の演算器の回路規模が1:3として、演算器の回路比率を1:1にし、単精度は半精度の演算も出来るとすると、すべて単精度にした場合に比べて演算器の数は単精度が半分で単精度が2倍か

単精度2倍のインパクトよりも単精度半分のインパクトの方が大きい気がする

**デフォルトの名無しさん** · 2016/02/02(火) 14:24:13.48

完全にグラフィックス描画効率/深層学習向けの構成だね
データ地獄になるから広帯域メモリも必要になるがHBM規格はAMDが握っているために、（HBM2の）開発が遅れた
GDDR5＋を急遽導入する事になったのはそのため

このスレだとDX12とかVulkanとか一言口にするだけで「スレチガイだ馬鹿！」と怒鳴る奴がいるが、
これは全てが絡み合っている

DX12とVulkanという二つのローレベルAPIがAMD中心による策定である以上、これらのローレベルAPIへの依存を避ける
ワットパフォーマンスGPUに経営路線の舵を切るの必然

**デフォルトの名無しさん** · 2016/02/02(火) 15:52:24.40

>>322
スレチガイだ馬鹿！

**デフォルトの名無しさん** · 2016/02/02(火) 20:33:43.42

>>322
そのすごいAMDでお前はどんなGPGPUソフト/プログラム作っていいるんだ？

**デフォルトの名無しさん** · 2016/02/02(火) 21:22:14.45

cudaだっつうに

hsaスレでやってろ
馬鹿

**デフォルトの名無しさん** · 2016/02/02(火) 22:08:37.37

雑談は楽しいけど、ここCUDAスレやで
amdの話をするなってことじゃなく、スレチ話をいつまですんねんってこと

**デフォルトの名無しさん** · 2016/02/02(火) 22:41:10.14

Visual Studio 2015対応になるのはいつですかねぇ

**デフォルトの名無しさん** · 2016/02/03(水) 12:08:39.46

>>324　>>325
自演乙
わざわざ自作板から出張ご苦労様

**デフォルトの名無しさん** · 2016/02/03(水) 12:56:39.94

バカな上の病気なんだな

**デフォルトの名無しさん** · 2016/02/03(水) 14:19:34.04

Pasacalこけそうで危機感いっぱいだは

**デフォルトの名無しさん** · 2016/02/03(水) 22:25:31.36

だはｗ

**,,・´∀｀・,,）っ-○○○** · 2016/02/03(水) 22:25:59.26

TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ

**デフォルトの名無しさん** · 2016/02/04(木) 13:10:48.29

>>332
お前が使い方を知らないだけ

**デフォルトの名無しさん** · 2016/02/04(木) 13:11:30.26

>>332
お前は半精度だけで十分

**デフォルトの名無しさん** · 2016/02/04(木) 18:29:53.21

Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな

**デフォルトの名無しさん** · 2016/02/04(木) 20:00:25.29

単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。

**デフォルトの名無しさん** · 2016/02/04(木) 20:13:21.23

Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし

**デフォルトの名無しさん** · 2016/02/04(木) 20:15:36.92

FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる

**,,・´∀｀・,,）っ-○○○** · 2016/02/04(木) 23:21:52.01

いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん

**デフォルトの名無しさん** · 2016/02/04(木) 23:28:29.99

深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？

**デフォルトの名無しさん** · 2016/02/05(金) 00:42:53.10

半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ

**デフォルトの名無しさん** · 2016/02/05(金) 01:21:13.26

>>339
＞ゲームで倍精度なんて使わないじゃん

団子！
お前はインテルスレとﾜｯﾁｮｲIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ

**デフォルトの名無しさん** · 2016/02/05(金) 04:09:45.89

倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>341
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。

**デフォルトの名無しさん** · 2016/02/05(金) 07:52:28.94

すまんがゲーマーは帰ってくれないか？

**デフォルトの名無しさん** · 2016/02/05(金) 08:26:49.67

なぜ団子がここにいる？

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。

**デフォルトの名無しさん** · 2016/02/05(金) 08:45:35.15

いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から

**デフォルトの名無しさん** · 2016/02/05(金) 08:50:46.42

1スレ目に三色団子おるな

**デフォルトの名無しさん** · 2016/02/05(金) 12:16:48.26

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&;d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。

**デフォルトの名無しさん** · 2016/02/05(金) 12:55:11.71

>>346
だからお前はインテルスレに帰れっつってんだろ団子！

**デフォルトの名無しさん** · 2016/02/05(金) 13:02:33.01

また病気か

**デフォルトの名無しさん** · 2016/02/05(金) 13:44:39.13

>>350
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！

**デフォルトの名無しさん** · 2016/02/05(金) 14:31:20.41

団子ってなに？

**デフォルトの名無しさん** · 2016/02/05(金) 14:36:57.91

どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね

**デフォルトの名無しさん** · 2016/02/05(金) 16:33:49.39

倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに

**デフォルトの名無しさん** · 2016/02/05(金) 16:34:59.76

バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい

**デフォルトの名無しさん** · 2016/02/05(金) 16:48:34.33

ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html

**デフォルトの名無しさん** · 2016/02/05(金) 23:50:50.50

はやく4倍精度のせろ！

**デフォルトの名無しさん** · 2016/02/06(土) 12:36:05.76

それをPEZYに言ってくれ

**デフォルトの名無しさん** · 2016/02/06(土) 18:18:06.14

お前その会社好きだな
一般向けに売ってもいないのに

**デフォルトの名無しさん** · 2016/02/06(土) 20:15:07.20

PEZY以外に応じてくれないぞ

**デフォルトの名無しさん** · 2016/02/06(土) 20:47:57.74

それでそこの製品は使ってるのか？

**デフォルトの名無しさん** · 2016/02/08(月) 05:05:55.45

いい加減にないものねだりはやめろ。

**,,・´∀｀・,,）っ-○○○** · 2016/02/08(月) 22:05:16.73

「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ

**,,・´∀｀・,,）っ-○○○** · 2016/02/08(月) 22:24:56.08

もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな

**デフォルトの名無しさん** · 2016/02/09(火) 00:34:13.76

>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。

**デフォルトの名無しさん** · 2016/02/09(火) 13:10:44.06

>>364
あなたはどこの大学ですか？

**デフォルトの名無しさん** · 2016/02/09(火) 14:10:52.05

最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は

**デフォルトの名無しさん** · 2016/02/09(火) 17:12:26.87

そこそこの分解能ならTeslaやTitanで十分だろ

**デフォルトの名無しさん** · 2016/02/09(火) 17:14:02.43

べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無

**デフォルトの名無しさん** · 2016/02/09(火) 17:32:39.26

登場かな

**デフォルトの名無しさん** · 2016/02/09(火) 18:40:55.41

nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる

**デフォルトの名無しさん** · 2016/02/09(火) 19:05:34.27

でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない

**デフォルトの名無しさん** · 2016/02/09(火) 19:07:27.62

まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな

**デフォルトの名無しさん** · 2016/02/09(火) 19:15:52.47

>>372
黎明期はデファクトスタンダードの取り合いだから当然の流れ

**デフォルトの名無しさん** · 2016/02/09(火) 19:20:58.08

>>372
よそが勝手に投げ出しただけじゃん

**デフォルトの名無しさん** · 2016/02/09(火) 19:27:05.49

>>372
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？

**デフォルトの名無しさん** · 2016/02/09(火) 19:32:42.77

dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな

**デフォルトの名無しさん** · 2016/02/09(火) 20:43:41.18

>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk

**デフォルトの名無しさん** · 2016/02/09(火) 21:14:42.66

米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという

**デフォルトの名無しさん** · 2016/02/09(火) 21:20:54.23

単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。

**デフォルトの名無しさん** · 2016/02/09(火) 21:34:25.12

>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな

**,,・´∀｀・,,）っ-○○○** · 2016/02/09(火) 21:47:11.85

どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが

**デフォルトの名無しさん** · 2016/02/09(火) 22:14:14.05

今日は団子がいっぱいいるなあ

**デフォルトの名無しさん** · 2016/02/10(水) 00:25:10.96

倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない

**デフォルトの名無しさん** · 2016/02/10(水) 00:37:19.11

団子分身の術か
もうここもワッチョイの時期かね？

**デフォルトの名無しさん** · 2016/02/10(水) 00:56:31.15

だから団子ってなんだよ？

**デフォルトの名無しさん** · 2016/02/10(水) 01:41:12.63

団子は団子。

**デフォルトの名無しさん** · 2016/02/10(水) 02:29:40.13

amd信者っていう精神病患ってるよな

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 08:25:30.16

倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)

**デフォルトの名無しさん** · 2016/02/10(水) 08:35:12.26

倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。

**デフォルトの名無しさん** · 2016/02/10(水) 08:39:26.22

バカはhello worldから始めなさい

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 08:48:59.74

件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ

**デフォルトの名無しさん** · 2016/02/10(水) 08:57:23.58

まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど

**デフォルトの名無しさん** · 2016/02/10(水) 12:31:36.49

何とか倍精度不要論に持っていこうと必死な団子でした

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 12:36:21.64

アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ

**デフォルトの名無しさん** · 2016/02/10(水) 13:03:35.72

>>390
団子だけ隔離出来れば良い

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 23:12:49.82

>>393
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？

**デフォルトの名無しさん** · 2016/02/10(水) 23:48:08.15

ここだけの話
K10はシェールガス探査特化モデルだよ

**,,・´∀｀・,,）っ-○○○** · 2016/02/10(水) 23:52:02.41

倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね