【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
2014/11/20(木) 23:14:46.66ID:jr3oZn27
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
2016/02/01(月) 12:33:46.47ID:Ucvj9UOE
こうなったらこのスレの住人が声を上げて、PEZYに倍々精度のMPUを造ってもらおうよ
もうNVは金輪際倍精度に手を出さないよ
2016/02/01(月) 14:17:42.51ID:fSUYSvsK
倍精度が必要な要件って
例えば何があるんだ?
2.0e+38を超えるスケールで
2.0e-38以下の誤差を必要とするプロジェクト?
そんなのあんの?
そりゃー誤差が小さくなれば
破綻する可能性は減るけどさ
おたくらが求めてるのってそれだけじゃねえの?
2016/02/01(月) 14:48:07.70ID:iOXOBOCM
いらん
DNNではな
2016/02/01(月) 14:59:29.79ID:9fNLotPU
>>296
でもシミュレーションにGPGPU使ってる人いるだろ
たいして速度でないのに倍精度でやってんのか
xeon phi使った方が良さそう
2016/02/01(月) 15:05:12.00ID:CUSF99yG
>>300
指数分の大きさではなくて仮数部の大きさ(幅)だよね。
仮数部の幅分大きさの違う数値を加減算すると0を加減算したのと同じになると思うけど。
2016/02/01(月) 15:07:09.85ID:CUSF99yG
増分解法では致命的になる場合あり。
2016/02/01(月) 15:07:56.23ID:SiSRa9Ib
装置もんで数万枚/日のリアルタイム画像処理に使ってるけど、普通にdoubleが使えると楽なんだけどな。
速度も考慮すると大きい数と小さい数の計算前、画像処理の前後でdouble、float変換してるからCPU圧迫してくる。
でも、シンプルで意図した通りに動くからCUDAは組みやすい。
んー、この辺がジレンマだな。
2016/02/01(月) 15:44:31.42ID:fSUYSvsK
それは倍精度が必要な理由になってないような
やっぱ盲信が多そうだな
307デフォルトの名無しさん
垢版 |
2016/02/01(月) 16:07:14.05ID:oiE/5K5n
>>299
そこの製品一般人で買えるルートあんのかよ
2016/02/01(月) 18:24:22.88ID:BOcjqYcH
大きな行列の計算、FFT、急峻なカーブの音声フィルター、レイトレーシング、物理シミュレーション、空間認識、...
倍精度以上の精度が必要な用途はいろいろとある

単精度のハードで倍精度相当の演算をすると、十数倍の時間がかかる
倍精度のハードで4倍精度相当の演算も同様に十数倍
多倍長演算も倍精度や4倍精度ハードがあれば、単精度よりもずっと速く計算が可能
2016/02/01(月) 18:32:19.85ID:BOcjqYcH
簡単な画像フィルターや音声フィルターなら単精度でいいし、ディープラーニングなら半精度でも良かったりする

半精度〜4倍精度までのハードがあるのが一番なんだけど

倍精度演算ハードがあれば単精度も同じ速度で計算が可能だが、単精度のハードで倍精度相当の演算をするには十数倍の時間がかかる
ゲーム用途など、単精度を使うことがはっきりしてる時じゃなければ倍精度を積んでおくのが無難

4倍精度はさすがにGPUに積むのは規模が大きくなりすぎるが、CPUには積んで欲しい
半精度は、単精度との変換だけでとりあえずは良い
2016/02/01(月) 20:19:15.33ID:Ucvj9UOE
http://www.4gamer.net/games/251/G025177/20160105002/
http://www.4gamer.net/games/251/G025177/20160105002/
>また,Huang氏が示したスライドで,第2世代Maxwellアーキテクチャベースの「GeForce GTX TITAN X」とDrive PX 2を比較すると,
>単精度浮動小数点演算性能は前者が7TFLOPSなのに対して後者は8TFLOPSと,
>劇的には高速化していない点も気になった。

↓その一方で…
>ちなみにHuang氏は,Drive PX 2の性能指標として,ディープラーニング処理の演算性能を示す
>「DL TOPS」を示しているが,これだとデュアルPascalはGeForce GTX TITAN Xの3倍以上というスコアになっている。

これ、完全にゲーム特化とビッグデータ特化GPUじゃん、Pascalwwwwww
俺の言ったとおりもう科学技術GPGPUはオワコンなんだよ
完全に半精度依存、完全にワットパフォーマンス/描画特化GPU路線だはwwwwww 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
2016/02/01(月) 21:46:57.46ID:vs1yi7F6
>>309
倍精度乗算器の回路コストは単精度の約4倍
2016/02/01(月) 22:30:54.71ID:MibI1Q78
バカが住み着いてる
2016/02/01(月) 22:58:36.28ID:9fNLotPU
実際に業務で使ってる人は倍精度で運用してるのか?
2016/02/01(月) 23:10:33.37ID:BOcjqYcH
>>311
まあ純粋に乗算器だけでいえばそうだけど...

>>310
半精度はさすがにゲームでも足りない
半精度専用GPUなんて出ない
少なくともPC用には
2016/02/01(月) 23:17:23.47ID:BOcjqYcH
>>313
業務っていろいろあるが
おれの範疇は単精度、倍精度、疑似4倍精度、多倍長といろいろ
多倍長も、筆算レベルからカラツバ、DFTレベルとさまざま
もちろん普通のレジスタサイズの整数演算も
特殊なジャンルであることは否定しない
2016/02/01(月) 23:19:49.62ID:BOcjqYcH
半精度もIEEE754じゃない独自フォーマットなら使った事はあるが、使った事があるって程度
2016/02/01(月) 23:27:26.75ID:dRJvSEmL
>>314
>半精度はさすがにゲームでも足りない

そんなこと分かるかよ
HDRで16bit浮動小数点フォーマットとか普通に使うだろ
メモリ帯域が半分で済むんだぞ
ゲームなんか正確さより速さ優先だから、色を表現するのに16bitで十分な場合がほとんどだろ
2016/02/02(火) 01:51:42.07ID:LP8V/wwM
だから違うよ
使ったことがあるかじゃねーよ
何でその精度が必要なのかってところよ
4倍精度とか軽々しく言うが
このスケールが本当にわかってるのか
疑わしいぜ
2016/02/02(火) 03:08:21.02ID:xiUt8T5M
4倍精度とか専用ハード作れとしか言いようがない
汎用品に求めるものじゃない
2016/02/02(火) 12:53:46.97ID:ULLNmZyK
>>314
よく嫁
Pascalは基本混合精度
PK104は単精度と半精度の混合
PK100は倍精度の混合らしいが、多分これはテスラ新シリーズとして販売だと思う

もうグラボ価格の倍精度CUDA組はむりぽ

>>319
もうPEZYにお願いするしかないよ、倍々精度
これはマジでそう思ってる
逆を言えば理研=PEZYの特殊HPCはそこしか生き残りが出来ないのではないか

どうしてもというならARMカスタムとか

倍精度はNVはもうだめぽだから、AMDに期待するしかない
2016/02/02(火) 13:17:56.85ID:sWHooGm6
混合精度って単精度と半精度が両方載ってるって事だよな

仮に1個の演算器の回路規模が1:3として、演算器の回路比率を1:1にし、単精度は半精度の演算も出来るとすると、すべて単精度にした場合に比べて演算器の数は単精度が半分で単精度が2倍か

単精度2倍のインパクトよりも単精度半分のインパクトの方が大きい気がする
2016/02/02(火) 14:24:13.48ID:ULLNmZyK
完全にグラフィックス描画効率/深層学習向けの構成だね
データ地獄になるから広帯域メモリも必要になるがHBM規格はAMDが握っているために、(HBM2の)開発が遅れた
GDDR5+を急遽導入する事になったのはそのため

このスレだとDX12とかVulkanとか一言口にするだけで「スレチガイだ馬鹿!」と怒鳴る奴がいるが、
これは全てが絡み合っている

DX12とVulkanという二つのローレベルAPIがAMD中心による策定である以上、これらのローレベルAPIへの依存を避ける
ワットパフォーマンスGPUに経営路線の舵を切るの必然
2016/02/02(火) 15:52:24.40ID:MS6gBcZU
>>322
スレチガイだ馬鹿!
2016/02/02(火) 20:33:43.42ID:ubpTh4Nt
>>322
そのすごいAMDでお前はどんなGPGPUソフト/プログラム作っていいるんだ?
2016/02/02(火) 21:22:14.45ID:xseyqTiA
cudaだっつうに

hsaスレでやってろ
馬鹿
2016/02/02(火) 22:08:37.37ID:+ZIKPYce
雑談は楽しいけど、ここCUDAスレやで
amdの話をするなってことじゃなく、スレチ話をいつまですんねんってこと
2016/02/02(火) 22:41:10.14ID:NB4DG1EG
Visual Studio 2015対応になるのはいつですかねぇ
2016/02/03(水) 12:08:39.46ID:15l+1fC7
>>324 >>325
自演乙
わざわざ自作板から出張ご苦労様
329デフォルトの名無しさん
垢版 |
2016/02/03(水) 12:56:39.94ID:d3Nc4Jqw
バカな上の病気なんだな
2016/02/03(水) 14:19:34.04ID:15l+1fC7
Pasacalこけそうで危機感いっぱいだは
2016/02/03(水) 22:25:31.36ID:hEPpn7Fg
だはw
2016/02/03(水) 22:25:59.26ID:gpz71jEo
TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ
2016/02/04(木) 13:10:48.29ID:lq8BoEbf
>>332
お前が使い方を知らないだけ
2016/02/04(木) 13:11:30.26ID:lq8BoEbf
>>332
お前は半精度だけで十分
2016/02/04(木) 18:29:53.21ID:TT5D/Cpx
Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな
2016/02/04(木) 20:00:25.29ID:o+ucOEnp
単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。
2016/02/04(木) 20:13:21.23ID:d8M6zG1u
Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし
2016/02/04(木) 20:15:36.92ID:TT5D/Cpx
FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる
2016/02/04(木) 23:21:52.01ID:zdF89aL0
いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん
2016/02/04(木) 23:28:29.99ID:3r7tJtQx
深層学習がはやったらGPGPUももっと市民権を得るかな?
2016/02/05(金) 00:42:53.10ID:TcXSJNY1
半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ
2016/02/05(金) 01:21:13.26ID:p946S2WD
>>339
>ゲームで倍精度なんて使わないじゃん


団子!
お前はインテルスレとワッチョイIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ
2016/02/05(金) 04:09:45.89ID:iPwofUfz
倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>341
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。


住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。
2016/02/05(金) 07:52:28.94ID:X6eE9Wue
すまんがゲーマーは帰ってくれないか?
345デフォルトの名無しさん
垢版 |
2016/02/05(金) 08:26:49.67ID:23YXKvG1
なぜ団子がここにいる?

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。
346デフォルトの名無しさん
垢版 |
2016/02/05(金) 08:45:35.15ID:bTIbnCX4
いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
2016/02/05(金) 08:50:46.42ID:KXdvQQGq
1スレ目に三色団子おるな
348デフォルトの名無しさん
垢版 |
2016/02/05(金) 12:16:48.26ID:bTIbnCX4
http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&;d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

http://techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー(GPU)と同様、SIMD(single instruction multiple data)などから成る
プロセッサー・エレメント(PE)を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

 作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
2016/02/05(金) 12:55:11.71ID:p946S2WD
>>346
だからお前はインテルスレに帰れっつってんだろ団子!
350デフォルトの名無しさん
垢版 |
2016/02/05(金) 13:02:33.01ID:bTIbnCX4
また病気か
2016/02/05(金) 13:44:39.13ID:p946S2WD
>>350
倍精度イラネ、ここは管スレだぞ!と言ってたのはお前だったのか、団子!
2016/02/05(金) 14:31:20.41ID:3SvgNTFs
団子ってなに?
2016/02/05(金) 14:36:57.91ID:3a93fntK
どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね
2016/02/05(金) 16:33:49.39ID:3vmCyKKd
倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに
2016/02/05(金) 16:34:59.76ID:3vmCyKKd
バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい
356デフォルトの名無しさん
垢版 |
2016/02/05(金) 16:48:34.33ID:bTIbnCX4
ほとんど関係ない
http://www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
2016/02/05(金) 23:50:50.50ID:TcXSJNY1
はやく4倍精度のせろ!
2016/02/06(土) 12:36:05.76ID:pRi/vsC+
それをPEZYに言ってくれ
2016/02/06(土) 18:18:06.14ID:xHoLN9eE
お前その会社好きだな
一般向けに売ってもいないのに
2016/02/06(土) 20:15:07.20ID:pRi/vsC+
PEZY以外に応じてくれないぞ
2016/02/06(土) 20:47:57.74ID:xHoLN9eE
それでそこの製品は使ってるのか?
2016/02/08(月) 05:05:55.45ID:z0FWqNRt
いい加減にないものねだりはやめろ。
2016/02/08(月) 22:05:16.73ID:ZbGdhM32
「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ
2016/02/08(月) 22:24:56.08ID:lyi6FC/t
もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ?
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな
2016/02/09(火) 00:34:13.76ID:LI1PJjMq
>世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。
2016/02/09(火) 13:10:44.06ID:i8FfOnoz
>>364
あなたはどこの大学ですか?
2016/02/09(火) 14:10:52.05ID:rPxo0Z4x
最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎!って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は
2016/02/09(火) 17:12:26.87ID:CgzlKX4i
そこそこの分解能ならTeslaやTitanで十分だろ
369デフォルトの名無しさん
垢版 |
2016/02/09(火) 17:14:02.43ID:uHp67F+7
べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無
2016/02/09(火) 17:32:39.26ID:i8FfOnoz
登場かな
2016/02/09(火) 18:40:55.41ID:OHQNRB+7
nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる
2016/02/09(火) 19:05:34.27ID:Z0SOCsIU
でも他GPUでは使えないんでしょ?ってのが重すぎる
GPGPUはnvidiaの私物ではない
2016/02/09(火) 19:07:27.62ID:dBPqK+gq
まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな
2016/02/09(火) 19:15:52.47ID:CgzlKX4i
>>372
黎明期はデファクトスタンダードの取り合いだから当然の流れ
2016/02/09(火) 19:20:58.08ID:OHQNRB+7
>>372
よそが勝手に投げ出しただけじゃん
2016/02/09(火) 19:27:05.49ID:C4h+tGmi
>>372
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん?
2016/02/09(火) 19:32:42.77ID:OHQNRB+7
dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を1とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな
2016/02/09(火) 20:43:41.18ID:YFSBhYG5
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk
2016/02/09(火) 21:14:42.66ID:q4H41fNH
米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという
2016/02/09(火) 21:20:54.23ID:IR1D3KHq
単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。
2016/02/09(火) 21:34:25.12ID:DH+vdKhf
>ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな
2016/02/09(火) 21:47:11.85ID:SI3uOwiZ
どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが
2016/02/09(火) 22:14:14.05ID:5ErhaZ8p
今日は団子がいっぱいいるなあ
384デフォルトの名無しさん
垢版 |
2016/02/10(水) 00:25:10.96ID:u83LBvNZ
倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない
2016/02/10(水) 00:37:19.11ID:ZwcaN/9X
団子分身の術か
もうここもワッチョイの時期かね?
2016/02/10(水) 00:56:31.15ID:pL5WuRkY
だから団子ってなんだよ?
2016/02/10(水) 01:41:12.63ID:JsTfqJoq
団子は団子。
2016/02/10(水) 02:29:40.13ID:FSPq21yA
amd信者っていう精神病患ってるよな
2016/02/10(水) 08:25:30.16ID:gHO8h5ZQ
倍精度ハードフル実装マンセー

トランジスタが増える

ウエハ1枚あたりのチップ採れる数が減る(&歩止まり率も減る)

製造コスト上がる

(,,・´∀`・,,)
2016/02/10(水) 08:35:12.26ID:IPR+3W8l
倍精度の話しないと死んじゃう人は点呼取ってくれる?
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。
391デフォルトの名無しさん
垢版 |
2016/02/10(水) 08:39:26.22ID:5rSlusQ0
バカはhello worldから始めなさい
2016/02/10(水) 08:48:59.74ID:gHO8h5ZQ
件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ
393デフォルトの名無しさん
垢版 |
2016/02/10(水) 08:57:23.58ID:5rSlusQ0
まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど
2016/02/10(水) 12:31:36.49ID:zvpoME6O
何とか倍精度不要論に持っていこうと必死な団子でした
2016/02/10(水) 12:36:21.64ID:qcpMLBSZ
アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ
2016/02/10(水) 13:03:35.72ID:VS1+7AWR
>>390
団子だけ隔離出来れば良い
2016/02/10(水) 23:12:49.82ID:7x9wHVqL
>>393
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね


EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ?
2016/02/10(水) 23:48:08.15ID:pL5WuRkY
ここだけの話
K10はシェールガス探査特化モデルだよ
2016/02/10(水) 23:52:02.41ID:7x9wHVqL
倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね
■ このスレッドは過去ログ倉庫に格納されています