このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。
CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone
関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50
前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
2014/11/20(木) 23:14:46.66ID:jr3oZn27
2016/02/23(火) 17:44:18.03ID:U0HFk1NZ
スパコン案件の有無が倍精度版の有無を決めるというのは間違いないようで
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
http://vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html
とりあえずTesla購入予定の方は何も心配いらないということです
悔しがるのはTeslaが買えない貧乏研究者とAMD厨だけでいいですよ
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
http://vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html
とりあえずTesla購入予定の方は何も心配いらないということです
悔しがるのはTeslaが買えない貧乏研究者とAMD厨だけでいいですよ
655デフォルトの名無しさん
2016/02/23(火) 18:53:40.49ID:NTXFP2zz 研究者しか倍精度を使わないと思ってるところが団子クオリティー
2016/02/23(火) 19:57:44.93ID:U0HFk1NZ
↑ね、 この負け犬クオリティ
2016/02/23(火) 19:59:57.59ID:U0HFk1NZ
GeForceは個人用のGPUであって倍精度で科学技術演算のためのものじゃないんですよ
倍精度の性能に正規の対価を払おうとしない悪質ユーザーの梯子を外されたからって
何が問題なんですかねえ
倍精度の性能に正規の対価を払おうとしない悪質ユーザーの梯子を外されたからって
何が問題なんですかねえ
2016/02/23(火) 20:14:34.27ID:U0HFk1NZ
倍精度ユニットの実装コストはロハではないので
メインで使う単精度の演算性能向上や電力効率の改善に振ったほうが
大多数のユーザーのためなんですよ
実質TeslaをGeForceの価格で売れと言ってるような倍精度乞食の言葉に
耳を傾ける必要はないのデス
メインで使う単精度の演算性能向上や電力効率の改善に振ったほうが
大多数のユーザーのためなんですよ
実質TeslaをGeForceの価格で売れと言ってるような倍精度乞食の言葉に
耳を傾ける必要はないのデス
659デフォルトの名無しさん
2016/02/23(火) 21:11:07.44ID:NTXFP2zz 単精度布教はいいからCUDAについて書けよ
660デフォルトの名無しさん
2016/02/23(火) 22:13:43.75ID:/ZAu7LIh NGにしてるから何かいてあるか知らないけど、どうせ相手にする価値がないことは>>659
から読み取れるw
このスレは研究者もヲチしてるだろうから言っておくけど、もうNVは倍精度は捨てるね
Felmi時代とは大違い
DirectX12(ウィンドウズ10)になるとAMDだけがローレベルAPIの恩恵に与れることを知ってるから、
Maxwell世代で素早くGPGPU切りの変わり身を演じた
今後は半精度と単精度の混合GPUばかりでCUDAはどんどん腐ってくるw
から読み取れるw
このスレは研究者もヲチしてるだろうから言っておくけど、もうNVは倍精度は捨てるね
Felmi時代とは大違い
DirectX12(ウィンドウズ10)になるとAMDだけがローレベルAPIの恩恵に与れることを知ってるから、
Maxwell世代で素早くGPGPU切りの変わり身を演じた
今後は半精度と単精度の混合GPUばかりでCUDAはどんどん腐ってくるw
661デフォルトの名無しさん
2016/02/23(火) 22:47:19.86ID:oMRN0TkA 恥ずかしいやつだなこいつ
662デフォルトの名無しさん
2016/02/23(火) 23:01:37.48ID:/ZAu7LIh663デフォルトの名無しさん
2016/02/23(火) 23:20:55.12ID:zq7ECeNv >>660
なんかAMDが勝ち組でNVが負け組の様に書いてあるけど、実際は真逆だよ
AMDはゲーム機でなんとか持ちこたえてる状況で、NVはDL特需で歴史的な好況
GPGPUはCUDAがデファクトになりつつあるからAMDはほぼ詰んでる
まぁ、先の事は判らないけどね。
なんかAMDが勝ち組でNVが負け組の様に書いてあるけど、実際は真逆だよ
AMDはゲーム機でなんとか持ちこたえてる状況で、NVはDL特需で歴史的な好況
GPGPUはCUDAがデファクトになりつつあるからAMDはほぼ詰んでる
まぁ、先の事は判らないけどね。
664デフォルトの名無しさん
2016/02/23(火) 23:23:55.28ID:oMRN0TkA >>662
お前みたいな負け犬アム厨が自作PC板から出てこなきゃ平和なんだけど
お前みたいな負け犬アム厨が自作PC板から出てこなきゃ平和なんだけど
665デフォルトの名無しさん
2016/02/24(水) 12:20:01.56ID:Ad4bERAY666デフォルトの名無しさん
2016/02/24(水) 12:31:29.64ID:dk01eTkb 倍精度の行方なら団子がソース付きで書いたけどね
結局NVIDIAがHPCから撤退なんてのは出鱈目な言いがかりと
結局NVIDIAがHPCから撤退なんてのは出鱈目な言いがかりと
667デフォルトの名無しさん
2016/02/24(水) 12:47:40.23ID:dk01eTkb ほれ
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
http://vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html
そらあんだけのシェアとエンプラ向けの大躍進あればコンシューマ向けとHPC向けで
それぞれに合わせた演算ユニット構成のカスタマイズ費用くらい捻出できるだろう
そしてここはAMDについて語るスレでもNVIDIAをネガキャンするスレでもない
誰が場所をわきまえていないのか自覚したら?
NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
http://vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html
そらあんだけのシェアとエンプラ向けの大躍進あればコンシューマ向けとHPC向けで
それぞれに合わせた演算ユニット構成のカスタマイズ費用くらい捻出できるだろう
そしてここはAMDについて語るスレでもNVIDIAをネガキャンするスレでもない
誰が場所をわきまえていないのか自覚したら?
668デフォルトの名無しさん
2016/02/24(水) 12:47:59.45ID:jB1Q2gHg669デフォルトの名無しさん
2016/02/24(水) 12:58:31.02ID:jXa1RnbL 浮動小数点数の精度なんて
コード組む側からすればどれも一緒だよ
倍精度だと収束するが
単精度だと発散するとか
それ単にコードの質が悪いだけだしね
何がそんなに気になるのかわからん
コード組む側からすればどれも一緒だよ
倍精度だと収束するが
単精度だと発散するとか
それ単にコードの質が悪いだけだしね
何がそんなに気になるのかわからん
670デフォルトの名無しさん
2016/02/24(水) 13:10:46.14ID:kxdU4ZHF >>669
えっ???
えっ???
671デフォルトの名無しさん
2016/02/24(水) 13:17:56.21ID:dk01eTkb FireProがHPC向けでまったといっていいほど使われないのは
分岐粒度が荒過ぎて実効でスペックの半分も出ないとか
特定用途向けの商用ライブラリが用意されてないのか
それ以前の問題としてランタイムが頻繁にクラッシュするとか
結局のところトータルの問題なんだよね
単精度特化の一般のGPUで多倍精度使う場合は遅い倍精度を使うより
単精度DFTのほうがはるかに速い
分岐粒度が荒過ぎて実効でスペックの半分も出ないとか
特定用途向けの商用ライブラリが用意されてないのか
それ以前の問題としてランタイムが頻繁にクラッシュするとか
結局のところトータルの問題なんだよね
単精度特化の一般のGPUで多倍精度使う場合は遅い倍精度を使うより
単精度DFTのほうがはるかに速い
672デフォルトの名無しさん
2016/02/24(水) 14:12:53.97ID:s8sb75Sy 中小企業や個人開発のプログラムにもCUDA開発の無償支援してくれる
そういう実績があるからCUDAが鉄板になってるわけで
そういうことをやったためしもなければ大赤字でやれる予算も割けないAMDに
期待できることは何一つとしてない、これが現実
うちの商品はほぼ整数しか使わないだから倍精度実数が速いかどうかなんて
微塵も関係ない
そういう実績があるからCUDAが鉄板になってるわけで
そういうことをやったためしもなければ大赤字でやれる予算も割けないAMDに
期待できることは何一つとしてない、これが現実
うちの商品はほぼ整数しか使わないだから倍精度実数が速いかどうかなんて
微塵も関係ない
673デフォルトの名無しさん
2016/02/24(水) 14:34:29.38ID:Ad4bERAY 糞団子はコテ使ってると相手してくれないから寂しくて単発コテはずし作戦に出たのか?
NVはどう考えても半精度中心のグラフィックス/深層学習中心に経営資源をシフトしてるんだがw
http://ascii.jp/elem/000/001/046/1046956/index-3.html
>Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
>Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
↑
大事な事だから二度言うぞ
>つまりPK100は半精度浮動小数点をサポートするが、PK104はこれをサポートしない(あるいは回路を持たない)可能性がある。
↑
プロセスルール次第だが半精度に重心を置いていることは明白だな
NVはどう考えても半精度中心のグラフィックス/深層学習中心に経営資源をシフトしてるんだがw
http://ascii.jp/elem/000/001/046/1046956/index-3.html
>Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
>Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
↑
大事な事だから二度言うぞ
>つまりPK100は半精度浮動小数点をサポートするが、PK104はこれをサポートしない(あるいは回路を持たない)可能性がある。
↑
プロセスルール次第だが半精度に重心を置いていることは明白だな
674デフォルトの名無しさん
2016/02/24(水) 14:41:47.70ID:Ad4bERAY half2floatをPascalでは強化していくから、結局AMD対NVの戦いは「half2float」の描画特化対
「Async」の戦いになっていくんだろうね
「Async」の戦いになっていくんだろうね
675デフォルトの名無しさん
2016/02/24(水) 14:51:49.40ID:NAMaIKUn 今後この馬鹿に一切かまうな
かまうから喜んで荒らし続ける
かまうから喜んで荒らし続ける
676デフォルトの名無しさん
2016/02/24(水) 15:33:36.04ID:jXa1RnbL どっかのニュースのコピペばかりで
うんざりするよ
自分の引き出しは空だと言っているようなものだ
うんざりするよ
自分の引き出しは空だと言っているようなものだ
677デフォルトの名無しさん
2016/02/24(水) 17:46:05.30ID:l0DrHc2T678デフォルトの名無しさん
2016/02/24(水) 17:50:58.28ID:jXa1RnbL 一般利用でCUDAが何に使えるのか
ネタ出せよ
ゲームで使えんの?
ネタ出せよ
ゲームで使えんの?
679デフォルトの名無しさん
2016/02/24(水) 17:55:56.67ID:Ad4bERAY >>677
お前はAMDに一番興味あるだろうが糞団子!
お前が去ればこのスレは一気にクリーンになるんだよボケ
お前が一番危機感抱いてるのは倍精度をなくす方向のNVに対して非難が集中する事だけだ
だからこそお前が一番イラネーんだよ屑
お前はAMDに一番興味あるだろうが糞団子!
お前が去ればこのスレは一気にクリーンになるんだよボケ
お前が一番危機感抱いてるのは倍精度をなくす方向のNVに対して非難が集中する事だけだ
だからこそお前が一番イラネーんだよ屑
680デフォルトの名無しさん
2016/02/24(水) 18:44:53.08ID:l0DrHc2T >>679
お前病院行けよw
お前病院行けよw
681デフォルトの名無しさん
2016/02/24(水) 18:55:34.70ID:Ad4bERAY >>680
糞団子よヒヨッたなw
糞団子よヒヨッたなw
682デフォルトの名無しさん
2016/02/24(水) 21:04:29.34ID:Nmttufaz683デフォルトの名無しさん
2016/02/24(水) 22:15:50.14ID:teBWCRhn 団子よりヤバイ真性のキチガイが団子以外も団子に見えているらしい。
684デフォルトの名無しさん
2016/02/24(水) 22:27:56.59ID:zahm20jW 団子消えろ
685デフォルトの名無しさん
2016/02/24(水) 22:37:00.33ID:l5BeTFuC686デフォルトの名無しさん
2016/02/24(水) 22:56:49.71ID:teBWCRhn >>671
分岐粒度が荒すぎってCPUとの比較なら未だしも、NVIDIAとの比較だったら普通そんなに差は出ないぞ。
差が出るのは64のうち前半もしくは後半の32がほぼ埋まっているのに、反対の32が完全に空みたいな状況が頻発する場合だけ。
まあCUDAからのベタ移植ならあり得ないこともないのだろうが。
分岐粒度が荒すぎってCPUとの比較なら未だしも、NVIDIAとの比較だったら普通そんなに差は出ないぞ。
差が出るのは64のうち前半もしくは後半の32がほぼ埋まっているのに、反対の32が完全に空みたいな状況が頻発する場合だけ。
まあCUDAからのベタ移植ならあり得ないこともないのだろうが。
687デフォルトの名無しさん
2016/02/25(木) 08:17:21.70ID:qdgy2oNb プログラムの話しようぜ
そうすれば団子その他プログラム書けない人が消えるだろうから
そうすれば団子その他プログラム書けない人が消えるだろうから
688デフォルトの名無しさん
2016/02/25(木) 08:22:03.55ID:qdgy2oNb689デフォルトの名無しさん
2016/02/25(木) 08:23:54.24ID:YDhqTq2/ 将来的に4にするっていこうだが
実行レベルでは
warpは32のままだろうけど
実行レベルでは
warpは32のままだろうけど
690デフォルトの名無しさん
2016/02/25(木) 13:05:41.93ID:FCdE8jm8691デフォルトの名無しさん
2016/02/25(木) 14:04:40.68ID:Sn2492Ux >>690
まずお前がコテつけてくれ
まずお前がコテつけてくれ
692デフォルトの名無しさん
2016/02/25(木) 14:47:28.30ID:Ey2CZbRS 不用意に3dfxとか使うと歳がばれるぞ
693デフォルトの名無しさん
2016/02/25(木) 17:48:12.65ID:8lu6Pire694デフォルトの名無しさん
2016/02/25(木) 18:22:40.32ID:Ey2CZbRS 好きなんだろ
恋だよ恋
恋だよ恋
695デフォルトの名無しさん
2016/02/25(木) 19:23:25.50ID:JdxelD2D 糞団子もイカスミも同レベル
696デフォルトの名無しさん
2016/02/25(木) 19:39:25.49ID:tc7lGvfi 団子が消えれば平和になる
697デフォルトの名無しさん
2016/02/25(木) 19:52:29.05ID:JdxelD2D 団子既に消えてるじゃん?
イカスミが煽るから戻って来るんだよ
イカスミが煽るから戻って来るんだよ
698デフォルトの名無しさん
2016/02/25(木) 20:58:58.26ID:qdgy2oNb 誰だよイカスミって
699デフォルトの名無しさん
2016/02/25(木) 23:01:45.88ID:OUVaT1r5 nvidia ってC++AMPって力いれてるの?
CUDAが主力なのはわかるんだが。
OpenMPのようにC++AMPがいいところまでいってからtoolkitにマージするつもりなのか
それともC++AMPが自然消滅するのを待っているのかわからん。
CUDAが主力なのはわかるんだが。
OpenMPのようにC++AMPがいいところまでいってからtoolkitにマージするつもりなのか
それともC++AMPが自然消滅するのを待っているのかわからん。
700デフォルトの名無しさん
2016/02/25(木) 23:56:26.32ID:y8R9vLq22016/02/25(木) 23:58:06.25ID:VFYZCeUD
C++ AMPは事実上終了したよ
MSはいまNVIDIA ThrustをベースにしたParrarel STLに注力中
MSはいまNVIDIA ThrustをベースにしたParrarel STLに注力中
2016/02/26(金) 00:00:42.44ID:au4AtN7W
Pallarel STLね
703デフォルトの名無しさん
2016/02/26(金) 00:04:42.12ID:sfGjrhZB >>693
NVはC++AMPとか言うより倍精度をボリュームゾーンから外しにかかってるな
Pascalには全く期待できんよ
IBMの場合は大口契約だから安く調達するだろうけど、それだけ
いずれGPGPU用(テスラ)は値段を上げざるを得ないだろうなあ
NVはC++AMPとか言うより倍精度をボリュームゾーンから外しにかかってるな
Pascalには全く期待できんよ
IBMの場合は大口契約だから安く調達するだろうけど、それだけ
いずれGPGPU用(テスラ)は値段を上げざるを得ないだろうなあ
704デフォルトの名無しさん
2016/02/26(金) 00:18:06.49ID:XrDeqd+8 それなら死んでないでしょう。
スラストがCUDA用のライブラリと同様に
C++AMPで使うためのものだろうから。
スラストがCUDA用のライブラリと同様に
C++AMPで使うためのものだろうから。
2016/02/26(金) 00:46:50.10ID:au4AtN7W
Pallarel STLのバックエンドはC++AMPに限らずOpenACCやOpenMP(4.0), TBBでもいい
NVIDIAが推してるのはOpenACC, IntelはOpenMP
NVIDIAが推してるのはOpenACC, IntelはOpenMP
706デフォルトの名無しさん
2016/02/26(金) 00:49:09.70ID:jDU7chRF707デフォルトの名無しさん
2016/02/26(金) 01:09:31.01ID:puLBdTvq >>702
ミス指摘してさらにひどくミスすんなって
ミス指摘してさらにひどくミスすんなって
2016/02/26(金) 01:13:08.03ID:au4AtN7W
parallelサーセンwwwww
709デフォルトの名無しさん
2016/02/26(金) 01:36:18.43ID:1N9hBdg9 >>703
最初の頃のテスラは円高もあり、20万位だったが、いまじゃ80万くらいになってもうた。まあA30とかは120万くらいしたんだけど。
最初の頃のテスラは円高もあり、20万位だったが、いまじゃ80万くらいになってもうた。まあA30とかは120万くらいしたんだけど。
710デフォルトの名無しさん
2016/02/26(金) 01:38:37.56ID:XrDeqd+8711デフォルトの名無しさん
2016/02/26(金) 01:42:47.55ID:XrDeqd+8712デフォルトの名無しさん
2016/02/26(金) 03:40:06.50ID:VdCPJ0Vc713デフォルトの名無しさん
2016/02/26(金) 05:22:49.16ID:YzxqLjh+ nvはpgi買収してopenaccのコンパイラも力入れてるよ
doeのエクサスケールで使うのもcudaじゃなくてopenaccだし
doeのエクサスケールで使うのもcudaじゃなくてopenaccだし
714デフォルトの名無しさん
2016/02/26(金) 05:38:13.56ID:mUz9Cfpw 「,,・´∀`・,,)っ-○○○」って鳥屋氏でしょ。
悪いけどここに同じレベルの人はいないんじゃない。
悪いけどここに同じレベルの人はいないんじゃない。
715デフォルトの名無しさん
2016/02/26(金) 07:10:07.81ID:VdCPJ0Vc 何のレベル?
716デフォルトの名無しさん
2016/02/26(金) 08:03:13.43ID:lqbLzerX イカスミが同レベル
どっちも要らない
どっちも要らない
717デフォルトの名無しさん
2016/02/26(金) 08:04:45.81ID:VdCPJ0Vc 鳥屋氏ってだ〜れ?
718デフォルトの名無しさん
2016/02/26(金) 11:35:24.33ID:J+QrFB1k NVの工作員
GPGPUはVLIW時代のATIGPUを持ち出してネガキャン
GPGPUはVLIW時代のATIGPUを持ち出してネガキャン
719デフォルトの名無しさん
2016/02/27(土) 13:53:00.79ID:VbYYT6/A 鳥屋でググるとこれが出てきた
http://potato.2ch.net/test/read.cgi/software/1205766220/
http://potato.2ch.net/test/read.cgi/software/1205766220/
2016/02/27(土) 19:58:40.83ID:WSIY1iVq
俺がいてもいなくてもCUDAプログラミングの話ができない無能集団のスレ
721デフォルトの名無しさん
2016/02/27(土) 20:22:31.94ID:VXpwyn8O 囲碁ソフトにディープラーニングが使われ始めてるんだが、
CUDA対応ソフトもそろそろ来るかもしれん。
一般人にも身近な技術になるかもね。
CUDA対応ソフトもそろそろ来るかもしれん。
一般人にも身近な技術になるかもね。
2016/02/27(土) 20:27:20.16ID:WSIY1iVq
そのうち教えられたことだけしかコーディングできないクソPGもAIにとって代わられるんだろうな
723デフォルトの名無しさん
2016/02/27(土) 22:07:54.84ID:unQVppL1 なるほど糞団子が嫌われるわけだ
724デフォルトの名無しさん
2016/02/27(土) 22:34:12.86ID:VbYYT6/A 鳥屋ってただのサンデープログラマーだからな
知ったか決めてりゃ嫌われる
知ったか決めてりゃ嫌われる
725デフォルトの名無しさん
2016/02/27(土) 23:58:13.35ID:Fq+Tn6zB726デフォルトの名無しさん
2016/02/28(日) 00:21:01.28ID:4gv2LXai2016/02/28(日) 00:32:14.81ID:5Pz55yFT
君はその名前欄に●入れてそのまま表示されるか試したことがあるかい?
2016/02/28(日) 00:34:20.80ID:lm9zk8qN
テスト
729デフォルトの名無しさん
2016/02/28(日) 00:34:46.41ID:lm9zk8qN むう、表示されんのう
730デフォルトの名無しさん
2016/02/28(日) 00:53:04.73ID:4gv2LXai 別人なのか?
,,・´∀`・,,)っ-○◎●
が持っているのは焼き鳥
で
,,・´∀`・,,)っ-○○○
が持っているのは団子
ということか
,,・´∀`・,,)っ-○◎●
が持っているのは焼き鳥
で
,,・´∀`・,,)っ-○○○
が持っているのは団子
ということか
731デフォルトの名無しさん
2016/02/28(日) 00:58:05.10ID:9kjNwUs3 鳥屋氏が両方つかってるの見たことあるから本人なんじゃない?
732デフォルトの名無しさん
2016/02/28(日) 01:03:49.87ID:4gv2LXai なら、次は,,・´∀`・,,)っ-○◎● で書き込んでくれるな
733デフォルトの名無しさん
2016/02/28(日) 01:06:06.88ID:9kjNwUs3 っていうか●が名前欄に使えなくなった経緯も知らないんじゃ、鳥屋氏のことを知らなくても無理は無いね。
734デフォルトの名無しさん
2016/02/28(日) 01:17:52.65ID:4gv2LXai735デフォルトの名無しさん
2016/02/28(日) 01:18:45.52ID:TGNAvpkz 糞団子がどんなコード書くか知らんけど、弾道計算の件でシドロモドロになった事実は消えんぞ
所詮その程度の知的レベル
所詮その程度の知的レベル
736デフォルトの名無しさん
2016/02/28(日) 01:43:25.37ID:9IJglbed >>713
速度自体は生でcudaやったほうが速いらしいから
これは開発効率を優先してPGIなのかね?
あるいは現時点ではいまいちでも今後の成長を鑑みてとかさ
さすがにdod,doeでも世代ごとのコード書き換えは負担なんだろうか
速度自体は生でcudaやったほうが速いらしいから
これは開発効率を優先してPGIなのかね?
あるいは現時点ではいまいちでも今後の成長を鑑みてとかさ
さすがにdod,doeでも世代ごとのコード書き換えは負担なんだろうか
737デフォルトの名無しさん
2016/02/28(日) 01:50:50.47ID:9IJglbed キャッシュの増量やシャッフルIA、HyperQ,DP等を全部こみこみで考えると
1コアあたりの実効性能(flaot)はfermi, keplar, maxwellと上がってると考えていいのかね?
flops/core/clockではなくてflops/coreという意味で、かつ理論値での比較ではなくていかに実測値がでるかという意味で。
1コアあたりの実効性能(flaot)はfermi, keplar, maxwellと上がってると考えていいのかね?
flops/core/clockではなくてflops/coreという意味で、かつ理論値での比較ではなくていかに実測値がでるかという意味で。
2016/02/28(日) 02:02:26.76ID:5Pz55yFT
俺は中村氏じゃねーから
2016/02/28(日) 02:05:54.35ID:5Pz55yFT
2009年当時なら団子はやっぱり団子だったぜ?
http://www.openwall.com/john/doc/CREDITS.shtml
当時書いてたのも別に変態的でもない普通のCコードですけどね
http://download.openwall.net/pub/projects/john/contrib/bitslice-des/dango.chu.jp/
http://www.openwall.com/john/doc/CREDITS.shtml
当時書いてたのも別に変態的でもない普通のCコードですけどね
http://download.openwall.net/pub/projects/john/contrib/bitslice-des/dango.chu.jp/
740デフォルトの名無しさん
2016/02/28(日) 03:07:32.07ID:9kjNwUs3741デフォルトの名無しさん
2016/02/28(日) 09:32:39.66ID:kqHim0z9 やっぱり団子って複数人いるよね?
すごく詳しい話をするとおもったら、なんか急に低レベルだったり、
てにをはが変わったりする。
すごく詳しい話をするとおもったら、なんか急に低レベルだったり、
てにをはが変わったりする。
742デフォルトの名無しさん
2016/02/28(日) 09:40:16.99ID:uncqUlBQ たまに二人の団子が会話することもあるぞ
2016/02/28(日) 11:21:05.00ID:5Pz55yFT
> あれ、中村氏もそのAAつかってなかったっけ?
なにそれ見たことない
なにそれ見たことない
744デフォルトの名無しさん
2016/02/28(日) 11:43:53.32ID:F3rkrfCl 結局鳥屋が馬鹿団子の振りしてるだけかもだが、詐欺の天才は結局馬鹿より有害
NVのやる事は何でもマンセーではスレ汚しとしか言いようがない
CS機をAMDが独占したからNVは倍精度に手を出せなくなった、と言うといつも発狂
これでは冷静な議論が出来ない
NVのやる事は何でもマンセーではスレ汚しとしか言いようがない
CS機をAMDが独占したからNVは倍精度に手を出せなくなった、と言うといつも発狂
これでは冷静な議論が出来ない
745デフォルトの名無しさん
2016/02/28(日) 11:46:36.13ID:1t5d585j おまえはcuda関係ないんだからくるなよ
かまってちゃん
かまってちゃん
2016/02/28(日) 11:51:31.77ID:5Pz55yFT
そっち界隈しばらくチェックしてなかったけど海外のハカー面白いことやってるね。
ちょうどCUDAに特化した話題だ。
MaxwellのLOP3.LUT命令を使ったビット演算の高速化テクニックについて興味ある人は
一度この講演ビデオ観ておくといいと思う。
http://www.irongeek.com/i.php?page=videos/passwordscon2014/bitslice-des-with-lop3lut-steve-thomas
実際問題AVX-512のvpternlogもLOP3.LUTと引数互換なんだわ
ぶっちゃけソース置換するだけで移植可能
ちょうどCUDAに特化した話題だ。
MaxwellのLOP3.LUT命令を使ったビット演算の高速化テクニックについて興味ある人は
一度この講演ビデオ観ておくといいと思う。
http://www.irongeek.com/i.php?page=videos/passwordscon2014/bitslice-des-with-lop3lut-steve-thomas
実際問題AVX-512のvpternlogもLOP3.LUTと引数互換なんだわ
ぶっちゃけソース置換するだけで移植可能
747デフォルトの名無しさん
2016/02/28(日) 12:03:43.36ID:F3rkrfCl >>745
鳥屋=糞団子!テメエこそCUDAの何が分かるんだボケ!
鳥屋=糞団子!テメエこそCUDAの何が分かるんだボケ!
748デフォルトの名無しさん
2016/02/28(日) 12:06:45.18ID:1t5d585j ハイハイお薬の時間でちゅよ
749デフォルトの名無しさん
2016/02/28(日) 12:18:13.04ID:F3rkrfCl 単発のお時間がきまちゅたね〜
鳥屋=糞団子が自作板からこっちのスレの巡回時間が来たみたいw
本当に鳥屋が使える天才なら2ちゃん談義なんかしねえな
10年前ならゲーム業界か、少し前なら京に関わるか
或いはアメリカでイラン向けバックドアを仕掛けるお仕事か…
どっちにしろヒマを持て余すようではお里は知れてる
鳥屋=糞団子が自作板からこっちのスレの巡回時間が来たみたいw
本当に鳥屋が使える天才なら2ちゃん談義なんかしねえな
10年前ならゲーム業界か、少し前なら京に関わるか
或いはアメリカでイラン向けバックドアを仕掛けるお仕事か…
どっちにしろヒマを持て余すようではお里は知れてる
750デフォルトの名無しさん
2016/02/28(日) 12:24:17.80ID:1t5d585j ハイハイお部屋に戻りましょうねぇ
2016/02/28(日) 12:37:00.70ID:5Pz55yFT
https://community.amd.com/thread/197348
AMDのGPUにはLOP3.LUT相当の命令がないことにユーザーからも不満が噴出しているようです
AMDのGPUにはLOP3.LUT相当の命令がないことにユーザーからも不満が噴出しているようです
752デフォルトの名無しさん
2016/02/28(日) 12:44:20.68ID:F3rkrfCl 単発でも見事につられまちゅね〜wwwww
団子=鳥屋ちゃんピンチでちゅね〜wwwwww
団子=鳥屋ちゃんピンチでちゅね〜wwwwww
753デフォルトの名無しさん
2016/02/28(日) 12:51:25.16ID:1t5d585j ハイハイご飯時間ですよおじぃちゃん
■ このスレッドは過去ログ倉庫に格納されています
