【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

レス数が900を超えています。1000を超えると表示できなくなるよ。
2014/11/20(木) 23:14:46.66ID:jr3oZn27
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
827デフォルトの名無しさん
垢版 |
2016/03/04(金) 02:24:38.67ID:pNMSyXd+
自覚のない荒らし
それが団子の糞風味クオリティ
2016/03/04(金) 07:49:00.48ID:o39fhgVG
>>825
何が嘘なのか具体的に示せよ
俺は具体的に示したろ
糞団子は去れ
2016/03/04(金) 07:50:34.02ID:o39fhgVG
>>826
>なぜならキャッシュはDRAMの読み書きを高速化するためにあるから
そんなパソコン教室の初日に教わる様な内容を語るスレじゃねぇよ
糞団子は去れ!
2016/03/04(金) 08:15:25.08ID:uG62vIs+
匿名で俺って言い張られてもw
2016/03/04(金) 09:40:06.12ID:sQ9JXJsj
>>830
流れが読めないなら黙ってればいいのに
2016/03/04(金) 09:48:28.02ID:/J2AWB0A
Talk me.
2016/03/04(金) 10:12:42.01ID:uG62vIs+
オレオレ、俺だよ俺
俺だよ

かまってよ

ってかw
2016/03/04(金) 11:01:16.11ID:z53XqiUN
お前つまんねぇよ
835デフォルトの名無しさん
垢版 |
2016/03/04(金) 11:46:47.03ID:pNMSyXd+
団子ちゃん悔しいだろホントはおともだちをつくってワイワイ話したいんだろ?
じゃあ自作板帰ろうな
2016/03/04(金) 12:02:03.20ID:uG62vIs+
オレオレ主張したいんならコテハンつけろよ
2016/03/04(金) 15:46:55.78ID:XhYLrWiK
俺だよ
2016/03/04(金) 19:33:33.59ID:o39fhgVG
答えに窮すると何故か匿名になる
安定の自演糞団子
2016/03/04(金) 19:39:28.79ID:dJLsGuAT
自分がやってるからって
他人もそうだと思うなよ
病気の人
2016/03/04(金) 21:27:27.28ID:nvZ+jZcm
まだやってんのかよっw。
シェアードメモリはローカルメモリだよwww。
2016/03/04(金) 21:40:33.21ID:qzn/KKB0
方言のない一般名称でいうと「スクラッチパッドメモリ」か
842デフォルトの名無しさん
垢版 |
2016/03/04(金) 21:49:33.06ID:pNMSyXd+
ぼろ出してもコテでい続けるのは正直苦痛だろ?
















な、団子
2016/03/04(金) 22:01:24.79ID:WoARA1cN
>>840
>>818
2016/03/04(金) 23:13:53.73ID:qzn/KKB0
名無しばっかりだと不安で団子認定に必死な病気の癖に
2016/03/05(土) 04:38:45.77ID:GYxVvQjW
いい加減通常時に戻ってください
正直どっちもどっちなんだよね
どっちも邪魔
2016/03/05(土) 07:19:08.49ID:dgmAi0Ww
マジで糞団子は去ってくれ
嫌われてるの自覚しろ
2016/03/05(土) 07:44:33.94ID:I9HpfPeT
コテの人はいい加減ブログでもなんでも始めたらいいよ
荒らし行為だよ

コテ煽る人もやめてよ
2016/03/05(土) 09:30:50.56ID:pYtkFW+i
団子さん
お願いです。
あなたが来てからこのスレは機能しなくなりました。
ここは数少ないCUDAの情報交換の場です。
もう、ここに来ないで下さい。
2016/03/05(土) 09:48:51.08ID:7wCpFrY5
実際の荒しは倍精度、精神病の人ですけどね
2016/03/05(土) 10:46:20.52ID:we9m+Baq
こいつ一人が団子団子連呼してて
すげー気持ちわりーよ
2016/03/05(土) 10:51:01.60ID:7wCpFrY5
好きなんだろ
付き合っちゃいなよ
852デフォルトの名無しさん
垢版 |
2016/03/05(土) 11:18:09.46ID:nqZZ4Fac
最近は傷心の団子をおもちゃにするうんこごっこが流行ってるのか?
2016/03/05(土) 11:20:03.53ID:7wCpFrY5
いいえ
精神病の人をどうバカにするかが流行ってます
2016/03/05(土) 14:14:59.66ID:oAjMaO0h
つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。
2016/03/05(土) 15:25:30.62ID:PxQJKL1y
>>849
団子はある程度(正しいかは別にして)技術的話が出来るけど、
その人はAMDは倍精度がすごいよ、GPGPUの勝者はAMDで決まり!と
I love 団子だけだからな。
856デフォルトの名無しさん
垢版 |
2016/03/05(土) 16:26:59.56ID:nqZZ4Fac
あんまり団子をおもちゃにするなって
ウンコの匂いが充満するじゃないかw
857デフォルトの名無しさん
垢版 |
2016/03/05(土) 16:43:06.41ID:hF4tqJh9
こんにちは。

CUDA では、__device__ 修飾された関数は、GPU内部から呼び出せますが、
再帰コールが出来ないのはなぜですか?

以下はできますよね?

__device__ int aaa(int x) {
 return x * 2;
}

__device__ int bbb(int y) {
 return aaa(y) + 3;
}

では、以下は駄目ですか?
__device__ int kaijou(int y) {
 if ( y == 1 ) {
  return y;
 }
 else {
  return y * kaijou(y-1);
 }
}
858デフォルトの名無しさん
垢版 |
2016/03/05(土) 17:05:18.01ID:nqZZ4Fac
団子は答えなくて結構
2016/03/05(土) 17:17:05.46ID:oAjMaO0h
ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。
2016/03/05(土) 19:01:23.69ID:wCUhFShW
最適化の邪魔になるから最初から再帰はやめてねーんってことかな。
2016/03/05(土) 20:36:21.36ID:pXJbdtfw
>>858
おまえが正解答えてやれば
あれずに済むだろ
2016/03/05(土) 21:10:49.87ID:18qofrJ5
>>861
俺ならその無駄レス書いてる暇で書けるぞ>>858は無能だから理解できないだけで

>>859
CUDAの自称コアが要素毎プレディケートつきのSIMDユニットを
マルチコアって言い張ってるだけから本物の独立したコアでないから
で終わりなんだけどね。
命令ポインタは「自称コア」ごとに独立してないんだ

「分岐」も本物の分岐ではなく、if-else節を全部一列のコードに展開してプレディケート
しているだけ。プレディケートビットの全要素が0あるいは1になって初めて関数を
飛び越えることができる。

SIMDの要素(自称)ごとに命令ポインタと関数コールスタックを管理できて別々の
命令ステートを独立して持てるならそれは既にSIMDじゃない
2016/03/05(土) 21:25:15.51ID:18qofrJ5
ベクトルを隠蔽しない、1ワープを1つのスレッドとして処理できるプログラミングモデルが
提供されるなら再帰は理屈上可能
それはCPUのSIMDの在り方と同じってことだけど
2016/03/05(土) 21:53:08.36ID:LlD1+gMh
独立したコアという前提だから、コア毎のレジスタで表現できる範囲の処理しか出来ないって事だと思ってたけど違うのか。
2016/03/05(土) 22:00:09.02ID:oAjMaO0h
基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法

状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
2016/03/05(土) 22:00:10.11ID:18qofrJ5
再帰だけならCell SPUすら出来てるからね
命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう


末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど
2016/03/05(土) 22:04:28.99ID:0d+Ags99
可能な限り手を抜くのがハードにとってのGPGPUという物かも
2016/03/05(土) 22:12:52.44ID:18qofrJ5
実害は具体的にはバックトラッキング型の探索アルゴリズムが使えない
(実装方法に制限がある)とかかな
2016/03/05(土) 22:24:17.32ID:oAjMaO0h
cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。

scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。

で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。

まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
2016/03/05(土) 23:05:45.56ID:wCUhFShW
>>865
>状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく
横からですが参考になります。
再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。
871デフォルトの名無しさん
垢版 |
2016/03/06(日) 08:40:29.75ID:e28R5O2W
最近は、5,000円くらいの低価格GPUでも、Keplerコアを使っていて、
Fermiコアの上位互換だから、再帰コールも出来るのですか?

でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、
関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール
できなさそうですが。
872デフォルトの名無しさん
垢版 |
2016/03/06(日) 11:18:07.40ID:5MH1CF8G
あーあまた糞団子が答えちゃった
このスレの事情を知らん奴が見ると余計に迷うぞ
2016/03/06(日) 11:35:37.89ID:ejwavTIm
答えられないクズは存在する価値ないでしょ
とっとと失せろよゴミ
2016/03/06(日) 11:48:38.53ID:ejwavTIm
つーか俺も含めてまだ正解出してないんだけどな

んで正解はこれ、Kepler以降なら再帰に【一応は】対応
http://developer.download.nvidia.com/assets/cuda/files/CUDADownloads/TechBrief_Dynamic_Parallelism_in_CUDA.pdf

誰かツッコミ入れると思ったけど期待外れだったなあ
まあ、俺の説明も何も間違ってないのだけど
(>>862も「出来ない」という説明をしてるのではなく制約を説明しているだけ)
2016/03/06(日) 13:04:30.88ID:ZW4nksfm
確かにこの団子は鳥屋氏じゃないな。
鳥屋氏はこういう物言いはしない。
2016/03/06(日) 13:12:58.97ID:ejwavTIm
お前は、中村ちゃぷにちゃんが中身の団子が存在すると思ってるんだ
そこから既に間違ってるよ
2016/03/06(日) 13:18:27.49ID:ejwavTIm
ドァンゴが、13:18くらいを、お伝えします
2016/03/06(日) 13:20:55.68ID:ejwavTIm
ちゃぷにさんはだんごやさんを嫌ってるはずなので彼がその顔文字を使う理由はないんだよ
自分でNGキーワードに入れてる宣言してたし
2016/03/06(日) 13:22:13.40ID:ejwavTIm
更に言うと彼は精神が壊れて自作PC板で機械翻訳コピペを貼るだけの人に成り下がってしまった
880デフォルトの名無しさん
垢版 |
2016/03/06(日) 13:49:39.00ID:5MH1CF8G
団子=鳥屋でも別にいいじゃねーか
糞撒き散らすだけならどっちもNGだ
2016/03/06(日) 13:52:02.23ID:ejwavTIm
中村ちゃぷに君と一緒にしないでくれる?
2016/03/06(日) 14:37:46.02ID:ZW4nksfm
>>879
鳥屋氏に何かあったの? そっちが気になる。
2016/03/06(日) 14:39:09.93ID:ejwavTIm
>>882
だから本人に直接聞いて来いよTwitterアカウントあるだろ
2016/03/06(日) 14:42:36.51ID:ZW4nksfm
別に本人と直接連絡とれるけどなんか聞きにくいじゃん。
おしえてよ。
2016/03/06(日) 14:43:25.75ID:ejwavTIm
俺なら聞けるのか?w
デタラメ言っちゃうけど?
2016/03/06(日) 14:47:00.65ID:ZW4nksfm
本人に根掘り葉掘り聞くよりいいよ。
2016/03/06(日) 14:48:10.37ID:ejwavTIm
ちなみに彼は10年以上前から初心者の質問板で「メンヘル屋」と呼ばれてたぞ
2016/03/06(日) 23:01:58.93ID:YHBwXFpN
日曜日の真昼間に2ch張り付きかよ
さすが糞団子だな
2016/03/07(月) 07:46:57.77ID:7lblB3Ic
平日の日中ならいいのかw
890デフォルトの名無しさん
垢版 |
2016/03/07(月) 12:32:22.52ID:+p3ICmyk
頼むからNGの外に出てくるな>>889=糞団子
891デフォルトの名無しさん
垢版 |
2016/03/07(月) 17:04:45.58ID:GuUCesj8
マジで氏ねよ!ここ糞団子!!
お前のせいでスレがめちゃくちゃ!
2016/03/07(月) 19:13:33.67ID:IaXW9rhX
>>889
なんでそう思ったの?
2016/03/07(月) 21:28:52.80ID:Xyilrqi/
病気の人が召還してる
2016/03/08(火) 00:17:54.26ID:zUXR2K3c
糞団子は>>888が効いてる様だなw
2016/03/08(火) 01:03:04.66ID:4ClxYf7a
普通ジャン
2016/03/08(火) 06:06:38.08ID:sCq0/cKi
家でpcにかじり付いてる人なんだろ
病気の人は
2016/03/08(火) 07:07:19.82ID:zUXR2K3c
日曜日に一日中2chが普通なんだ
さすが糞団子
2016/03/08(火) 22:50:34.72ID:f+sFTvrc
2chやっているおっさんなら起きてから寝るまで2chが普通だろ
いまはスマホで仕事サボって2chしているおっさんが多いからな
899デフォルトの名無しさん
垢版 |
2016/03/08(火) 22:59:24.25ID:8p7AV+as
>>898
今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。
2016/03/08(火) 23:40:27.24ID:SNBHGm11
そんなにトイレが好きならドアを接着剤で止めてやろうかと思った
2016/03/09(水) 00:03:43.04ID:QI7bsFp8
平日仕事サボって2chなら、まぁわからなくも無い
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
2016/03/09(水) 00:29:18.66ID:EC2EcKU9
スマホゲーの体力ゲージ消化してるだけじゃね?
2chなんてとっくにブーム終わってるだろ
903デフォルトの名無しさん
垢版 |
2016/03/09(水) 12:01:37.54ID:Bn2mru1A
>>901
話し相手が欲しいんだよ
スレをウンコ臭くしておいて
2016/03/09(水) 17:46:55.52ID:+SKBM1r7
へえ、お前、寂しがり屋なんだな
2016/03/09(水) 19:21:18.15ID:QI7bsFp8
糞団子が急に大人しくなって笑える
かなり効いた様だなw
2016/03/09(水) 19:28:24.12ID:n0++16X2
かまってちゃん
907デフォルトの名無しさん
垢版 |
2016/03/09(水) 21:45:15.09ID:Bn2mru1A
コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
2016/03/09(水) 22:07:10.45ID:F7KphU9Z
そんなにかまってほしいのか
2016/03/09(水) 22:13:39.55ID:QI7bsFp8
それはお前だろ
さっきからチョロチョロウザい
2016/03/09(水) 22:45:09.81ID:F7KphU9Z
おまえがそれを言うのか
2016/03/10(木) 00:12:27.45ID:lJwnXkdm
なんだ
やっぱり、かまってちゃんか?
2016/03/10(木) 05:26:45.85ID:ElNFIbXj
っ鏡
2016/03/10(木) 20:04:24.43ID:lJwnXkdm
いや、朝の5時から鏡出されても…
2016/03/10(木) 22:07:55.24ID:Kwch6Nj+
ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう?
2016/03/10(木) 23:24:17.96ID:36+0Q/RN
ミラーマン!
植草教授!
2016/03/11(金) 00:12:19.52ID:0VtVfbcA
はい
かまってちゃんの変な奴来ました
917デフォルトの名無しさん
垢版 |
2016/03/12(土) 13:14:03.96ID:7MrNfl0C
誰も居ない?
2016/03/14(月) 00:27:24.09ID:tMjTpPPM
糞団子が荒らして過疎ったな
ホントろくでもねぇ奴だったな
2016/03/15(火) 19:07:06.06ID:NepgFCLn
では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね?
消しても動くのでいらなさそうではあるんですけど一応残してます
2016/04/06(水) 05:42:39.04ID:b0ehB924
https://devblogs.nvidia.com/parallelforall/inside-pascal/
https://devblogs.nvidia.com/parallelforall/wp-content/uploads/2016/04/gp100_SM_diagram.png
2016/04/08(金) 23:49:33.98ID:Oe8UeTI2
>>862
この辺りからの流れはとても勉強になる
2016/04/13(水) 00:20:39.50ID:vTxSOF48
>>918
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
2016/04/13(水) 00:37:51.36ID:uE1XEE4+
レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう
2016/04/13(水) 18:30:01.95ID:P1TlabSM
言っているそばからw
2016/04/18(月) 20:53:52.86ID:npM92plo
以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
2016/04/29(金) 07:41:21.25ID:H9O34uIX
>>922
機械学習はマルチGPU
レス数が900を超えています。1000を超えると表示できなくなるよ。