このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。
CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone
関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50
前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
レス数が950を超えています。1000を超えると書き込みができなくなります。
2014/11/20(木) 23:14:46.66ID:jr3oZn27
865デフォルトの名無しさん
2016/03/05(土) 22:00:09.02ID:oAjMaO0h 基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法
状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法
状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
2016/03/05(土) 22:00:10.11ID:18qofrJ5
再帰だけならCell SPUすら出来てるからね
命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう
末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど
命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう
末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど
867デフォルトの名無しさん
2016/03/05(土) 22:04:28.99ID:0d+Ags99 可能な限り手を抜くのがハードにとってのGPGPUという物かも
2016/03/05(土) 22:12:52.44ID:18qofrJ5
実害は具体的にはバックトラッキング型の探索アルゴリズムが使えない
(実装方法に制限がある)とかかな
(実装方法に制限がある)とかかな
869デフォルトの名無しさん
2016/03/05(土) 22:24:17.32ID:oAjMaO0h cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。
scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。
で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。
まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
で結局、SIMTでプログラミングするメリットを感じなくなる。
scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。
で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。
まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
870デフォルトの名無しさん
2016/03/05(土) 23:05:45.56ID:wCUhFShW >>865
>状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく
横からですが参考になります。
再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。
>状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく
横からですが参考になります。
再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。
871デフォルトの名無しさん
2016/03/06(日) 08:40:29.75ID:e28R5O2W 最近は、5,000円くらいの低価格GPUでも、Keplerコアを使っていて、
Fermiコアの上位互換だから、再帰コールも出来るのですか?
でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、
関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール
できなさそうですが。
Fermiコアの上位互換だから、再帰コールも出来るのですか?
でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、
関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール
できなさそうですが。
872デフォルトの名無しさん
2016/03/06(日) 11:18:07.40ID:5MH1CF8G あーあまた糞団子が答えちゃった
このスレの事情を知らん奴が見ると余計に迷うぞ
このスレの事情を知らん奴が見ると余計に迷うぞ
2016/03/06(日) 11:35:37.89ID:ejwavTIm
答えられないクズは存在する価値ないでしょ
とっとと失せろよゴミ
とっとと失せろよゴミ
2016/03/06(日) 11:48:38.53ID:ejwavTIm
つーか俺も含めてまだ正解出してないんだけどな
んで正解はこれ、Kepler以降なら再帰に【一応は】対応
http://developer.download.nvidia.com/assets/cuda/files/CUDADownloads/TechBrief_Dynamic_Parallelism_in_CUDA.pdf
誰かツッコミ入れると思ったけど期待外れだったなあ
まあ、俺の説明も何も間違ってないのだけど
(>>862も「出来ない」という説明をしてるのではなく制約を説明しているだけ)
んで正解はこれ、Kepler以降なら再帰に【一応は】対応
http://developer.download.nvidia.com/assets/cuda/files/CUDADownloads/TechBrief_Dynamic_Parallelism_in_CUDA.pdf
誰かツッコミ入れると思ったけど期待外れだったなあ
まあ、俺の説明も何も間違ってないのだけど
(>>862も「出来ない」という説明をしてるのではなく制約を説明しているだけ)
875デフォルトの名無しさん
2016/03/06(日) 13:04:30.88ID:ZW4nksfm 確かにこの団子は鳥屋氏じゃないな。
鳥屋氏はこういう物言いはしない。
鳥屋氏はこういう物言いはしない。
2016/03/06(日) 13:12:58.97ID:ejwavTIm
お前は、中村ちゃぷにちゃんが中身の団子が存在すると思ってるんだ
そこから既に間違ってるよ
そこから既に間違ってるよ
2016/03/06(日) 13:18:27.49ID:ejwavTIm
ドァンゴが、13:18くらいを、お伝えします
2016/03/06(日) 13:20:55.68ID:ejwavTIm
ちゃぷにさんはだんごやさんを嫌ってるはずなので彼がその顔文字を使う理由はないんだよ
自分でNGキーワードに入れてる宣言してたし
自分でNGキーワードに入れてる宣言してたし
2016/03/06(日) 13:22:13.40ID:ejwavTIm
更に言うと彼は精神が壊れて自作PC板で機械翻訳コピペを貼るだけの人に成り下がってしまった
880デフォルトの名無しさん
2016/03/06(日) 13:49:39.00ID:5MH1CF8G 団子=鳥屋でも別にいいじゃねーか
糞撒き散らすだけならどっちもNGだ
糞撒き散らすだけならどっちもNGだ
2016/03/06(日) 13:52:02.23ID:ejwavTIm
中村ちゃぷに君と一緒にしないでくれる?
882デフォルトの名無しさん
2016/03/06(日) 14:37:46.02ID:ZW4nksfm >>879
鳥屋氏に何かあったの? そっちが気になる。
鳥屋氏に何かあったの? そっちが気になる。
2016/03/06(日) 14:39:09.93ID:ejwavTIm
>>882
だから本人に直接聞いて来いよTwitterアカウントあるだろ
だから本人に直接聞いて来いよTwitterアカウントあるだろ
884デフォルトの名無しさん
2016/03/06(日) 14:42:36.51ID:ZW4nksfm 別に本人と直接連絡とれるけどなんか聞きにくいじゃん。
おしえてよ。
おしえてよ。
2016/03/06(日) 14:43:25.75ID:ejwavTIm
俺なら聞けるのか?w
デタラメ言っちゃうけど?
デタラメ言っちゃうけど?
886デフォルトの名無しさん
2016/03/06(日) 14:47:00.65ID:ZW4nksfm 本人に根掘り葉掘り聞くよりいいよ。
2016/03/06(日) 14:48:10.37ID:ejwavTIm
ちなみに彼は10年以上前から初心者の質問板で「メンヘル屋」と呼ばれてたぞ
888デフォルトの名無しさん
2016/03/06(日) 23:01:58.93ID:YHBwXFpN 日曜日の真昼間に2ch張り付きかよ
さすが糞団子だな
さすが糞団子だな
889デフォルトの名無しさん
2016/03/07(月) 07:46:57.77ID:7lblB3Ic 平日の日中ならいいのかw
890デフォルトの名無しさん
2016/03/07(月) 12:32:22.52ID:+p3ICmyk 頼むからNGの外に出てくるな>>889=糞団子
891デフォルトの名無しさん
2016/03/07(月) 17:04:45.58ID:GuUCesj8 マジで氏ねよ!ここ糞団子!!
お前のせいでスレがめちゃくちゃ!
お前のせいでスレがめちゃくちゃ!
892デフォルトの名無しさん
2016/03/07(月) 19:13:33.67ID:IaXW9rhX >>889
なんでそう思ったの?
なんでそう思ったの?
893デフォルトの名無しさん
2016/03/07(月) 21:28:52.80ID:Xyilrqi/ 病気の人が召還してる
894デフォルトの名無しさん
2016/03/08(火) 00:17:54.26ID:zUXR2K3c 糞団子は>>888が効いてる様だなw
2016/03/08(火) 01:03:04.66ID:4ClxYf7a
普通ジャン
896デフォルトの名無しさん
2016/03/08(火) 06:06:38.08ID:sCq0/cKi 家でpcにかじり付いてる人なんだろ
病気の人は
病気の人は
897デフォルトの名無しさん
2016/03/08(火) 07:07:19.82ID:zUXR2K3c 日曜日に一日中2chが普通なんだ
さすが糞団子
さすが糞団子
898デフォルトの名無しさん
2016/03/08(火) 22:50:34.72ID:f+sFTvrc 2chやっているおっさんなら起きてから寝るまで2chが普通だろ
いまはスマホで仕事サボって2chしているおっさんが多いからな
いまはスマホで仕事サボって2chしているおっさんが多いからな
899デフォルトの名無しさん
2016/03/08(火) 22:59:24.25ID:8p7AV+as >>898
今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。
今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。
900デフォルトの名無しさん
2016/03/08(火) 23:40:27.24ID:SNBHGm11 そんなにトイレが好きならドアを接着剤で止めてやろうかと思った
901デフォルトの名無しさん
2016/03/09(水) 00:03:43.04ID:QI7bsFp8 平日仕事サボって2chなら、まぁわからなくも無い
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
2016/03/09(水) 00:29:18.66ID:EC2EcKU9
スマホゲーの体力ゲージ消化してるだけじゃね?
2chなんてとっくにブーム終わってるだろ
2chなんてとっくにブーム終わってるだろ
903デフォルトの名無しさん
2016/03/09(水) 12:01:37.54ID:Bn2mru1A904デフォルトの名無しさん
2016/03/09(水) 17:46:55.52ID:+SKBM1r7 へえ、お前、寂しがり屋なんだな
905デフォルトの名無しさん
2016/03/09(水) 19:21:18.15ID:QI7bsFp8 糞団子が急に大人しくなって笑える
かなり効いた様だなw
かなり効いた様だなw
906デフォルトの名無しさん
2016/03/09(水) 19:28:24.12ID:n0++16X2 かまってちゃん
乙
乙
907デフォルトの名無しさん
2016/03/09(水) 21:45:15.09ID:Bn2mru1A コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
908デフォルトの名無しさん
2016/03/09(水) 22:07:10.45ID:F7KphU9Z そんなにかまってほしいのか
909デフォルトの名無しさん
2016/03/09(水) 22:13:39.55ID:QI7bsFp8 それはお前だろ
さっきからチョロチョロウザい
さっきからチョロチョロウザい
910デフォルトの名無しさん
2016/03/09(水) 22:45:09.81ID:F7KphU9Z おまえがそれを言うのか
911デフォルトの名無しさん
2016/03/10(木) 00:12:27.45ID:lJwnXkdm なんだ
やっぱり、かまってちゃんか?
やっぱり、かまってちゃんか?
912デフォルトの名無しさん
2016/03/10(木) 05:26:45.85ID:ElNFIbXj っ鏡
913デフォルトの名無しさん
2016/03/10(木) 20:04:24.43ID:lJwnXkdm いや、朝の5時から鏡出されても…
914デフォルトの名無しさん
2016/03/10(木) 22:07:55.24ID:Kwch6Nj+ ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう?
Nvidiaユーザーってへんなやつ多いよね。どう?
2016/03/10(木) 23:24:17.96ID:36+0Q/RN
ミラーマン!
植草教授!
植草教授!
916デフォルトの名無しさん
2016/03/11(金) 00:12:19.52ID:0VtVfbcA はい
かまってちゃんの変な奴来ました
かまってちゃんの変な奴来ました
917デフォルトの名無しさん
2016/03/12(土) 13:14:03.96ID:7MrNfl0C 誰も居ない?
918デフォルトの名無しさん
2016/03/14(月) 00:27:24.09ID:tMjTpPPM 糞団子が荒らして過疎ったな
ホントろくでもねぇ奴だったな
ホントろくでもねぇ奴だったな
919デフォルトの名無しさん
2016/03/15(火) 19:07:06.06ID:NepgFCLn では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね?
消しても動くのでいらなさそうではあるんですけど一応残してます
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね?
消しても動くのでいらなさそうではあるんですけど一応残してます
920デフォルトの名無しさん
2016/04/06(水) 05:42:39.04ID:b0ehB924921デフォルトの名無しさん
2016/04/08(金) 23:49:33.98ID:Oe8UeTI2 >>862
この辺りからの流れはとても勉強になる
この辺りからの流れはとても勉強になる
922デフォルトの名無しさん
2016/04/13(水) 00:20:39.50ID:vTxSOF48 >>918
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
2016/04/13(水) 00:37:51.36ID:uE1XEE4+
レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう
アクセスレイテンシはでかそう
924デフォルトの名無しさん
2016/04/13(水) 18:30:01.95ID:P1TlabSM 言っているそばからw
925デフォルトの名無しさん
2016/04/18(月) 20:53:52.86ID:npM92plo 以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
926デフォルトの名無しさん
2016/04/29(金) 07:41:21.25ID:H9O34uIX >>922
機械学習はマルチGPU
機械学習はマルチGPU
927デフォルトの名無しさん
2016/04/29(金) 19:49:33.11ID:F6Ql+W8p Pascalは忘れられてるけど、倍精度も強化されてるんだよね
単精度を徹底的に削った思い切った方針には目を見張った
単精度を徹底的に削った思い切った方針には目を見張った
2016/04/29(金) 21:17:01.56ID:RuK53SvA
大型スパコン案件に特化して設計したものをGPUに流用してるだけで
それが全部だと言い張られても困りますが
それが全部だと言い張られても困りますが
929デフォルトの名無しさん
2016/04/29(金) 22:49:34.54ID:wZxrhoKH なんでおまえが困るんだよw
930デフォルトの名無しさん
2016/04/30(土) 00:41:27.46ID:oV2mml7H GPGPUは深層学習のブレークで今後一気に需要が高まる?
931デフォルトの名無しさん
2016/04/30(土) 11:52:36.46ID:xhIIf3AZ 高まるだろうね
倍精度と半精度がちょうどいい具合
そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
倍精度と半精度がちょうどいい具合
そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
932デフォルトの名無しさん
2016/04/30(土) 22:20:59.01ID:4IpkHcLg その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは
2016/04/30(土) 22:33:42.88ID:wNNJHcCv
あれはCNNに特化したものでGPUほどのプログラマビリティはない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
934デフォルトの名無しさん
2016/04/30(土) 22:45:19.47ID:tL+Fobdg CNNに特化て具体的には行列演算てこと?
2016/04/30(土) 23:20:42.71ID:wNNJHcCv
疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素
って覚えておけば大体間違いない
実はGPUの特性と正反対(GPUは密行列なら得意)
って覚えておけば大体間違いない
実はGPUの特性と正反対(GPUは密行列なら得意)
936デフォルトの名無しさん
2016/04/30(土) 23:25:48.76ID:WnEgJTfp fermi世代ってdouble⇒floatで倍速なはずだよね?
ちっとも速くならないんだが。
ちっとも速くならないんだが。
937デフォルトの名無しさん
2016/05/01(日) 05:03:39.83ID:IAB0IXGv 大分前だけど構造体でデータを渡すとdouble扱いになったことはある
原因は不明
原因は不明
938デフォルトの名無しさん
2016/05/01(日) 10:04:45.15ID:c2Ftkl1w >>937
thx。
調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。
fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
thx。
調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。
fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
939デフォルトの名無しさん
2016/05/01(日) 10:24:43.67ID:tKi6j9CT 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
h
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
h
940デフォルトの名無しさん
2016/05/01(日) 11:36:33.54ID:4G1NPxxh eyerissは大量のデーターが複数のフィルター処理されるのに向いてる
941デフォルトの名無しさん
2016/05/09(月) 19:46:40.50ID:ZKk/r1uF 質問があります
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です
#include <stdio.h>
__global__ void a(char *A){
}
int main(){
a<<1, 1>>(); // (1)
}
(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか
コンパイルに使用したコマンドは
windows
nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
(失念したが大体同じ)
です
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です
#include <stdio.h>
__global__ void a(char *A){
}
int main(){
a<<1, 1>>(); // (1)
}
(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか
コンパイルに使用したコマンドは
windows
nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
(失念したが大体同じ)
です
942デフォルトの名無しさん
2016/05/09(月) 23:47:16.41ID:+C4ZnXlR943デフォルトの名無しさん
2016/05/09(月) 23:54:10.06ID:ZKk/r1uF ああ、3重括弧でしたか
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます
944デフォルトの名無しさん
2016/05/20(金) 21:20:51.03ID:OCEBmLiZ グーグルがTensolFlow用のTPUとかいうの作ってたらしいがどうなの?
945sage
2016/05/23(月) 17:33:55.45ID:w8cwn6FF CUDA fortranで一つの配列に対して2GB以上のメモリを
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね?
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね?
946デフォルトの名無しさん
2016/05/23(月) 18:16:51.67ID:rInNNyjw >>945
何gbくらい必要なの?
何gbくらい必要なの?
947デフォルトの名無しさん
2016/05/23(月) 18:47:01.54ID:hrdyo10f >>945
fortranなんか使っているからだよ。
fortranなんか使っているからだよ。
948デフォルトの名無しさん
2016/05/23(月) 19:56:12.00ID:Y87SDCLt 32ビットの壁ってこと?
949デフォルトの名無しさん
2016/05/23(月) 22:17:34.30ID:COcpIksW CU_LIMIT_MALLOC_HEAP_SIZE か cudaLimitMallocHeapSize を拡げりゃいいんじゃないかな。
950デフォルトの名無しさん
2016/06/01(水) 19:25:08.39ID:XXwwXNx4 ttps://developer.nvidia.com/cudnn
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか?
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか?
951デフォルトの名無しさん
2016/06/03(金) 02:14:25.16ID:qw00fiPh CUDA APIで1番始めに呼んだAPIは時間がかかるとのことですが、
時間計測に影響が出ないように事前にどんな関数を呼んでますか?
慣習だったり、よく使われる関数があれば教えてください。
時間計測に影響が出ないように事前にどんな関数を呼んでますか?
慣習だったり、よく使われる関数があれば教えてください。
952デフォルトの名無しさん
2016/06/04(土) 23:09:31.90ID:EzTgQ+dX 工学じゃなくて物理系でもcuda覚える価値ってある?
953デフォルトの名無しさん
2016/06/04(土) 23:54:08.10ID:64JgiXiE 安く実験したいなら
N体や粒子法なんかは普通のCPUじゃたいしたことはできない
N体や粒子法なんかは普通のCPUじゃたいしたことはできない
954デフォルトの名無しさん
2016/06/05(日) 01:52:52.19ID:2/2r2xD9 むしろ、科学計算したい人のための技術だと思う
955デフォルトの名無しさん
2016/06/12(日) 02:11:09.53ID:F98p4y3q 他人にも聞こえんの?
956デフォルトの名無しさん
2016/06/12(日) 12:50:48.33ID:4gtPrZLr この部分がエラー吐くんだが
cuda7.5
struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};
cuda7.5
struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};
957デフォルトの名無しさん
2016/06/12(日) 13:24:56.47ID:MCoM6cvm CUDA by EXAMPLEのサンプル?
<cuComplex.h>の定義とぶつかってるんじゃね?
<cuComplex.h>の定義とぶつかってるんじゃね?
958デフォルトの名無しさん
2016/06/12(日) 13:39:51.78ID:4gtPrZLr >>957
そうそう
エラーはこんな感じ
Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed
そうそう
エラーはこんな感じ
Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed
959デフォルトの名無しさん
2016/06/12(日) 13:50:41.56ID:MCoM6cvm 試してないけど、コンストラクタに__device__付けてないのが悪いと言っているような。
960デフォルトの名無しさん
2016/06/12(日) 14:09:28.62ID:4gtPrZLr961デフォルトの名無しさん
2016/06/15(水) 14:42:46.55ID:d2Xou3GL 【GPGPU】くだすれCUDAスレ part8【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
http://echo.2ch.net/test/read.cgi/tech/1416492886/
962デフォルトの名無しさん
2016/06/15(水) 14:44:14.63ID:d2Xou3GL963デフォルトの名無しさん
2016/06/16(木) 14:11:42.71ID:hLUHI1zp 615 :名前は開発中のものです。:02/06/10 21:48 ID:???
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか?つらそー。
616 :◆CKmHzWpc:02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
1.モデルを分割するのが嫌→頂点シェーダ−を使うorシステムメモリに置いてソフトでやる
2.モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います
>>615
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか?つらそー。
616 :◆CKmHzWpc:02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
1.モデルを分割するのが嫌→頂点シェーダ−を使うorシステムメモリに置いてソフトでやる
2.モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います
>>615
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです
964デフォルトの名無しさん
2016/07/20(水) 14:03:52.95ID:S0wpPWZM tess
965デフォルトの名無しさん
2016/09/02(金) 13:17:38.94ID:W3BuWeJb erlangならね
レス数が950を超えています。1000を超えると書き込みができなくなります。
ニュース
- 【サッカー】Jリーグ観客動員が歴代最多を更新 初の「1300万人超え」達成…平均入場者数も史上最高に [尺アジ★]
- サナエノミクスについて力説 積極的な財政出動で「所得増える 消費マインド上がる 税収増える」片山さつき財務大臣 ★3 [少考さん★]
- 日中対立「着地点」見えず 中国、他国にも圧力の過去―関係悪化から1カ月 [蚤の市★]
- 日本の英語力96位から動かず AI評価で可視化された「読めるが話せない」の正体 (EF EPI 2025) ★2 [少考さん★]
- 【芸能】粗品、日本テレビに苦言 客のレベルが「かなり低い。あいつら分かってない」「拍手したいだけやねん」 [冬月記者★]
- 鈴木農相「おこめ券はお米しか買えないわけではない。例えば卵、味噌、しょうゆ、こうした購入に利用可能」 ★4 [Hitzeschleier★]
- 日本人騎手、香港カップで罰金10万香港ドル [462275543]
- 【朗報】イーロン・マスク「AIとロボットで誰も働かなくて良くなる。全員ニートで金銭も税金もないパラダイスみてぇな国を作りてえ」 [347751896]
- うまトマ食って「うまトマ〜」って言って滑ったんだが!?
- 仕事やめたいけど
- なんでネトウヨが勃起してるの? [377482965]
- 今これで全力シコってる
