【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net

1デフォルトの名無しさん2016/06/15(水) 14:41:15.11ID:d2Xou3GL
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/

76デフォルトの名無しさん2017/06/01(木) 11:43:59.76ID:o/dQD8LP
詳しくはwebで検索

77デフォルトの名無しさん2017/06/20(火) 11:52:28.52ID:IZ7YVmtC
cuspが疎行列だけじゃなくて密行列も便利だった

78デフォルトの名無しさん2017/07/03(月) 14:29:28.07ID:0WiPHc69
>>75
内容古いかもしれないが
インプレスの CUDA by Example 汎用GPUプログラミング入門 とかは?

79デフォルトの名無しさん2017/07/03(月) 14:32:00.95ID:0WiPHc69
>>78
あ ゴメン
c++の文法説明込みだったら 違った

80デフォルトの名無しさん2017/08/06(日) 16:23:07.09ID:XG7YRxUk
カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか?
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。

LinuxでCUDA8、GTX1080です。

81デフォルトの名無しさん2017/08/10(木) 06:57:43.66ID:YyeIUrZv
openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある

82デフォルトの名無しさん2017/08/10(木) 07:55:32.26ID:OxRJE4uH
多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい

83802017/08/11(金) 09:30:37.96ID:TMX2lDFt
レスありがとうございます。

>>81
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。

>>82
Hyper-Q機能?でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか?

84デフォルトの名無しさん2017/08/15(火) 16:51:41.09ID:3/BBM8NB
>>29
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理

85デフォルトの名無しさん2017/08/21(月) 21:00:28.62ID:Q24iB0o5
vs2017で使えん

86デフォルトの名無しさん2017/08/31(木) 18:49:59.24ID:MFovTTnL
初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか?

87デフォルトの名無しさん2017/08/31(木) 18:58:29.12ID:Ce9FMcgb
何のために?

88デフォルトの名無しさん2017/08/31(木) 19:58:21.56ID:oZkhTD7w
モンテカルロ内でやりたいんだろ

89デフォルトの名無しさん2017/09/26(火) 05:36:17.39ID:/zEF5028
Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか?

90デフォルトの名無しさん2017/09/26(火) 06:32:45.58ID:mvSUAuA/
もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず

でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない

兼用バイナリというのは、ない

ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない

91デフォルトの名無しさん2017/10/19(木) 22:15:29.66ID:O7DpKIC1
DirectSoundの処理をCUDAで処理するようなライブラリないのかしら

92デフォルトの名無しさん2017/12/04(月) 23:59:10.12ID:2+MXhE1C
配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで

93デフォルトの名無しさん2017/12/05(火) 08:13:25.32ID:lkNfeWcr
配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。

94デフォルトの名無しさん2017/12/20(水) 04:47:46.09ID:tW5VNkV2
windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか?

95デフォルトの名無しさん2017/12/21(木) 13:14:18.72ID:PbmhXIq3
おk

96デフォルトの名無しさん2017/12/31(日) 05:34:34.69ID:vNK2XdUl
科学技術計算に使うならtitanではなくteslaでしょうか?

97デフォルトの名無しさん2017/12/31(日) 10:17:54.45ID:KA+WHx0L
scipy

98デフォルトの名無しさん2017/12/31(日) 12:13:16.21ID:7AfK40Dq
>>96
買えればな

99デフォルトの名無しさん2018/01/03(水) 03:49:56.24ID:t6kCNeZE
visual profilerのwindows環境での使い方を解説してるサイトって無いですか?

100デフォルトの名無しさん2018/01/03(水) 04:21:39.75ID:beBP1q3i
>>99
調べる前に使う方が手っ取り早く覚えられるよ。

101デフォルトの名無しさん2018/01/04(木) 03:47:25.18ID:TAoyqhSr
>>100
https://qiita.com/Hiroki11x/items/3737e4e267c1035a4b55
ちょっといじったりはしてるんですけどこのページの「nvprofでprofileをとる」の部分でwindowsでのやり方が分からず詰んでます

ちなみにこのソフトって実行中のプログラムの動きを見るのではなくソースコードからどういう風に動くかを表示してくれるものですよね?

102デフォルトの名無しさん2018/01/04(木) 07:08:13.82ID:SKENGrTB
>>101
宗教的な理由がないならVisualStudioとセットで使った方がいい。
ほぼ悩むことなく使えるから。

103デフォルトの名無しさん2018/01/04(木) 14:37:10.89ID:TAoyqhSr
>>102
Nsightって奴ですねありがとうございます
やってみます

104デフォルトの名無しさん2018/02/01(木) 16:47:45.03ID:Oiw/v1s8
cuda9.1 でコンパイルに成功している人はいませんか?
サンプル simpleTemplates を VisualStudio2017(msvc++19.11) で鬼のようエラーが出てコンパイルできません
http://codepad.org/2kWkUrQ0

105デフォルトの名無しさん2018/02/02(金) 07:32:53.45ID:sggyuymU
エラー無視すんな

106デフォルトの名無しさん2018/02/02(金) 14:42:34.94ID:NNrLuZbI
>>105
メーカー提供のライブラリがこんなエラーを吐くんですが…

107デフォルトの名無しさん2018/02/02(金) 16:24:33.04ID:UHwa6yjc
>cl : コマンド ライン warning D9002 : 不明なオプション 'Wp64' を無視します。

108デフォルトの名無しさん2018/02/12(月) 10:28:57.39ID:0YWRNu0p
nvccだけ使えればいいと思ってVirtualBox+Ubuntu16.04にCUDA 9.1 Toolkitをインストールしてみたら
ログイン直後にgnome-sessionが死ぬようになってGUIが使えなくなってしまった。
どこで聞こうか迷ったけど、とりあえず同じような経験の人いないだろうか。

ドライバ周りが原因のような気もするけど、Windows版みたいにディスプレイドライバだけ除いて
インストールするとかできないのかな。

109デフォルトの名無しさん2018/02/12(月) 14:52:40.91ID:e1PHkpUL
>>108
そもそも一般ユーザーでインストールすれば、ドライバが書き換わってしまうことはない

110デフォルトの名無しさん2018/02/12(月) 16:57:29.11ID:0YWRNu0p
cudaとかの大きなくくりのメタパッケージじゃなくてcuda-compilersとか個別に指定すりゃいいんだな。
ドライバを含まないcuda-toolkit-9-1でも駄目だったから何かGUIツールでも関係していたんだろうか。

111デフォルトの名無しさん2018/02/16(金) 14:06:42.48ID:dBpGhFbZ
NVIDIA GeForce MX150 って使える?

112デフォルトの名無しさん2018/02/16(金) 21:00:32.13ID:6Qg41lNJ
対応GPUがスタートガイドやマニュアルにあるからそれを確認

113デフォルトの名無しさん2018/02/17(土) 02:17:22.97ID:ub0BBZWD
逝けるよって書けば信用するのか
すばらしき2ちゃん

114デフォルトの名無しさん2018/02/17(土) 02:31:09.51ID:/cKWkF1j

115デフォルトの名無しさん2018/02/17(土) 02:36:13.64ID:/cKWkF1j

116デフォルトの名無しさん2018/02/18(日) 02:05:22.31ID:xYXxBey2

117デフォルトの名無しさん2018/02/18(日) 11:07:01.37ID:6C73cEwr
これ古過ぎますか?まだ役に立つ?

CUDA C
https://www.amazon.co.jp/dp/4844338919

118デフォルトの名無しさん2018/02/18(日) 11:32:49.61ID:+kz6+qRG
これからCUDAを勉強するなら問題ないでしょ
基本は変わっていないんで

119デフォルトの名無しさん2018/02/18(日) 13:03:27.13ID:AAhzNgFK
問題なのは、最新のcuda9.1が最新のmsvc++ でコンパイルできないことなんだが…

120デフォルトの名無しさん2018/02/19(月) 23:00:57.77ID:sfd5KCmN
>>117
これかなりいいよ。
最新は網羅できてないが、日本語では最新じゃないかな。
cuda 6世代で検証は7でされてる

121デフォルトの名無しさん2018/02/21(水) 14:09:43.32ID:fC+mQq8B
>>119
gcc使おう!

122デフォルトの名無しさん2018/02/21(水) 14:23:56.10ID:jU0tYaxw
>>121
Windows バイナリーは microsoft VC++ にしか対応していない、とのこと
http://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html

123デフォルトの名無しさん2018/02/21(水) 15:49:25.59ID:zwuXHePG
そりゃバイナリならそうだがそういう話じゃなくて

124デフォルトの名無しさん2018/02/21(水) 16:30:30.19ID:jU0tYaxw
>>123
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない

125デフォルトの名無しさん2018/02/22(木) 17:44:56.30ID:j8QCdBbM
>>122
WSLでubuntu動かせばよくね?

126デフォルトの名無しさん2018/02/22(木) 18:06:40.02ID:Ee7revq9
>>125
その ubuntu 上で生成したコードは、ubuntu なしの Windows 上で動くのか?
動かないのならば、よいわけがあるまい

新着レスの表示
レスを投稿する