X



【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net
0001デフォルトの名無しさん
垢版 |
2016/06/15(水) 14:41:15.11ID:d2Xou3GL
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
0078デフォルトの名無しさん
垢版 |
2017/07/03(月) 14:29:28.07ID:0WiPHc69
>>75
内容古いかもしれないが
インプレスの CUDA by Example 汎用GPUプログラミング入門 とかは?
0080デフォルトの名無しさん
垢版 |
2017/08/06(日) 16:23:07.09ID:XG7YRxUk
カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか?
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。

LinuxでCUDA8、GTX1080です。
0081デフォルトの名無しさん
垢版 |
2017/08/10(木) 06:57:43.66ID:YyeIUrZv
openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある
0082デフォルトの名無しさん
垢版 |
2017/08/10(木) 07:55:32.26ID:OxRJE4uH
多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい
008380
垢版 |
2017/08/11(金) 09:30:37.96ID:TMX2lDFt
レスありがとうございます。

>>81
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。

>>82
Hyper-Q機能?でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか?
0084デフォルトの名無しさん
垢版 |
2017/08/15(火) 16:51:41.09ID:3/BBM8NB
>>29
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理
0086デフォルトの名無しさん
垢版 |
2017/08/31(木) 18:49:59.24ID:MFovTTnL
初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか?
0089デフォルトの名無しさん
垢版 |
2017/09/26(火) 05:36:17.39ID:/zEF5028
Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか?
0090デフォルトの名無しさん
垢版 |
2017/09/26(火) 06:32:45.58ID:mvSUAuA/
もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず

でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない

兼用バイナリというのは、ない

ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない
0092デフォルトの名無しさん
垢版 |
2017/12/04(月) 23:59:10.12ID:2+MXhE1C
配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで
0093デフォルトの名無しさん
垢版 |
2017/12/05(火) 08:13:25.32ID:lkNfeWcr
配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。
0094デフォルトの名無しさん
垢版 |
2017/12/20(水) 04:47:46.09ID:tW5VNkV2
windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか?
0095デフォルトの名無しさん
垢版 |
2017/12/21(木) 13:14:18.72ID:PbmhXIq3
おk
0096デフォルトの名無しさん
垢版 |
2017/12/31(日) 05:34:34.69ID:vNK2XdUl
科学技術計算に使うならtitanではなくteslaでしょうか?
0097デフォルトの名無しさん
垢版 |
2017/12/31(日) 10:17:54.45ID:KA+WHx0L
scipy
0101デフォルトの名無しさん
垢版 |
2018/01/04(木) 03:47:25.18ID:TAoyqhSr
>>100
https://qiita.com/Hiroki11x/items/3737e4e267c1035a4b55
ちょっといじったりはしてるんですけどこのページの「nvprofでprofileをとる」の部分でwindowsでのやり方が分からず詰んでます

ちなみにこのソフトって実行中のプログラムの動きを見るのではなくソースコードからどういう風に動くかを表示してくれるものですよね?
0102デフォルトの名無しさん
垢版 |
2018/01/04(木) 07:08:13.82ID:SKENGrTB
>>101
宗教的な理由がないならVisualStudioとセットで使った方がいい。
ほぼ悩むことなく使えるから。
0105デフォルトの名無しさん
垢版 |
2018/02/02(金) 07:32:53.45ID:sggyuymU
エラー無視すんな
0107デフォルトの名無しさん
垢版 |
2018/02/02(金) 16:24:33.04ID:UHwa6yjc
>cl : コマンド ライン warning D9002 : 不明なオプション 'Wp64' を無視します。
0108デフォルトの名無しさん
垢版 |
2018/02/12(月) 10:28:57.39ID:0YWRNu0p
nvccだけ使えればいいと思ってVirtualBox+Ubuntu16.04にCUDA 9.1 Toolkitをインストールしてみたら
ログイン直後にgnome-sessionが死ぬようになってGUIが使えなくなってしまった。
どこで聞こうか迷ったけど、とりあえず同じような経験の人いないだろうか。

ドライバ周りが原因のような気もするけど、Windows版みたいにディスプレイドライバだけ除いて
インストールするとかできないのかな。
0110デフォルトの名無しさん
垢版 |
2018/02/12(月) 16:57:29.11ID:0YWRNu0p
cudaとかの大きなくくりのメタパッケージじゃなくてcuda-compilersとか個別に指定すりゃいいんだな。
ドライバを含まないcuda-toolkit-9-1でも駄目だったから何かGUIツールでも関係していたんだろうか。
0118デフォルトの名無しさん
垢版 |
2018/02/18(日) 11:32:49.61ID:+kz6+qRG
これからCUDAを勉強するなら問題ないでしょ
基本は変わっていないんで
0119デフォルトの名無しさん
垢版 |
2018/02/18(日) 13:03:27.13ID:AAhzNgFK
問題なのは、最新のcuda9.1が最新のmsvc++ でコンパイルできないことなんだが…
0120デフォルトの名無しさん
垢版 |
2018/02/19(月) 23:00:57.77ID:sfd5KCmN
>>117
これかなりいいよ。
最新は網羅できてないが、日本語では最新じゃないかな。
cuda 6世代で検証は7でされてる
0121デフォルトの名無しさん
垢版 |
2018/02/21(水) 14:09:43.32ID:fC+mQq8B
>>119
gcc使おう!
0123デフォルトの名無しさん
垢版 |
2018/02/21(水) 15:49:25.59ID:zwuXHePG
そりゃバイナリならそうだがそういう話じゃなくて
0124デフォルトの名無しさん
垢版 |
2018/02/21(水) 16:30:30.19ID:jU0tYaxw
>>123
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない
0125デフォルトの名無しさん
垢版 |
2018/02/22(木) 17:44:56.30ID:j8QCdBbM
>>122
WSLでubuntu動かせばよくね?
0126デフォルトの名無しさん
垢版 |
2018/02/22(木) 18:06:40.02ID:Ee7revq9
>>125
その ubuntu 上で生成したコードは、ubuntu なしの Windows 上で動くのか?
動かないのならば、よいわけがあるまい
0128デフォルトの名無しさん
垢版 |
2018/02/23(金) 17:00:07.99ID:mpvgXBL2
>>127
クロスコンパイルとはいわないのでは?
Linux 上で gcc を使ったコンパイル成果物は、Windows では動かない
Windows 上で cl を使ったコンパイル成果物は、Linux 上では動かない
0130デフォルトの名無しさん
垢版 |
2018/02/28(水) 14:29:08.26ID:S610+cRR
(棒)すげー
0131デフォルトの名無しさん
垢版 |
2018/03/11(日) 12:38:36.83ID:YI7oymp5
CUDA ToolkitはまだVS2017 15.4までしか対応してないんだよな。
もう15.6出たのから15.4は入手できなくなるし、どうにかしてほしいなぁ。
0133デフォルトの名無しさん
垢版 |
2018/03/14(水) 23:17:19.01ID:0fdBf/WL
やってみた?nvcc動かんよ。たしかNSIGHTのインストールも失敗するはず。
フォーラムでも公式が「サポートしてるのは15.4まで」と言っている。
0134デフォルトの名無しさん
垢版 |
2018/03/15(木) 21:42:37.30ID:9ujU8BdG
フォーラムの中の人も、半年くらい前は「申し訳ない」とかなんとか言ってたのが
最近はもう投げ遣りな感じだね。
修正がそんなに難しいのかね?NVIDIAの中で何が起きているんだろうか。
0135デフォルトの名無しさん
垢版 |
2018/03/16(金) 14:20:39.88ID:3ma6aQHv
公務員体質
0136デフォルトの名無しさん
垢版 |
2018/03/16(金) 15:23:49.95ID:GsmhGHn7
勘弁してほしい、VS installer を思わず起動してアップデートを開始させてしまっては後悔しているんだ…
0139デフォルトの名無しさん
垢版 |
2018/03/24(土) 20:53:51.41ID:6+fQqcMh
CUDA試してみたいんですが、入門としてはGeforce GTX 1060くらいあれば有意にCPU core i7 4Ghz より速くなりますか?
0142139
垢版 |
2018/03/25(日) 00:29:09.29ID:zxeoFdzJ
ほほう、5倍速以上ですか。
ありがとうございます。
0143139
垢版 |
2018/03/25(日) 00:38:35.35ID:zxeoFdzJ
ちなみに用途はパイソンのディープラーニング用ライブラリの使用です。
0144139
垢版 |
2018/03/25(日) 00:59:31.33ID:zxeoFdzJ
ちなみに主要な製品の>>141みたいな性能比較の一覧ってどこかにあります?
0145デフォルトの名無しさん
垢版 |
2018/03/25(日) 02:40:05.71ID:5uyFYwe4
Keras/TensorflowでCUDA9.0とCuDNN7.0.5を使ってるけど、
980でCPUの4〜5倍ぐらい、1060・1070だと7〜8倍ぐらい速くなった

あとは、GPUの性能よりもマザボやメモリとの相性が大きかったりする
ECCメモリ積んだサーバ機だと足を引っ張られるし、
1070のデスクトップ機よりも1060のゲーミング用ノートPCの方が速かったりする

あと、スペックの違うグラボを2枚挿しすると、単体運用よりも演算が遅くなることがあるから注意
0149139
垢版 |
2018/03/25(日) 19:52:41.28ID:zxeoFdzJ
Geforce GTX 1060買ってきました。
早速試そうと思ったが、電源ユニットに6pinケーブルがないT△T

電源も買い替えかなぁorz
0150デフォルトの名無しさん
垢版 |
2018/03/25(日) 20:17:14.43ID:23VTYDhm
おめでとう
まずは2.8TFlopsで動くテストコードの記述から
単精度でひたすら積和
0151デフォルトの名無しさん
垢版 |
2018/03/25(日) 20:51:30.02ID:zxeoFdzJ
スリムタワーなんか買うんじゃなかったorz
電源もそうだがグラボがケースに収まらないしorz orz
蓋外せば済むことだけど orz orz orz
0153デフォルトの名無しさん
垢版 |
2018/03/26(月) 04:49:23.49ID:OxsjGzhh
>>151
わろた

蓋開けたままだと空冷効率却って悪くなるんじゃなかったかな
蓋開けるなら扇風機も当てた方がいい
0155139
垢版 |
2018/03/27(火) 22:47:39.83ID:1N1BEpYm
一応電源買ったが平日はまとまった時間が取れないので土日で作業しよう。
保証期間とかあるけど平気だよね?

ちな750W
0158デフォルトの名無しさん
垢版 |
2018/03/31(土) 04:23:03.69ID:2Z4gCLvW
極地に引っ越せ
0159139
垢版 |
2018/04/01(日) 00:23:36.11ID:C5bt+EHA
1060設置完了しました。
とりあえず、core i7 のiGPUから解像度が上がっていい感じ。
いままでディスプレイのMAX解像度出てなかったからね。
あとはpytorchが動いてくれれば…
0160139
垢版 |
2018/04/02(月) 22:02:29.92ID:gbB6Aon1
動いたっぽいけど消費時間の測り方が分からんw
まあパイソンの勉強するしかないか
0161デフォルトの名無しさん
垢版 |
2018/04/03(火) 00:26:12.77ID:cU9BUIMs
最近pythonスレで速度計測コード貼ってる人がいた
0162139
垢版 |
2018/04/03(火) 22:11:12.18ID:uBm1Z43v
kwsk
0163デフォルトの名無しさん
垢版 |
2018/04/03(火) 23:12:19.70ID:RICRRaNn
1060安くなったね
0164デフォルトの名無しさん
垢版 |
2018/04/10(火) 14:29:01.82ID:JIHFaEMv
Nvidiaは今月で32ビットオペレーティングシステムのパフォーマンスの向上、新機能、バグ修正などのサポートを終了する
重要なセキュリティアップデートは、2019年1月まで32ビット用に提供されます。
これには、以下のオペレーティングシステムが含まれます。
- Microsoft Windows 7 8 / 8.1 10
- Linux FreeBSD
0165デフォルトの名無しさん
垢版 |
2018/04/12(木) 21:45:56.77ID:YSG95pib
すいません、自分のグラボがcudaのどのバージョンで使えるのか
どこを見たらわかるか教えていただけないでしょうか?

windows 10で
GeForceGT610という弱めのグラボを使っています。
↓グラボのHPを見るとCUDAは対応しているようなのですが
ttp://www.nvidia.co.jp/object/geforce-gt-610-jp.html#pdpContent=1

cudaのHPでは対応グラボにのってませんでした(例だから?)
ttp://www.nvidia.co.jp/object/cuda_learn_products_jp_old.html
0169デフォルトの名無しさん
垢版 |
2018/04/13(金) 11:00:08.69ID:/4JAUyBc
大昔のcuda コア数4個とかのグラボでも対応しているといえば対応してること になるけど
おもちゃのつもりで買って結局ゴミにした思い出

悪いこと言わないので最低限でもgtx1070tiとかにしておけ
0170デフォルトの名無しさん
垢版 |
2018/04/13(金) 12:53:26.22ID:QDi0ylkU
>>165
例だからじゃなくて古いページの情報観てるからじゃね?
0171165
垢版 |
2018/04/13(金) 22:53:22.51ID:bpFwwSEy
>>166
>>167
ありがとうございます
自分のグラボでもcuda対応してるんですね
ほっとしました。
頑張って動かしてみます。

>>169
いままでグラボが必要になることがそんなになかったもので・・・
これでcuda動かせるようになったら買い替えも検討したいです
0172デフォルトの名無しさん
垢版 |
2018/04/14(土) 09:03:48.32ID:SSnO0vA6
gtx960利用でx265nvencエンコードしてるけどGPU可動が何時も30%くらいで少ないけど
もっとGPU使用率を増やすにはどうしたら良いですか?
0174デフォルトの名無しさん
垢版 |
2018/04/14(土) 15:36:05.57ID:Oo4/Wx3V
Occupancyが上がらない状態かバスが支配的なことが考えられるが、
とりあえずVisualProfilerかなんかでどこが原因か見てみれば?
0175デフォルトの名無しさん
垢版 |
2018/05/23(水) 19:49:54.06ID:Au5e7VGg
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

Q45FH
0177デフォルトの名無しさん
垢版 |
2018/07/05(木) 00:33:41.64ID:RfoszcD2
T85
レスを投稿する


ニューススポーツなんでも実況