このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。
CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone
関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/
前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net
2016/06/15(水) 14:41:15.11ID:d2Xou3GL
122デフォルトの名無しさん
2018/02/21(水) 14:23:56.10ID:jU0tYaxw >>121
Windows バイナリーは microsoft VC++ にしか対応していない、とのこと
http://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html
Windows バイナリーは microsoft VC++ にしか対応していない、とのこと
http://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html
123デフォルトの名無しさん
2018/02/21(水) 15:49:25.59ID:zwuXHePG そりゃバイナリならそうだがそういう話じゃなくて
124デフォルトの名無しさん
2018/02/21(水) 16:30:30.19ID:jU0tYaxw >>123
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない
125デフォルトの名無しさん
2018/02/22(木) 17:44:56.30ID:j8QCdBbM >>122
WSLでubuntu動かせばよくね?
WSLでubuntu動かせばよくね?
126デフォルトの名無しさん
2018/02/22(木) 18:06:40.02ID:Ee7revq9127デフォルトの名無しさん
2018/02/23(金) 16:52:21.65ID:0tA6Y4q1 最新のはクロスコンパイル不可能なん?
128デフォルトの名無しさん
2018/02/23(金) 17:00:07.99ID:mpvgXBL2 >>127
クロスコンパイルとはいわないのでは?
Linux 上で gcc を使ったコンパイル成果物は、Windows では動かない
Windows 上で cl を使ったコンパイル成果物は、Linux 上では動かない
クロスコンパイルとはいわないのでは?
Linux 上で gcc を使ったコンパイル成果物は、Windows では動かない
Windows 上で cl を使ったコンパイル成果物は、Linux 上では動かない
129デフォルトの名無しさん
2018/02/23(金) 22:59:05.62ID:+N3Z3Usd >>128
Linux上のgccでWindows用バイナリを吐くこともできる。
Linux上のgccでWindows用バイナリを吐くこともできる。
130デフォルトの名無しさん
2018/02/28(水) 14:29:08.26ID:S610+cRR (棒)すげー
131デフォルトの名無しさん
2018/03/11(日) 12:38:36.83ID:YI7oymp5 CUDA ToolkitはまだVS2017 15.4までしか対応してないんだよな。
もう15.6出たのから15.4は入手できなくなるし、どうにかしてほしいなぁ。
もう15.6出たのから15.4は入手できなくなるし、どうにかしてほしいなぁ。
132デフォルトの名無しさん
2018/03/14(水) 22:02:39.83ID:KBR3xAs9 え?コンパイルやビルドができないほど深刻な問題でてるっけ?
133デフォルトの名無しさん
2018/03/14(水) 23:17:19.01ID:0fdBf/WL やってみた?nvcc動かんよ。たしかNSIGHTのインストールも失敗するはず。
フォーラムでも公式が「サポートしてるのは15.4まで」と言っている。
フォーラムでも公式が「サポートしてるのは15.4まで」と言っている。
134デフォルトの名無しさん
2018/03/15(木) 21:42:37.30ID:9ujU8BdG フォーラムの中の人も、半年くらい前は「申し訳ない」とかなんとか言ってたのが
最近はもう投げ遣りな感じだね。
修正がそんなに難しいのかね?NVIDIAの中で何が起きているんだろうか。
最近はもう投げ遣りな感じだね。
修正がそんなに難しいのかね?NVIDIAの中で何が起きているんだろうか。
135デフォルトの名無しさん
2018/03/16(金) 14:20:39.88ID:3ma6aQHv 公務員体質
136デフォルトの名無しさん
2018/03/16(金) 15:23:49.95ID:GsmhGHn7 勘弁してほしい、VS installer を思わず起動してアップデートを開始させてしまっては後悔しているんだ…
137デフォルトの名無しさん
2018/03/17(土) 01:16:13.43ID:x+YiOp0G138デフォルトの名無しさん
2018/03/17(土) 07:59:31.00ID:hl7Y0kGo 15.4までが大丈夫。そのページが15.5になってしまったらおしまいってこと。
139デフォルトの名無しさん
2018/03/24(土) 20:53:51.41ID:6+fQqcMh CUDA試してみたいんですが、入門としてはGeforce GTX 1060くらいあれば有意にCPU core i7 4Ghz より速くなりますか?
140デフォルトの名無しさん
2018/03/25(日) 00:11:04.74ID:nZih/wjn 単精度で性能を活かせる処理なら速い
AVXを駆使しても1060の性能は出ない
AVXを駆使しても1060の性能は出ない
141デフォルトの名無しさん
2018/03/25(日) 00:16:26.55ID:nZih/wjn 単精度
1060 2.8TFlops
i7 4GHz 0.5TFlops
1060 2.8TFlops
i7 4GHz 0.5TFlops
142139
2018/03/25(日) 00:29:09.29ID:zxeoFdzJ ほほう、5倍速以上ですか。
ありがとうございます。
ありがとうございます。
143139
2018/03/25(日) 00:38:35.35ID:zxeoFdzJ ちなみに用途はパイソンのディープラーニング用ライブラリの使用です。
145デフォルトの名無しさん
2018/03/25(日) 02:40:05.71ID:5uyFYwe4 Keras/TensorflowでCUDA9.0とCuDNN7.0.5を使ってるけど、
980でCPUの4〜5倍ぐらい、1060・1070だと7〜8倍ぐらい速くなった
あとは、GPUの性能よりもマザボやメモリとの相性が大きかったりする
ECCメモリ積んだサーバ機だと足を引っ張られるし、
1070のデスクトップ機よりも1060のゲーミング用ノートPCの方が速かったりする
あと、スペックの違うグラボを2枚挿しすると、単体運用よりも演算が遅くなることがあるから注意
980でCPUの4〜5倍ぐらい、1060・1070だと7〜8倍ぐらい速くなった
あとは、GPUの性能よりもマザボやメモリとの相性が大きかったりする
ECCメモリ積んだサーバ機だと足を引っ張られるし、
1070のデスクトップ機よりも1060のゲーミング用ノートPCの方が速かったりする
あと、スペックの違うグラボを2枚挿しすると、単体運用よりも演算が遅くなることがあるから注意
146デフォルトの名無しさん
2018/03/25(日) 08:15:49.40ID:iml51cux 複数枚刺しでCUDA使うならSLI-offがデフォ。
147デフォルトの名無しさん
2018/03/25(日) 11:36:30.54ID:WaYZZq21 >143-144
https://ja.wikipedia.org/wiki/GPGPU
https://ja.wikipedia.org/wiki/GPGPU
148デフォルトの名無しさん
2018/03/25(日) 11:53:57.75ID:23VTYDhm149139
2018/03/25(日) 19:52:41.28ID:zxeoFdzJ Geforce GTX 1060買ってきました。
早速試そうと思ったが、電源ユニットに6pinケーブルがないT△T
電源も買い替えかなぁorz
早速試そうと思ったが、電源ユニットに6pinケーブルがないT△T
電源も買い替えかなぁorz
150デフォルトの名無しさん
2018/03/25(日) 20:17:14.43ID:23VTYDhm おめでとう
まずは2.8TFlopsで動くテストコードの記述から
単精度でひたすら積和
まずは2.8TFlopsで動くテストコードの記述から
単精度でひたすら積和
151デフォルトの名無しさん
2018/03/25(日) 20:51:30.02ID:zxeoFdzJ スリムタワーなんか買うんじゃなかったorz
電源もそうだがグラボがケースに収まらないしorz orz
蓋外せば済むことだけど orz orz orz
電源もそうだがグラボがケースに収まらないしorz orz
蓋外せば済むことだけど orz orz orz
152デフォルトの名無しさん
2018/03/26(月) 01:19:57.55ID:y2ZIO+Gj 電源容量気をつけてな
300wとかだと足りないかもしれない
300wとかだと足りないかもしれない
153デフォルトの名無しさん
2018/03/26(月) 04:49:23.49ID:OxsjGzhh154デフォルトの名無しさん
2018/03/26(月) 04:57:26.52ID:OxsjGzhh155139
2018/03/27(火) 22:47:39.83ID:1N1BEpYm 一応電源買ったが平日はまとまった時間が取れないので土日で作業しよう。
保証期間とかあるけど平気だよね?
ちな750W
保証期間とかあるけど平気だよね?
ちな750W
156デフォルトの名無しさん
2018/03/28(水) 06:47:45.49ID:fYzIlbdt また無駄にデカイ電源を
157デフォルトの名無しさん
2018/03/31(土) 00:00:36.28ID:NrUsiMB7 いっそzen+で一台組もうか?w
158デフォルトの名無しさん
2018/03/31(土) 04:23:03.69ID:2Z4gCLvW 極地に引っ越せ
159139
2018/04/01(日) 00:23:36.11ID:C5bt+EHA 1060設置完了しました。
とりあえず、core i7 のiGPUから解像度が上がっていい感じ。
いままでディスプレイのMAX解像度出てなかったからね。
あとはpytorchが動いてくれれば…
とりあえず、core i7 のiGPUから解像度が上がっていい感じ。
いままでディスプレイのMAX解像度出てなかったからね。
あとはpytorchが動いてくれれば…
160139
2018/04/02(月) 22:02:29.92ID:gbB6Aon1 動いたっぽいけど消費時間の測り方が分からんw
まあパイソンの勉強するしかないか
まあパイソンの勉強するしかないか
161デフォルトの名無しさん
2018/04/03(火) 00:26:12.77ID:cU9BUIMs 最近pythonスレで速度計測コード貼ってる人がいた
162139
2018/04/03(火) 22:11:12.18ID:uBm1Z43v kwsk
163デフォルトの名無しさん
2018/04/03(火) 23:12:19.70ID:RICRRaNn 1060安くなったね
164デフォルトの名無しさん
2018/04/10(火) 14:29:01.82ID:JIHFaEMv Nvidiaは今月で32ビットオペレーティングシステムのパフォーマンスの向上、新機能、バグ修正などのサポートを終了する
重要なセキュリティアップデートは、2019年1月まで32ビット用に提供されます。
これには、以下のオペレーティングシステムが含まれます。
- Microsoft Windows 7 8 / 8.1 10
- Linux FreeBSD
重要なセキュリティアップデートは、2019年1月まで32ビット用に提供されます。
これには、以下のオペレーティングシステムが含まれます。
- Microsoft Windows 7 8 / 8.1 10
- Linux FreeBSD
165デフォルトの名無しさん
2018/04/12(木) 21:45:56.77ID:YSG95pib すいません、自分のグラボがcudaのどのバージョンで使えるのか
どこを見たらわかるか教えていただけないでしょうか?
windows 10で
GeForceGT610という弱めのグラボを使っています。
↓グラボのHPを見るとCUDAは対応しているようなのですが
ttp://www.nvidia.co.jp/object/geforce-gt-610-jp.html#pdpContent=1
cudaのHPでは対応グラボにのってませんでした(例だから?)
ttp://www.nvidia.co.jp/object/cuda_learn_products_jp_old.html
どこを見たらわかるか教えていただけないでしょうか?
windows 10で
GeForceGT610という弱めのグラボを使っています。
↓グラボのHPを見るとCUDAは対応しているようなのですが
ttp://www.nvidia.co.jp/object/geforce-gt-610-jp.html#pdpContent=1
cudaのHPでは対応グラボにのってませんでした(例だから?)
ttp://www.nvidia.co.jp/object/cuda_learn_products_jp_old.html
166デフォルトの名無しさん
2018/04/13(金) 00:51:21.10ID:OIii2v2C167デフォルトの名無しさん
2018/04/13(金) 02:54:37.02ID:4E3ZJNs7 610Mは演算能力2.1で最低スペックだけど、一応対応しているみたいだよ
https://developer.nvidia.com/cuda-gpus
https://developer.nvidia.com/cuda-gpus
168デフォルトの名無しさん
2018/04/13(金) 02:56:52.47ID:4E3ZJNs7 ↑610Mだけじゃなくて、610の方でも同じ
169デフォルトの名無しさん
2018/04/13(金) 11:00:08.69ID:/4JAUyBc 大昔のcuda コア数4個とかのグラボでも対応しているといえば対応してること になるけど
おもちゃのつもりで買って結局ゴミにした思い出
悪いこと言わないので最低限でもgtx1070tiとかにしておけ
おもちゃのつもりで買って結局ゴミにした思い出
悪いこと言わないので最低限でもgtx1070tiとかにしておけ
170デフォルトの名無しさん
2018/04/13(金) 12:53:26.22ID:QDi0ylkU >>165
例だからじゃなくて古いページの情報観てるからじゃね?
例だからじゃなくて古いページの情報観てるからじゃね?
171165
2018/04/13(金) 22:53:22.51ID:bpFwwSEy172デフォルトの名無しさん
2018/04/14(土) 09:03:48.32ID:SSnO0vA6 gtx960利用でx265nvencエンコードしてるけどGPU可動が何時も30%くらいで少ないけど
もっとGPU使用率を増やすにはどうしたら良いですか?
もっとGPU使用率を増やすにはどうしたら良いですか?
173デフォルトの名無しさん
2018/04/14(土) 11:20:07.58ID:C8Da/aR0174デフォルトの名無しさん
2018/04/14(土) 15:36:05.57ID:Oo4/Wx3V Occupancyが上がらない状態かバスが支配的なことが考えられるが、
とりあえずVisualProfilerかなんかでどこが原因か見てみれば?
とりあえずVisualProfilerかなんかでどこが原因か見てみれば?
175デフォルトの名無しさん
2018/05/23(水) 19:49:54.06ID:Au5e7VGg 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
Q45FH
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
Q45FH
176デフォルトの名無しさん
2018/05/23(水) 21:24:03.57ID:uiVT0ZzW Q45FH
177デフォルトの名無しさん
2018/07/05(木) 00:33:41.64ID:RfoszcD2 T85
178デフォルトの名無しさん
2018/10/08(月) 11:29:19.78ID:+5qyKWRv179デフォルトの名無しさん
2018/10/22(月) 20:29:13.91ID:w4+wf4gQ RTXのtensorコアってどうなの?
180デフォルトの名無しさん
2019/01/03(木) 14:15:50.59ID:pSmmWchb 1080Ti買ってきてドライバインストールしたんだけど、GPU-Zで見たときOpen-CLだけチェック入ってなくて
困ってるんだけど、コレって別にドライバー持ってくる必要があるの?
困ってるんだけど、コレって別にドライバー持ってくる必要があるの?
181デフォルトの名無しさん
2019/01/03(木) 14:29:58.49ID:ek3slq0P182デフォルトの名無しさん
2019/07/23(火) 17:02:22.82ID:/TcX3lBx quadro p600のWSにcuda入れようとしてるのだけど
10.1がパスカル世代の面倒見るのはteslaだけって認識でいいの?
390系のドライバしか入らなくて困ってる。
cuda9.1だとこんどはgcc 6以上はあかんとサンプルプログラムのヘッダがコンパイル時にハネてくる。
なんか詰んでる
10.1がパスカル世代の面倒見るのはteslaだけって認識でいいの?
390系のドライバしか入らなくて困ってる。
cuda9.1だとこんどはgcc 6以上はあかんとサンプルプログラムのヘッダがコンパイル時にハネてくる。
なんか詰んでる
183デフォルトの名無しさん
2019/07/23(火) 17:03:06.53ID:/TcX3lBx >>179
倍精度ゲロ遅なんでしょ
倍精度ゲロ遅なんでしょ
184デフォルトの名無しさん
2019/08/04(日) 08:51:33.67ID:1yK6graO でかいjpegファイルを手頃なサイズに縮小することがよくあって、
数が多いので結構な時間(数時間)がかかる
これを何とかGPUのパワーで短縮できないものか
数が多いので結構な時間(数時間)がかかる
これを何とかGPUのパワーで短縮できないものか
185デフォルトの名無しさん
2019/08/04(日) 10:17:38.13ID:Ae1Ff/1h スレチ
186デフォルトの名無しさん
2019/11/27(水) 13:29:04.23ID:JvyecW3n GTX1080のあるPCでcudaとcuDNNとAnacondaとTensorflowをインストール
GTX1080には9.0が合うのかと調べて、VS2015をインストールしてからcudaもバージョン合わせて入れる
Anaconda入れて早速仮想環境作ったが何故かその時はPython3.7しか選べなかった
そしたらconda install tensorflow-gpuで勝手に2.0を選び、型が合わないとエラー
conda install tensorflow-gpu==1.15でもcuda runtimeと合わない
cudaが10じゃないとダメという
1.12にしたら、今度はPythonが3.6でないとダメという
つまりこの仮想環境丸ごとダメ
捨てたあとで、もう一回作ろうとしたらPython3.6選べた
だからconda install tensorflow-gpu==1.12で、やっと動いた
ちょっとでも古い機器だともう合わないとか、敏感だよなあ
GTX1080には9.0が合うのかと調べて、VS2015をインストールしてからcudaもバージョン合わせて入れる
Anaconda入れて早速仮想環境作ったが何故かその時はPython3.7しか選べなかった
そしたらconda install tensorflow-gpuで勝手に2.0を選び、型が合わないとエラー
conda install tensorflow-gpu==1.15でもcuda runtimeと合わない
cudaが10じゃないとダメという
1.12にしたら、今度はPythonが3.6でないとダメという
つまりこの仮想環境丸ごとダメ
捨てたあとで、もう一回作ろうとしたらPython3.6選べた
だからconda install tensorflow-gpu==1.12で、やっと動いた
ちょっとでも古い機器だともう合わないとか、敏感だよなあ
187デフォルトの名無しさん
2019/12/04(水) 13:02:39.14ID:tCRQbFTx ところがRTX2000番台は事前にVSもCUDAもcuDNNも入れずにAnacondaだけで
tensorflowがインストールできてしまった
この数日で色々変わったらしい
tensorflowがインストールできてしまった
この数日で色々変わったらしい
188デフォルトの名無しさん
2019/12/04(水) 13:24:12.88ID:sb3P/SSe おめおめ
189デフォルトの名無しさん
2020/02/14(金) 11:55:27.53ID:ApdIcKC6 RTX2000番台はAnacondaからPyTorchでGPUを使う設定に出来たがChainerでcupyからGPU呼ぶのは失敗
GTX1000番台はAnacondaからChainerでGPU使えるように苦労して設定したら、PyTorchは
「これ古すぎてGPU使えない」と表示された
一長一短
ところで16xx系列ではどうなるんだろう
GTX1000番台はAnacondaからChainerでGPU使えるように苦労して設定したら、PyTorchは
「これ古すぎてGPU使えない」と表示された
一長一短
ところで16xx系列ではどうなるんだろう
190デフォルトの名無しさん
2020/04/08(水) 11:14:16.32ID:kpKMKUpB PyTorch使いたかったら2000番台がいいか
2070以上、せめて2060superがいいか
でも中古でもそれなりの値段
そしてGPU上のメモりが8gb以上ないと動かないモジュールも多くて2060無印があかん事に
2070以上、せめて2060superがいいか
でも中古でもそれなりの値段
そしてGPU上のメモりが8gb以上ないと動かないモジュールも多くて2060無印があかん事に
191デフォルトの名無しさん
2020/06/25(木) 09:14:06.05ID:MmNin/8J wddm2.7対応ドライバで
bandwidthTestにおいてpagedメモリの転送速度向上を確認した
pinedだとhtod、dtohともに13GB/sec
pageableだとwddm2.6は8GB/sec、2.7だと12GB/secくらい
bandwidthTestにおいてpagedメモリの転送速度向上を確認した
pinedだとhtod、dtohともに13GB/sec
pageableだとwddm2.6は8GB/sec、2.7だと12GB/secくらい
192デフォルトの名無しさん
2020/09/29(火) 22:45:56.87ID:8OEjGTOk GTX 1660 SUPERはCUDAに対応してますか?
193デフォルトの名無しさん
2020/09/30(水) 01:11:13.65ID:XQsVzQWu >>192
https://www.nvidia.com/ja-jp/geforce/graphics-cards/gtx-1660-super/
GPU エンジンの仕様:
1408 NVIDIA CUDA® コア
6GB GDDR6標準メモリ構成
192-ビット
https://www.nvidia.com/ja-jp/geforce/graphics-cards/gtx-1660-super/
GPU エンジンの仕様:
1408 NVIDIA CUDA® コア
6GB GDDR6標準メモリ構成
192-ビット
194デフォルトの名無しさん
2020/10/04(日) 03:16:42.67ID:tvE5z3VX CUDAのバージョンを不問とするならGeforce 200シリーズ(Tesla世代)から対応はしてる
って書こうとしたら8シリーズ(2007年)からあったんかよCUDA
って書こうとしたら8シリーズ(2007年)からあったんかよCUDA
195デフォルトの名無しさん
2020/10/13(火) 20:53:42.89ID:6GL96WuY CPUでの画像処理で速度が上がらずCudaを使いたいです。(windows)
@画像をGPUメモリに読み込み
A領域分割、パラレルで画像処理
(分割部エッジにオフセット?をつけたい)
BGPUメモリの処理結果をCPUメモリに返してファイルにおとす。
こういったサンプルプログラムでいいのないでしょうか?
画像処理部だけしたい処理に書き換えればいいような。
よろしくお願いします。
@画像をGPUメモリに読み込み
A領域分割、パラレルで画像処理
(分割部エッジにオフセット?をつけたい)
BGPUメモリの処理結果をCPUメモリに返してファイルにおとす。
こういったサンプルプログラムでいいのないでしょうか?
画像処理部だけしたい処理に書き換えればいいような。
よろしくお願いします。
196デフォルトの名無しさん
2020/10/14(水) 13:17:48.94ID:qfzj9xUm numpyをcupyに替えて
ただしcupyはGPUを使うと宣言して
みたいな奴かなあ
ただしcupyはGPUを使うと宣言して
みたいな奴かなあ
197195
2020/10/14(水) 15:54:49.86ID:4Zn1G8Lw すみません。言語を書いていませんでした。使いたいのはPythonじゃないです。
WindowsでC++で実現したいです。
WindowsでC++で実現したいです。
198デフォルトの名無しさん
2020/10/14(水) 16:32:24.96ID:ZV1nncqg ttps://qiita.com/Keech/items/381495ed90e012d69f1a
ttps://www.kkaneko.jp/tools/win/cuda10.html
ttps://www.kkaneko.jp/tools/win/cuda10.html
199デフォルトの名無しさん
2020/10/14(水) 16:34:20.05ID:ZV1nncqg ttps://ameblo.jp/naginosen/entry-12443269443.html
200デフォルトの名無しさん
2020/11/19(木) 09:55:49.41ID:RIzKHKet RTX3080などで、cuda11が使えるようになってる
だがtensorflowは現時点でまだ使えない
だがPyTorchが動くとのこと!
だがtensorflowは現時点でまだ使えない
だがPyTorchが動くとのこと!
201デフォルトの名無しさん
2020/12/01(火) 20:58:05.41ID:nBZth83f cudaええな。
2万3千円の GF 1660 SUPER で tensorflow が
2x Xeon E5 2697A v4 の10倍速くなった
2万3千円の GF 1660 SUPER で tensorflow が
2x Xeon E5 2697A v4 の10倍速くなった
202デフォルトの名無しさん
2020/12/07(月) 14:54:49.93ID:sgdo/0mF 1660sでも天下のXEON様の10倍も速いのか
cudaコア数に速度が比例するからなあ
3090だと更に7倍?
cudaコア数に速度が比例するからなあ
3090だと更に7倍?
203デフォルトの名無しさん
2020/12/07(月) 21:54:00.27ID:UxKk8T9A intelのコンパイラ買えばCPUももうちょっとマシなんだろうけどケチってやってない。
GPUのメモリの量で、やれることとやれないことが変わってくるので
コア数クロック低くてもメモリ多いみたいなのがあればいいのにね
GPUのメモリの量で、やれることとやれないことが変わってくるので
コア数クロック低くてもメモリ多いみたいなのがあればいいのにね
204デフォルトの名無しさん
2020/12/08(火) 15:17:27.13ID:enlXKoHl パソコン工房のブログ記事に
RTX2060superを2枚使って、しかしSLIとかVLLinkとか使わずに性能1.8倍って例が出ている
34308番の記事か
RTX2060superを2枚使って、しかしSLIとかVLLinkとか使わずに性能1.8倍って例が出ている
34308番の記事か
205デフォルトの名無しさん
2020/12/10(木) 23:34:49.63ID:lK79U13H 3080tiでpytorch回してえ
206デフォルトの名無しさん
2021/01/12(火) 01:54:13.37ID:QwUx+qJl 1050で戦ってるが、ぐぐるこらぼの半分の速度しか出ねえ
今買い換えるならおすすめどれ?
3万くらいなら払えそう
今買い換えるならおすすめどれ?
3万くらいなら払えそう
207デフォルトの名無しさん
2021/01/13(水) 07:56:47.02ID:7sNWJYPv 1660SUPERぐらいなら買えそう
208デフォルトの名無しさん
2021/01/14(木) 10:18:01.38ID:khWOsAy5 RTX3060デスクトップ版のコスパが
これまでのNVIDIAの一般ユーザー向けGPUでは深層学習に最適かな
3584cudaコアとVRAM12GBでアメリカ価格329ドルは有難い
教師データが巨大でも助かる
なおノート向けはcudaコアはちょっと多いがVRAM6GBなので注意
またRTX30xx番台はcuda11を使えばTensorflowを動かせるとのこと
これまでのNVIDIAの一般ユーザー向けGPUでは深層学習に最適かな
3584cudaコアとVRAM12GBでアメリカ価格329ドルは有難い
教師データが巨大でも助かる
なおノート向けはcudaコアはちょっと多いがVRAM6GBなので注意
またRTX30xx番台はcuda11を使えばTensorflowを動かせるとのこと
209195
2021/01/14(木) 13:43:39.46ID:RlCOioEo caffeが異様にメモリ食うんだが。
困った。
困った。
210デフォルトの名無しさん
2021/01/14(木) 21:42:12.40ID:qplKalHw RTX3060良さそうだよな。
Google colab は無料なのは助かるけど、毎回環境構築しなきゃいけないし、やっぱりローカルで動かせると捗る。
Google colab は無料なのは助かるけど、毎回環境構築しなきゃいけないし、やっぱりローカルで動かせると捗る。
211デフォルトの名無しさん
2021/01/18(月) 09:07:06.27ID:svUqu+sR 3000番台はまだSLI出来るんだっけ
2060superでただ2枚挿しただけでとりあえず深層学習用途なら性能上がったというのが気になる
ノートPC用のRTX3080って16GBなんだなあ
是非欲しいけど当面は総額40万円くらいだろうな
2060superでただ2枚挿しただけでとりあえず深層学習用途なら性能上がったというのが気になる
ノートPC用のRTX3080って16GBなんだなあ
是非欲しいけど当面は総額40万円くらいだろうな
212デフォルトの名無しさん
2021/01/18(月) 12:33:28.51ID:LEwyyQvF ゲームやらんし
3060でいいかな
3060でいいかな
213デフォルトの名無しさん
2021/02/25(木) 09:17:50.75ID:evheNpFl 3060発売日か
214デフォルトの名無しさん
2021/03/01(月) 12:17:15.83ID:8GQloKKK 機械学習しようとrtx3090を2枚買ったんだが中古でも25万円で売れるから売ってrtx A6000に買い替えるメリットある?
gpgpu的な観点から
gpgpu的な観点から
215デフォルトの名無しさん
2021/03/01(月) 15:53:37.93ID:ahGFzuGs 電力は少なくて済むな
216デフォルトの名無しさん
2021/06/02(水) 02:14:34.84ID:TuNemlZF 3080tiと3070tiが販売されるか
しかし3080tiでもVRAM12GB
しかし3080tiでもVRAM12GB
217デフォルトの名無しさん
2022/03/11(金) 11:03:09.15ID:vTxyPKiv ようやく
CPUマルチスレッドをCUDAプログラミングに乗り換えようと来てみたけど
ほんと人少ないな。
ompオフロードじゃなくCUDAでやろうとしてる
ちょっと思ったのはデバイス側のスレッドから、複数のデバイス側のスレッドを起動できれば
ホストデバイス間のメモリ転送をぐっと少なく出切るんだけど
こういうことって出来ないのかな?
__device__
void
SubThread()
{
...
}
__gloval__
void
SubThread()
{
}
CPUマルチスレッドをCUDAプログラミングに乗り換えようと来てみたけど
ほんと人少ないな。
ompオフロードじゃなくCUDAでやろうとしてる
ちょっと思ったのはデバイス側のスレッドから、複数のデバイス側のスレッドを起動できれば
ホストデバイス間のメモリ転送をぐっと少なく出切るんだけど
こういうことって出来ないのかな?
__device__
void
SubThread()
{
...
}
__gloval__
void
SubThread()
{
}
218デフォルトの名無しさん
2022/03/11(金) 15:20:37.94ID:vTxyPKiv 途中で送信してしもた
__device__
void
SubThread(){
...
}
__gloval__
void
Thread(){
SubThread<<<1,1024>>>();
}
int
main(){
Thread<<<1,1>>>Thread();
}
みたいな。
これができないとCPUマルチコアプログラムからGPUプログラムに簡単に移行できんわ。
CPUもC#やインテルコンパイラから入ったんで、大体様子がわかって、
ompでは用意されてなかったPartitionerを先ず作ってめちゃ楽にコーディングできるようになった。
GPUはまだ手探り状態
__device__
void
SubThread(){
...
}
__gloval__
void
Thread(){
SubThread<<<1,1024>>>();
}
int
main(){
Thread<<<1,1>>>Thread();
}
みたいな。
これができないとCPUマルチコアプログラムからGPUプログラムに簡単に移行できんわ。
CPUもC#やインテルコンパイラから入ったんで、大体様子がわかって、
ompでは用意されてなかったPartitionerを先ず作ってめちゃ楽にコーディングできるようになった。
GPUはまだ手探り状態
219デフォルトの名無しさん
2022/03/11(金) 18:41:56.87ID:yfypcQRg 細かく見てないけどSubThread をグローバルにしたら呼べる
220デフォルトの名無しさん
2022/03/12(土) 01:12:58.32ID:2Ys6LOmP >>218
CUDA Dynamic Parallelism
CUDA Dynamic Parallelism
221デフォルトの名無しさん
2022/03/12(土) 10:13:53.90ID:GhWebJZd __device__を__global__に置換してみたけど
__global__内でスレッドを立ち上げるコードを書くと
THread内のSubThread<<<1,1024>>>(); 行と
main関数のThread<<<1,1>>>Thread(); 行の2箇所で"式が必要です"とコンパイルがエラーがでる
もちろん
Thread内のSubThread<<<1,1024>>>();をコメントアウトするとコンパイルもとおるし、正しく実行できる
__global__内でスレッドを立ち上げるコードを書くと
THread内のSubThread<<<1,1024>>>(); 行と
main関数のThread<<<1,1>>>Thread(); 行の2箇所で"式が必要です"とコンパイルがエラーがでる
もちろん
Thread内のSubThread<<<1,1024>>>();をコメントアウトするとコンパイルもとおるし、正しく実行できる
レスを投稿する
ニュース
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★4 [ぐれ★]
- 中国の局長は「両手をポケット」で対峙 宣伝戦で国民に示す ★3 [蚤の市★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 「クマはなるべく山に返す努力を」「クマと戦争は間違っている」動物保護活動家の主張 棲み分けと学習放獣でクマ被害なくなるのか?★7 [ぐれ★]
- とらせん IPあり
- 巨専】
- こいせん 全レス転載禁止
- 【DAZN】ワールドカップ欧州予選総合 ★5
- 侍ジャパンシリーズ2025「日本vs韓国」その12
- 【ATP】テニス総合実況スレ2025 Part 211【WTA】
- アンケート調査で「高市発言は問題なし」 93.5%wwwwwwwwwwwwwwwwwwwwwwwww [279254606]
- 自閉症が「んなっしょい」と連呼するお🏡
- 【悲報】大分市佐賀関の火事、20軒→170軒に延焼🔥 [481941988]
- 両手でフレミングの法則やってくれ [577451214]
- 日本人の海外旅行したきのマナーよくなったのはいつから
- へそグリグリ
