【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net

**デフォルトの名無しさん** · 2016/06/15(水) 14:41:15.11

このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/

**デフォルトの名無しさん** · 2016/06/15(水) 14:45:27.13

関連サイト
CUDA
http://www.nvidia.co.jp/object/cuda_home_new_jp.html

CUDAに触れてみる
http://chihara.naist.jp/people/STAFF/imura/computer/OpenGL/cuda1/disp_content

CUDA のインストール
http://blog.goo.ne.jp/sdpaninf/e/9533f75438b670a174af345f4a33bd51

NVIDIAの「GeForce 8800 GT(G92)」と次に控える64-bit GPUアーキテクチャ
http://pc.watch.impress.co.jp/docs/2007/1031/kaigai398.htm

CUDAを使う
http://tech.ckme.co.jp/cuda.shtml

NVIDIA CUDAを弄ってみたその2
http://dvd-r.sblo.jp/article/10422960.html

CUDAベンチ
http://wataco.air-nifty.com/syacho/2008/02/cuda_2044.html

KNOPPIX for CUDA
http://www.yasuoka.mech.keio.ac.jp/cuda/

**デフォルトの名無しさん** · 2016/06/15(水) 14:54:52.92

Linux* 上で CPU と GPU バッファーを共有する
http://www.isus.jp/products/c-compilers/sharing-cpu-and-gpu-buffers-on-linux/

GPUとGPGPUの歴史と特徴
http://www.cc.u-tokyo.ac.jp/support/press/news/VOL12/No1/201001gpgpu.pdf

第1回 GPUコンピューティングおよびCUDAについて
http://www.gdep.jp/page/view/248

GPUコンピューティングの歴史とCUDAの誕生
https://thinkit.co.jp/story/2010/07/02/1645
https://thinkit.co.jp/series/4792
https://thinkit.co.jp/story/2010/07/30/1678

**デフォルトの名無しさん** · 2016/06/15(水) 20:36:38.63

CUDAってその分野でかなり使われてるの？
Rx480買って5TFLOPSヒーハーしようと思ってんだけど、OpenCLよりCUDAの方がいいの？

**デフォルトの名無しさん** · 2016/06/16(木) 11:48:40.77

>1 乙

**デフォルトの名無しさん** · 2016/06/17(金) 11:47:34.05

ttps://ja.wikipedia.org/wiki/CUDA
デメリット

ハードウェアベンダーに依存しないOpenCLやDirectComputeと比較すると、
CUDAはNVIDIA製のGPUでしか使えないという制約がある。
このため、CUDAの機能に過度に依存したプログラムを書くと、
アプリケーションのポーティング・移植が困難になる可能性がある（ベンダーロックイン）。

また、最初からグラフィックス連携用途を想定して設計されたDirectComputeと比較すると、
（相互運用APIが用意されているとはいえ）
GPU演算結果をグラフィックス用途に直接利用する場合はオーバーヘッドが大きくなる。

**デフォルトの名無しさん** · 2016/06/17(金) 11:49:44.24

PyCUDA
ttps://mathema.tician.de/software/pycuda/
CUDA：「超並列コンピューティング」はじめました
ttps://codezine.jp/article/detail/8429
CUDAを使ったGPUプログラミング超入門
ttp://qiita.com/Keech/items/381495ed90e012d69f1a
CUDA で並列コンピューティング
ttp://www.nvidia.co.jp/object/cuda-parallel-computing-platform-jp.html
はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす!
ttps://www.amazon.co.jp/dp/4777514773

**デフォルトの名無しさん** · 2016/06/18(土) 02:19:19.60

CUDA自体は、ライブラリが結構良くできてるのが多い印象

open clは、まだまだこれからって感じかな

**デフォルトの名無しさん** · 2016/06/19(日) 01:01:03.69

amdがcuda採用しろ

**デフォルトの名無しさん** · 2016/06/19(日) 09:14:04.48

つ
http://gpuopen.com/compute-product/hip-convert-cuda-to-portable-c-code/

**デフォルトの名無しさん** · 2016/06/19(日) 12:33:23.96

っアー

**デフォルトの名無しさん** · 2016/06/19(日) 14:56:12.95

>>10
前にニュースみたけど
いつ、出来るんだろうか…？

**デフォルトの名無しさん** · 2016/07/05(火) 13:31:36.76

FPGAの替わりになる？

**デフォルトの名無しさん** · 2016/07/08(金) 05:05:10.58

ならないでしょ

**デフォルトの名無しさん** · 2016/07/09(土) 06:25:21.68

CUDAを使ってみたくて7.5をインストールしたんだけどSDKってどこにインストールされてるの？

**デフォルトの名無しさん** · 2016/07/09(土) 09:35:03.17

2ch書いたりググったりしなくても、そのPC内で即分かる簡単なこと聞いてる時点でCUDAやらんほうがいいよw

**デフォルトの名無しさん** · 2016/07/09(土) 15:13:36.10

gpu computing SDK が無いってことならcode samplesがそれだよ

**デフォルトの名無しさん** · 2016/07/09(土) 17:31:11.95

>>16
一応２ちゃんで発表するのが礼儀

**デフォルトの名無しさん** · 2016/07/10(日) 02:23:44.63

久々に来たがLink切れが多いな。
Ubuntuで勝手にデバドラがUpdateされて(CUDA非対応の最新版)しまうのを
止める呪文は何だっけ? 毎回忘れて、最初は調子良く動いてたマシンが
Updateの度に動かなくなって、Fxxk nVidia!って思う。

**デフォルトの名無しさん** · 2016/07/15(金) 20:50:26.63

CUDA5かなんかからメモリ空間が結合されてcudaMemcpyが必要なくなったとか言う文献をみたんだが、Memcpyいらないのマジ？

**デフォルトの名無しさん** · 2016/07/19(火) 20:55:44.92

もちろん
最近ミミズ見てて考えたんだが
我々って結局、管なんじゃないか？
管に管を維持するための色々な機能がついている、ような気がする

**デフォルトの名無しさん** · 2016/07/19(火) 21:50:33.95

>>21
単細胞時代に管はなかった

**デフォルトの名無しさん** · 2016/07/19(火) 23:32:31.17

イソギンチャクあたりまで管はないけどねぇ

**デフォルトの名無しさん** · 2016/08/30(火) 22:26:06.76

ゲームやめて（）
AIしようと思ったがcaffe インスコできへんのやけど( ；´Д｀)
error : identifier

**デフォルトの名無しさん** · 2016/08/30(火) 22:37:15.39

error : identifier "cudnnActivationDescriptor_t" is undefined

**デフォルトの名無しさん** · 2016/08/31(水) 13:32:53.23

エラーをまずは調べてみよう

**デフォルトの名無しさん** · 2016/09/02(金) 13:09:45.69

GPUでwebサーバー動かせる？

**デフォルトの名無しさん** · 2016/09/02(金) 14:43:03.39

完全にCPUの置き換えとして用いるのは無理だろうな。

**デフォルトの名無しさん** · 2016/09/02(金) 14:48:38.48

GPUの中で処理が完結しないから意味がないか

**デフォルトの名無しさん** · 2016/09/03(土) 21:47:53.62

webサーバは動かせないけど
お湯なら沸かせそう

**デフォルトの名無しさん** · 2016/09/06(火) 14:13:22.82

銭湯でも経営するか

**デフォルトの名無しさん** · 2016/10/21(金) 12:10:30.81

GPUは銭湯能力で優劣つけるべき

**デフォルトの名無しさん** · 2016/11/06(日) 14:38:40.07

>>21
生き物は円柱形で検索

**デフォルトの名無しさん** · 2016/11/26(土) 13:36:47.19

http://www.newsweekjapan.jp/yukawa/2016/11/ai-4_2.php
「Universal Probability Language」って言う技術を使うと「東大君」が最近断念した
自然言語処理が出来るようになるらしいね

日本と英米だとこの分野は天地の差がある

**デフォルトの名無しさん** · 2016/11/26(土) 15:41:52.96

>その結果、われわれが達した結論は、「完成」の定義が人によって異なるのではないか、ということだった。

**デフォルトの名無しさん** · 2016/11/26(土) 18:56:34.99

>>35
なんでも完璧を目指すのではなく、ADSLやD-WAVE量子コンピューターのような
「現実解」を目指すと言う事

**デフォルトの名無しさん** · 2016/11/26(土) 19:26:09.59

>日本と英米だとこの分野は天地の差がある
「この分野」ってのが何を指してるのかはっきりしないけど
AI分野って意味では現状、天地の差と言えるのは予算で規定される研究規模くらいやで
まあそれが決定的な違いを産んでるって言えなくもないけど
金銭的バックアップのもとで色んな種を蒔く余裕は日本の科学技術界にないからね

あとその件の技術は記事の本文でも疑ってるけど、
所謂「中国語の部屋」の完成を目指しているものなんじゃない？

×「東大君」○「東ロボ君」の新井さんの講演聴いて懇親会で話もできたんだけど
東ロボ君プロジェクトはそもそも現状のAI技術の限界をある程度認識してて、
その上で入試問題への挑戦っていうベンチマーク的な実践実験で証拠を提示するってことをやってたよ
そもそも東ロボ君は技術的に新しいことをやるというより現状の技術の可能性と課題を洗い出すためのプロジェクトだし
その成果の一つが自然言語の意味的理解の困難さを示したってことだよ
つまり今回「断念」って報道のされ方をしたお話ね
繰り返すけど自然言語処理(中国語の部屋)とは違うお話だよ

**デフォルトの名無しさん** · 2016/11/29(火) 13:13:11.65

今CUDA by Example 汎用GPUプログラミング入門を読んで勉強しているんですけど
この本のサンプルコードってもう手に入らないんでしょうか？

**デフォルトの名無しさん** · 2016/11/30(水) 00:29:37.97

>>38
https://developer.nvidia.com/cuda-example
ここのzipじゃいかんの？

**デフォルトの名無しさん** · 2016/12/09(金) 03:45:46.66

>>39 ちゃんと探せてませんでしたありがとうございます。

**デフォルトの名無しさん** · 2017/01/06(金) 07:11:43.14

windowsでcudaやってるんだけど
visual studio commutity消してcl.exeだけ残しておけば
コンパイル通る？

**デフォルトの名無しさん** · 2017/01/06(金) 14:44:04.26

リンクしなくていいのか

**デフォルトの名無しさん** · 2017/01/07(土) 11:30:33.70

>>42
シャンプーの後にはちゃんとリンスはしてる

**デフォルトの名無しさん** · 2017/01/07(土) 17:06:51.33

cl.exeだけじゃコンパイルも出来ない。
コンパイラ本体は c1.dll と c1xx.dll と c2.dll。
昔はWindowsSDKにVSのIDEなしでコマンドラインツールだけ入ってたりしたけどな。
よく解らんかったらインストールディレクトリの VC/bin/ をまるごと残しとけ。

**デフォルトの名無しさん** · 2017/01/07(土) 17:12:36.97

リンカだけならSDKにも入ってる

**デフォルトの名無しさん** · 2017/01/09(月) 18:23:46.66

超初歩的な質問ですが、
三次元配列をGPUにメモリ確保してCPUからデータコピーってどうやればいいんでしょうか

**デフォルトの名無しさん** · 2017/01/09(月) 18:25:23.28

三次元配列とは？
x,y,z頂点の一次元配列のことを言ってる？

**デフォルトの名無しさん** · 2017/01/09(月) 18:47:08.26

そんな感じです、C言語でいうとarray[][][]みたいな

1次元のように簡単にはできないですよね…

**デフォルトの名無しさん** · 2017/01/09(月) 20:17:49.87

キラッ☆

**デフォルトの名無しさん** · 2017/01/09(月) 20:36:08.40

GPUじゃない普通のプログラムは配列のサイズ計算してmallocするだろ？GPUでも同じだ。

**デフォルトの名無しさん** · 2017/01/09(月) 21:12:30.61

三次元配列で連続したアドレスにしたいんですが、CPUはできるんですけどGPUはそのままだとエラーが出てできませんでした…
エラーはa value of type "cudaError_t" cannot be assigned to an entity of typeです

**デフォルトの名無しさん** · 2017/01/10(火) 08:26:07.18

そりゃ関数の使い方間違えてるんだろ

**デフォルトの名無しさん** · 2017/01/10(火) 14:21:30.09

>>51
alignmentかな

**デフォルトの名無しさん** · 2017/01/10(火) 17:18:06.48

初歩的な質問かもしれませんが、
.cファイルから.cuファイルの関数を呼び出す際にリンカエラーが
出るのですがどうすればよいのでしょうか

**デフォルトの名無しさん** · 2017/01/10(火) 18:10:08.05

export

**デフォルトの名無しさん** · 2017/01/10(火) 20:12:19.14

>>51
四次元にしてみたら

**デフォルトの名無しさん** · 2017/01/12(木) 13:45:58.21

DRAMのパーティションはパーティションの数が３こあるとすると
３つおきの連続した256バイトが一つのパティーションになると
いう理解であってますか？

**デフォルトの名無しさん** · 2017/01/20(金) 22:13:42.62

gpuを買い替えるか迷ってるんだけどcuda使う上で参考になるベンチマーク的なものを公開してるサイトってありますか？

ちなみに現在使ってるのはgtx970です
10シリーズは機械学習に最適化していると聞いたので気になっています。

**デフォルトの名無しさん** · 2017/01/20(金) 23:20:57.30

うん

**デフォルトの名無しさん** · 2017/01/20(金) 23:30:22.94

>>58
のようなサイトがあればURLを教えてください

**デフォルトの名無しさん** · 2017/01/21(土) 07:48:29.10

>>58
目的から若干ずれるかもしれんが
http://qiita.com/jiny2001/items/7af1f5dbfaa6c5e4a9f2

**デフォルトの名無しさん** · 2017/01/21(土) 09:11:33.99

CompuBenchが定番。

**デフォルトの名無しさん** · 2017/01/21(土) 13:43:41.18

>>61
>>62

参考になります
compubenchでcudaのスコアを比較してみましたが1060でも970より若干スコアは良いようですね

**デフォルトの名無しさん** · 2017/02/02(木) 13:38:03.58

cudaコアはどういう単位なの？
cudaコアがn個あったら、n種類のcudaプログラムを同時実行できますか？
コア内でスレッド数等が足りるとして。

**デフォルトの名無しさん** · 2017/02/02(木) 17:08:50.92

cudaコア1個でスレッドが1個動く

**デフォルトの名無しさん** · 2017/02/10(金) 05:08:21.15

viennacl
実質1年ぐらい更新ない気がするんだが
使って大丈夫なのかな

**デフォルトの名無しさん** · 2017/02/10(金) 08:22:35.29

シンギュラリティしてるぅ？

**デフォルトの名無しさん** · 2017/02/15(水) 12:32:42.97

Alea GPUでええな

**デフォルトの名無しさん** · 2017/05/07(日) 11:41:59.26

a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソースファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソースファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。

**デフォルトの名無しさん** · 2017/05/07(日) 15:33:02.73

色々実験してみたらnmake.exeではメイクできました。
mingwのmake.exeは駄目でした。

**デフォルトの名無しさん** · 2017/05/10(水) 23:13:56.55

ウインドーズなんて書いてる人、この二十数年の間でも聞いたことがない。初めて見たよw
あまりに斬新過ぎてワロタ

**デフォルトの名無しさん** · 2017/05/10(水) 23:18:39.73

そんなことで笑えるならすごい人生楽しそう

**デフォルトの名無しさん** · 2017/05/11(木) 00:41:43.46

みたことあるな
新聞だったかな

**デフォルトの名無しさん** · 2017/05/30(火) 01:31:23.24

空いてるメモリ目一杯floatの配列で埋めたい
メモリ容量足りなくてエラーになると遅くなるので
ちょい余裕あるぐらいでmallocする方法ない？

**デフォルトの名無しさん** · 2017/05/31(水) 23:20:29.74

C++に触るの自体がほぼ初めてなのですが、CUDAと併せて勉強できるいい本は有りませんか？
プログラムはFortranしか触ったことがなく、CUDA by exampleだけだと難易度が高く困ってます

**デフォルトの名無しさん** · 2017/06/01(木) 11:43:59.76

詳しくはwebで検索

**デフォルトの名無しさん** · 2017/06/20(火) 11:52:28.52

cuspが疎行列だけじゃなくて密行列も便利だった

**デフォルトの名無しさん** · 2017/07/03(月) 14:29:28.07

>>75
内容古いかもしれないが
インプレスの　CUDA by Example 汎用GPUプログラミング入門　とかは?

**デフォルトの名無しさん** · 2017/07/03(月) 14:32:00.95

>>78
あ　ゴメン
c++の文法説明込みだったら　違った

**デフォルトの名無しさん** · 2017/08/06(日) 16:23:07.09

カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか？
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。

LinuxでCUDA8、GTX1080です。

**デフォルトの名無しさん** · 2017/08/10(木) 06:57:43.66

openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある

**デフォルトの名無しさん** · 2017/08/10(木) 07:55:32.26

多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい

80 · 2017/08/11(金) 09:30:37.96

レスありがとうございます。

>>81
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。

>>82
Hyper-Q機能？でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか？

**デフォルトの名無しさん** · 2017/08/15(火) 16:51:41.09

>>29
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理

**デフォルトの名無しさん** · 2017/08/21(月) 21:00:28.62

vs2017で使えん

**デフォルトの名無しさん** · 2017/08/31(木) 18:49:59.24

初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか？

**デフォルトの名無しさん** · 2017/08/31(木) 18:58:29.12

何のために？

**デフォルトの名無しさん** · 2017/08/31(木) 19:58:21.56

モンテカルロ内でやりたいんだろ

**デフォルトの名無しさん** · 2017/09/26(火) 05:36:17.39

Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか？

**デフォルトの名無しさん** · 2017/09/26(火) 06:32:45.58

もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず

でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない

兼用バイナリというのは、ない

ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない

**デフォルトの名無しさん** · 2017/10/19(木) 22:15:29.66

DirectSoundの処理をCUDAで処理するようなライブラリないのかしら

**デフォルトの名無しさん** · 2017/12/04(月) 23:59:10.12

配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで

**デフォルトの名無しさん** · 2017/12/05(火) 08:13:25.32

配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。

**デフォルトの名無しさん** · 2017/12/20(水) 04:47:46.09

windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか？

**デフォルトの名無しさん** · 2017/12/21(木) 13:14:18.72

おｋ

**デフォルトの名無しさん** · 2017/12/31(日) 05:34:34.69

科学技術計算に使うならtitanではなくteslaでしょうか？

**デフォルトの名無しさん** · 2017/12/31(日) 10:17:54.45

scipy

**デフォルトの名無しさん** · 2017/12/31(日) 12:13:16.21

>>96
買えればな

**デフォルトの名無しさん** · 2018/01/03(水) 03:49:56.24

visual profilerのwindows環境での使い方を解説してるサイトって無いですか？

**デフォルトの名無しさん** · 2018/01/03(水) 04:21:39.75

>>99
調べる前に使う方が手っ取り早く覚えられるよ。

**デフォルトの名無しさん** · 2018/01/04(木) 03:47:25.18

>>100
https://qiita.com/Hiroki11x/items/3737e4e267c1035a4b55
ちょっといじったりはしてるんですけどこのページの「nvprofでprofileをとる」の部分でwindowsでのやり方が分からず詰んでます

ちなみにこのソフトって実行中のプログラムの動きを見るのではなくソースコードからどういう風に動くかを表示してくれるものですよね？

**デフォルトの名無しさん** · 2018/01/04(木) 07:08:13.82

>>101
宗教的な理由がないならVisualStudioとセットで使った方がいい。
ほぼ悩むことなく使えるから。

**デフォルトの名無しさん** · 2018/01/04(木) 14:37:10.89

>>102
Nsightって奴ですねありがとうございます
やってみます

**デフォルトの名無しさん** · 2018/02/01(木) 16:47:45.03

cuda9.1 でコンパイルに成功している人はいませんか？
サンプル simpleTemplates を VisualStudio2017(msvc++19.11) で鬼のようエラーが出てコンパイルできません
http://codepad.org/2kWkUrQ0

**デフォルトの名無しさん** · 2018/02/02(金) 07:32:53.45

エラー無視すんな

**デフォルトの名無しさん** · 2018/02/02(金) 14:42:34.94

>>105
メーカー提供のライブラリがこんなエラーを吐くんですが…

**デフォルトの名無しさん** · 2018/02/02(金) 16:24:33.04

>cl : コマンドライン warning D9002 : 不明なオプション 'Wp64' を無視します。

**デフォルトの名無しさん** · 2018/02/12(月) 10:28:57.39

nvccだけ使えればいいと思ってVirtualBox+Ubuntu16.04にCUDA 9.1 Toolkitをインストールしてみたら
ログイン直後にgnome-sessionが死ぬようになってGUIが使えなくなってしまった。
どこで聞こうか迷ったけど、とりあえず同じような経験の人いないだろうか。

ドライバ周りが原因のような気もするけど、Windows版みたいにディスプレイドライバだけ除いて
インストールするとかできないのかな。

**デフォルトの名無しさん** · 2018/02/12(月) 14:52:40.91

>>108
そもそも一般ユーザーでインストールすれば、ドライバが書き換わってしまうことはない

**デフォルトの名無しさん** · 2018/02/12(月) 16:57:29.11

cudaとかの大きなくくりのメタパッケージじゃなくてcuda-compilersとか個別に指定すりゃいいんだな。
ドライバを含まないcuda-toolkit-9-1でも駄目だったから何かGUIツールでも関係していたんだろうか。

**デフォルトの名無しさん** · 2018/02/16(金) 14:06:42.48

NVIDIA GeForce MX150 って使える？

**デフォルトの名無しさん** · 2018/02/16(金) 21:00:32.13

対応GPUがスタートガイドやマニュアルにあるからそれを確認

**デフォルトの名無しさん** · 2018/02/17(土) 02:17:22.97

逝けるよって書けば信用するのか
すばらしき２ちゃん

**デフォルトの名無しさん** · 2018/02/17(土) 02:31:09.51

ほれ
https://www.geforce.com/hardware/notebook-gpus/geforce-mx150/specifications

**デフォルトの名無しさん** · 2018/02/17(土) 02:36:13.64

こっちか
https://www.geforce.com/hardware/technology/cuda/supported-gpus?field_gpu_type_value=All&;page=3

**デフォルトの名無しさん** · 2018/02/18(日) 02:05:22.31

>>111
これな
https://devtalk.nvidia.com/default/topic/1023574/cuda-toolkit-9-is-not-available-in-geforce-mx150/

**デフォルトの名無しさん** · 2018/02/18(日) 11:07:01.37

これ古過ぎますか？まだ役に立つ？

CUDA C
https://www.amazon.co.jp/dp/4844338919

**デフォルトの名無しさん** · 2018/02/18(日) 11:32:49.61

これからCUDAを勉強するなら問題ないでしょ
基本は変わっていないんで

**デフォルトの名無しさん** · 2018/02/18(日) 13:03:27.13

問題なのは、最新のcuda9.1が最新のmsvc++ でコンパイルできないことなんだが…

**デフォルトの名無しさん** · 2018/02/19(月) 23:00:57.77

>>117
これかなりいいよ。
最新は網羅できてないが、日本語では最新じゃないかな。
cuda 6世代で検証は７でされてる

**デフォルトの名無しさん** · 2018/02/21(水) 14:09:43.32

>>119
gcc使おう！

**デフォルトの名無しさん** · 2018/02/21(水) 14:23:56.10

>>121
Windows バイナリーは microsoft VC++ にしか対応していない、とのこと
http://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html

**デフォルトの名無しさん** · 2018/02/21(水) 15:49:25.59

そりゃバイナリならそうだがそういう話じゃなくて

**デフォルトの名無しさん** · 2018/02/21(水) 16:30:30.19

>>123
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない

**デフォルトの名無しさん** · 2018/02/22(木) 17:44:56.30

>>122
WSLでubuntu動かせばよくね？

**デフォルトの名無しさん** · 2018/02/22(木) 18:06:40.02

>>125
その ubuntu 上で生成したコードは、ubuntu なしの　Windows 上で動くのか？
動かないのならば、よいわけがあるまい

**デフォルトの名無しさん** · 2018/02/23(金) 16:52:21.65

最新のはクロスコンパイル不可能なん？

**デフォルトの名無しさん** · 2018/02/23(金) 17:00:07.99

>>127
クロスコンパイルとはいわないのでは？
Linux 上で gcc を使ったコンパイル成果物は、Windows では動かない
Windows 上で cl を使ったコンパイル成果物は、Linux 上では動かない

**デフォルトの名無しさん** · 2018/02/23(金) 22:59:05.62

>>128
Linux上のgccでWindows用バイナリを吐くこともできる。

**デフォルトの名無しさん** · 2018/02/28(水) 14:29:08.26

(棒)すげー

**デフォルトの名無しさん** · 2018/03/11(日) 12:38:36.83

CUDA ToolkitはまだVS2017 15.4までしか対応してないんだよな。
もう15.6出たのから15.4は入手できなくなるし、どうにかしてほしいなぁ。

**デフォルトの名無しさん** · 2018/03/14(水) 22:02:39.83

え？コンパイルやビルドができないほど深刻な問題でてるっけ？

**デフォルトの名無しさん** · 2018/03/14(水) 23:17:19.01

やってみた？nvcc動かんよ。たしかNSIGHTのインストールも失敗するはず。
フォーラムでも公式が「サポートしてるのは15.4まで」と言っている。

**デフォルトの名無しさん** · 2018/03/15(木) 21:42:37.30

フォーラムの中の人も、半年くらい前は「申し訳ない」とかなんとか言ってたのが
最近はもう投げ遣りな感じだね。
修正がそんなに難しいのかね？NVIDIAの中で何が起きているんだろうか。

**デフォルトの名無しさん** · 2018/03/16(金) 14:20:39.88

公務員体質

**デフォルトの名無しさん** · 2018/03/16(金) 15:23:49.95

勘弁してほしい、VS installer を思わず起動してアップデートを開始させてしまっては後悔しているんだ…

**デフォルトの名無しさん** · 2018/03/17(土) 01:16:13.43

15.4.5 でも無理？
https://docs.microsoft.com/ja-jp/visualstudio/productinfo/installing-an-earlier-release-of-vs2017#installing-the-earlier-release

**デフォルトの名無しさん** · 2018/03/17(土) 07:59:31.00

15.4までが大丈夫。そのページが15.5になってしまったらおしまいってこと。

**デフォルトの名無しさん** · 2018/03/24(土) 20:53:51.41

CUDA試してみたいんですが、入門としてはGeforce GTX 1060くらいあれば有意にCPU core i7 4Ghz より速くなりますか？

**デフォルトの名無しさん** · 2018/03/25(日) 00:11:04.74

単精度で性能を活かせる処理なら速い
AVXを駆使しても1060の性能は出ない

**デフォルトの名無しさん** · 2018/03/25(日) 00:16:26.55

単精度
1060 2.8TFlops
i7 4GHz 0.5TFlops

**139** · 2018/03/25(日) 00:29:09.29

ほほう、５倍速以上ですか。
ありがとうございます。

**139** · 2018/03/25(日) 00:38:35.35

ちなみに用途はパイソンのディープラーニング用ライブラリの使用です。

**139** · 2018/03/25(日) 00:59:31.33

ちなみに主要な製品の>>141みたいな性能比較の一覧ってどこかにあります？

**デフォルトの名無しさん** · 2018/03/25(日) 02:40:05.71

Keras/TensorflowでCUDA9.0とCuDNN7.0.5を使ってるけど、
980でCPUの4～5倍ぐらい、1060・1070だと7～8倍ぐらい速くなった

あとは、GPUの性能よりもマザボやメモリとの相性が大きかったりする
ECCメモリ積んだサーバ機だと足を引っ張られるし、
1070のデスクトップ機よりも1060のゲーミング用ノートPCの方が速かったりする

あと、スペックの違うグラボを2枚挿しすると、単体運用よりも演算が遅くなることがあるから注意

**デフォルトの名無しさん** · 2018/03/25(日) 08:15:49.40

複数枚刺しでCUDA使うならSLI-offがデフォ。

**デフォルトの名無しさん** · 2018/03/25(日) 11:36:30.54

>143-144
https://ja.wikipedia.org/wiki/GPGPU

**デフォルトの名無しさん** · 2018/03/25(日) 11:53:57.75

>>144
自分で計算すれば良いんですよ
クロック、コア数、ベクタ長さ、同時計算数から

**139** · 2018/03/25(日) 19:52:41.28

Geforce GTX 1060買ってきました。
早速試そうと思ったが、電源ユニットに6pinケーブルがないT△T

電源も買い替えかなぁorz

**デフォルトの名無しさん** · 2018/03/25(日) 20:17:14.43

おめでとう
まずは2.8TFlopsで動くテストコードの記述から
単精度でひたすら積和

**デフォルトの名無しさん** · 2018/03/25(日) 20:51:30.02

スリムタワーなんか買うんじゃなかったorz
電源もそうだがグラボがケースに収まらないしorz orz
蓋外せば済むことだけど orz orz orz

**デフォルトの名無しさん** · 2018/03/26(月) 01:19:57.55

電源容量気をつけてな
300wとかだと足りないかもしれない

**デフォルトの名無しさん** · 2018/03/26(月) 04:49:23.49

>>151
わろた

蓋開けたままだと空冷効率却って悪くなるんじゃなかったかな
蓋開けるなら扇風機も当てた方がいい

**デフォルトの名無しさん** · 2018/03/26(月) 04:57:26.52

めも
http://chimolog.co/2017/08/bto-pc-airflow.html
https://akiba-pc.watch.impress.co.jp/docs/dosv/662237.html
https://akiba-pc.watch.impress.co.jp/docs/dosv/747742.html
http://ascii.jp/elem/000/001/215/1215731/

**139** · 2018/03/27(火) 22:47:39.83

一応電源買ったが平日はまとまった時間が取れないので土日で作業しよう。
保証期間とかあるけど平気だよね？

ちな750W

**デフォルトの名無しさん** · 2018/03/28(水) 06:47:45.49

また無駄にデカイ電源を

**デフォルトの名無しさん** · 2018/03/31(土) 00:00:36.28

いっそzen+で一台組もうか？ｗ

**デフォルトの名無しさん** · 2018/03/31(土) 04:23:03.69

極地に引っ越せ

**139** · 2018/04/01(日) 00:23:36.11

1060設置完了しました。
とりあえず、core i7 のiGPUから解像度が上がっていい感じ。
いままでディスプレイのMAX解像度出てなかったからね。
あとはpytorchが動いてくれれば…

**139** · 2018/04/02(月) 22:02:29.92

動いたっぽいけど消費時間の測り方が分からんｗ
まあパイソンの勉強するしかないか

**デフォルトの名無しさん** · 2018/04/03(火) 00:26:12.77

最近pythonスレで速度計測コード貼ってる人がいた

**139** · 2018/04/03(火) 22:11:12.18

kwsk

**デフォルトの名無しさん** · 2018/04/03(火) 23:12:19.70

1060安くなったね

**デフォルトの名無しさん** · 2018/04/10(火) 14:29:01.82

Nvidiaは今月で32ビットオペレーティングシステムのパフォーマンスの向上、新機能、バグ修正などのサポートを終了する
重要なセキュリティアップデートは、2019年1月まで32ビット用に提供されます。
これには、以下のオペレーティングシステムが含まれます。
- Microsoft Windows 7 8 / 8.1 10
- Linux FreeBSD

**デフォルトの名無しさん** · 2018/04/12(木) 21:45:56.77

すいません、自分のグラボがcudaのどのバージョンで使えるのか
どこを見たらわかるか教えていただけないでしょうか？

windows 10で
GeForceGT610という弱めのグラボを使っています。
↓グラボのHPを見るとCUDAは対応しているようなのですが
ttp://www.nvidia.co.jp/object/geforce-gt-610-jp.html#pdpContent=1

cudaのHPでは対応グラボにのってませんでした（例だから？）
ttp://www.nvidia.co.jp/object/cuda_learn_products_jp_old.html

**デフォルトの名無しさん** · 2018/04/13(金) 00:51:21.10

>>165
https://www.geforce.com/hardware/technology/cuda/supported-gpus
こっちはどう？全部見てないけど。

**デフォルトの名無しさん** · 2018/04/13(金) 02:54:37.02

610Mは演算能力2.1で最低スペックだけど、一応対応しているみたいだよ
https://developer.nvidia.com/cuda-gpus

**デフォルトの名無しさん** · 2018/04/13(金) 02:56:52.47

↑610Mだけじゃなくて、610の方でも同じ

**デフォルトの名無しさん** · 2018/04/13(金) 11:00:08.69

大昔のcuda コア数4個とかのグラボでも対応しているといえば対応してること　になるけど
おもちゃのつもりで買って結局ゴミにした思い出

悪いこと言わないので最低限でもgtx1070tiとかにしておけ

**デフォルトの名無しさん** · 2018/04/13(金) 12:53:26.22

>>165
例だからじゃなくて古いページの情報観てるからじゃね？

**165** · 2018/04/13(金) 22:53:22.51

>>166
>>167
ありがとうございます
自分のグラボでもcuda対応してるんですね
ほっとしました。
頑張って動かしてみます。

>>169
いままでグラボが必要になることがそんなになかったもので・・・
これでcuda動かせるようになったら買い替えも検討したいです

**デフォルトの名無しさん** · 2018/04/14(土) 09:03:48.32

gtx960利用でx265nvencエンコードしてるけどGPU可動が何時も30%くらいで少ないけど
もっとGPU使用率を増やすにはどうしたら良いですか?

**デフォルトの名無しさん** · 2018/04/14(土) 11:20:07.58

>>172
エンコって並列化できるん?
ならばプロセスを3つ同時に走らせるとか

**デフォルトの名無しさん** · 2018/04/14(土) 15:36:05.57

Occupancyが上がらない状態かバスが支配的なことが考えられるが、
とりあえずVisualProfilerかなんかでどこが原因か見てみれば？

**デフォルトの名無しさん** · 2018/05/23(水) 19:49:54.06

僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

Q45FH

**デフォルトの名無しさん** · 2018/05/23(水) 21:24:03.57

Q45FH

**デフォルトの名無しさん** · 2018/07/05(木) 00:33:41.64

T85

**デフォルトの名無しさん** · 2018/10/08(月) 11:29:19.78

朗報
https://www.anaconda.com/blog/developer-blog/tensorflow-in-anaconda/

**デフォルトの名無しさん** · 2018/10/22(月) 20:29:13.91

RTXのtensorコアってどうなの？

**デフォルトの名無しさん** · 2019/01/03(木) 14:15:50.59

1080Ti買ってきてドライバインストールしたんだけど、GPU-Zで見たときOpen-CLだけチェック入ってなくて
困ってるんだけど、コレって別にドライバー持ってくる必要があるの？

**デフォルトの名無しさん** · 2019/01/03(木) 14:29:58.49

https://www.techpowerup.com/forums/threads/open-cl-disappeared.233623/
https://forums.guru3d.com/threads/not-showing-open-cl-support-in-gpu-z.319926/

**デフォルトの名無しさん** · 2019/07/23(火) 17:02:22.82

quadro p600のWSにcuda入れようとしてるのだけど
10.1がパスカル世代の面倒見るのはteslaだけって認識でいいの？
390系のドライバしか入らなくて困ってる。
cuda9.1だとこんどはgcc 6以上はあかんとサンプルプログラムのヘッダがコンパイル時にハネてくる。
なんか詰んでる

**デフォルトの名無しさん** · 2019/07/23(火) 17:03:06.53

>>179
倍精度ゲロ遅なんでしょ

**デフォルトの名無しさん** · 2019/08/04(日) 08:51:33.67

でかいjpegファイルを手頃なサイズに縮小することがよくあって、
数が多いので結構な時間(数時間)がかかる

これを何とかGPUのパワーで短縮できないものか

**デフォルトの名無しさん** · 2019/08/04(日) 10:17:38.13

スレチ

**デフォルトの名無しさん** · 2019/11/27(水) 13:29:04.23

GTX1080のあるPCでcudaとcuDNNとAnacondaとTensorflowをインストール

GTX1080には9.0が合うのかと調べて、VS2015をインストールしてからcudaもバージョン合わせて入れる

Anaconda入れて早速仮想環境作ったが何故かその時はPython3.7しか選べなかった
そしたらconda install tensorflow-gpuで勝手に2.0を選び、型が合わないとエラー

conda install tensorflow-gpu==1.15でもcuda runtimeと合わない
cudaが10じゃないとダメという

1.12にしたら、今度はPythonが3.6でないとダメという
つまりこの仮想環境丸ごとダメ

捨てたあとで、もう一回作ろうとしたらPython3.6選べた
だからconda install tensorflow-gpu==1.12で、やっと動いた

ちょっとでも古い機器だともう合わないとか、敏感だよなあ

**デフォルトの名無しさん** · 2019/12/04(水) 13:02:39.14

ところがRTX2000番台は事前にVSもCUDAもcuDNNも入れずにAnacondaだけで
tensorflowがインストールできてしまった

この数日で色々変わったらしい

**デフォルトの名無しさん** · 2019/12/04(水) 13:24:12.88

おめおめ

**デフォルトの名無しさん** · 2020/02/14(金) 11:55:27.53

RTX2000番台はAnacondaからPyTorchでGPUを使う設定に出来たがChainerでcupyからGPU呼ぶのは失敗

GTX1000番台はAnacondaからChainerでGPU使えるように苦労して設定したら、PyTorchは
「これ古すぎてGPU使えない」と表示された

一長一短
ところで16xx系列ではどうなるんだろう

**デフォルトの名無しさん** · 2020/04/08(水) 11:14:16.32

PyTorch使いたかったら2000番台がいいか

2070以上、せめて2060superがいいか
でも中古でもそれなりの値段

そしてGPU上のメモりが8gb以上ないと動かないモジュールも多くて2060無印があかん事に

**デフォルトの名無しさん** · 2020/06/25(木) 09:14:06.05

wddm2.7対応ドライバで
bandwidthTestにおいてpagedメモリの転送速度向上を確認した

pinedだとhtod、dtohともに13GB/sec
pageableだとwddm2.6は8GB/sec、2.7だと12GB/secくらい

**デフォルトの名無しさん** · 2020/09/29(火) 22:45:56.87

GTX 1660 SUPERはCUDAに対応してますか？

**デフォルトの名無しさん** · 2020/09/30(水) 01:11:13.65

>>192
https://www.nvidia.com/ja-jp/geforce/graphics-cards/gtx-1660-super/

GPU エンジンの仕様:
1408 NVIDIA CUDA® コア
6GB GDDR6標準メモリ構成
192-ビット

**デフォルトの名無しさん** · 2020/10/04(日) 03:16:42.67

CUDAのバージョンを不問とするならGeforce 200シリーズ(Tesla世代)から対応はしてる

って書こうとしたら8シリーズ(2007年)からあったんかよCUDA

**デフォルトの名無しさん** · 2020/10/13(火) 20:53:42.89

CPUでの画像処理で速度が上がらずCudaを使いたいです。（windows）
①画像をGPUメモリに読み込み
②領域分割、パラレルで画像処理
　（分割部エッジにオフセット？をつけたい）
③GPUメモリの処理結果をCPUメモリに返してファイルにおとす。
こういったサンプルプログラムでいいのないでしょうか？
画像処理部だけしたい処理に書き換えればいいような。
よろしくお願いします。

**デフォルトの名無しさん** · 2020/10/14(水) 13:17:48.94

numpyをcupyに替えて
ただしcupyはGPUを使うと宣言して

みたいな奴かなあ

**195** · 2020/10/14(水) 15:54:49.86

すみません。言語を書いていませんでした。使いたいのはPythonじゃないです。
WindowsでC++で実現したいです。

**デフォルトの名無しさん** · 2020/10/14(水) 16:32:24.96

ttps://qiita.com/Keech/items/381495ed90e012d69f1a
ttps://www.kkaneko.jp/tools/win/cuda10.html

**デフォルトの名無しさん** · 2020/10/14(水) 16:34:20.05

ttps://ameblo.jp/naginosen/entry-12443269443.html

**デフォルトの名無しさん** · 2020/11/19(木) 09:55:49.41

RTX3080などで、cuda11が使えるようになってる
だがtensorflowは現時点でまだ使えない

だがPyTorchが動くとのこと！