【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net

2016/06/15(水) 14:41:15.11ID:d2Xou3GL
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
2016/07/19(火) 21:50:33.95ID:NVpJdz2s
>>21
単細胞時代に管はなかった
2016/07/19(火) 23:32:31.17ID:xOeMaPSt
イソギンチャクあたりまで管はないけどねぇ
24デフォルトの名無しさん
垢版 |
2016/08/30(火) 22:26:06.76ID:gaPBgn5H
ゲームやめて()
AIしようと思ったがcaffe インスコできへんのやけど( ;´Д`)
error : identifier
25デフォルトの名無しさん
垢版 |
2016/08/30(火) 22:37:15.39ID:gaPBgn5H
error : identifier "cudnnActivationDescriptor_t" is undefined
2016/08/31(水) 13:32:53.23ID:L/EIfshW
エラーをまずは調べてみよう
2016/09/02(金) 13:09:45.69ID:FbVLNmm2
GPUでwebサーバー動かせる?
2016/09/02(金) 14:43:03.39ID:+SW1ObrQ
完全にCPUの置き換えとして用いるのは無理だろうな。
2016/09/02(金) 14:48:38.48ID:2cG65SkE
GPUの中で処理が完結しないから意味がないか
2016/09/03(土) 21:47:53.62ID:Ha0BK37z
webサーバは動かせないけど
お湯なら沸かせそう
2016/09/06(火) 14:13:22.82ID:wXLGIf/+
銭湯でも経営するか
2016/10/21(金) 12:10:30.81ID:Yng3kb3N
GPUは銭湯能力で優劣つけるべき
2016/11/06(日) 14:38:40.07ID:Mt65DAFZ
>>21
生き物は円柱形 で検索
34デフォルトの名無しさん
垢版 |
2016/11/26(土) 13:36:47.19ID:jHyXikRe
http://www.newsweekjapan.jp/yukawa/2016/11/ai-4_2.php
「Universal Probability Language」って言う技術を使うと「東大君」が最近断念した
自然言語処理が出来るようになるらしいね

日本と英米だとこの分野は天地の差がある
2016/11/26(土) 15:41:52.96ID:e21MHUPR
>その結果、われわれが達した結論は、「完成」の定義が人によって異なるのではないか、ということだった。
36デフォルトの名無しさん
垢版 |
2016/11/26(土) 18:56:34.99ID:F5v+97Am
>>35
なんでも完璧を目指すのではなく、ADSLやD-WAVE量子コンピューターのような
「現実解」を目指すと言う事
2016/11/26(土) 19:26:09.59ID:Ry2z2nBI
>日本と英米だとこの分野は天地の差がある
「この分野」ってのが何を指してるのかはっきりしないけど
AI分野って意味では現状、天地の差と言えるのは予算で規定される研究規模くらいやで
まあそれが決定的な違いを産んでるって言えなくもないけど
金銭的バックアップのもとで色んな種を蒔く余裕は日本の科学技術界にないからね


あとその件の技術は記事の本文でも疑ってるけど、
所謂「中国語の部屋」の完成を目指しているものなんじゃない?

×「東大君」○「東ロボ君」の新井さんの講演聴いて懇親会で話もできたんだけど
東ロボ君プロジェクトはそもそも現状のAI技術の限界をある程度認識してて、
その上で入試問題への挑戦っていうベンチマーク的な実践実験で証拠を提示するってことをやってたよ
そもそも東ロボ君は技術的に新しいことをやるというより現状の技術の可能性と課題を洗い出すためのプロジェクトだし
その成果の一つが自然言語の意味的理解の困難さを示したってことだよ
つまり今回「断念」って報道のされ方をしたお話ね
繰り返すけど自然言語処理(中国語の部屋)とは違うお話だよ
2016/11/29(火) 13:13:11.65ID:qCrQS1UU
今CUDA by Example 汎用GPUプログラミング入門を読んで勉強しているんですけど
この本のサンプルコードってもう手に入らないんでしょうか?
2016/11/30(水) 00:29:37.97ID:TC5Bjkv3
>>38
https://developer.nvidia.com/cuda-example
ここのzipじゃいかんの?
2016/12/09(金) 03:45:46.66ID:fw3DcJe0
>>39 ちゃんと探せてませんでしたありがとうございます。
2017/01/06(金) 07:11:43.14ID:8Ia4s/0Q
windowsでcudaやってるんだけど
visual studio commutity消してcl.exeだけ残しておけば
コンパイル通る?
2017/01/06(金) 14:44:04.26ID:XtKi9eaG
リンクしなくていいのか
2017/01/07(土) 11:30:33.70ID:8pTxT9Y7
>>42
シャンプーの後にはちゃんとリンスはしてる
2017/01/07(土) 17:06:51.33ID:aP/UyWiv
cl.exeだけじゃコンパイルも出来ない。
コンパイラ本体は c1.dll と c1xx.dll と c2.dll。
昔はWindowsSDKにVSのIDEなしでコマンドラインツールだけ入ってたりしたけどな。
よく解らんかったら インストールディレクトリの VC/bin/ をまるごと残しとけ。
2017/01/07(土) 17:12:36.97ID:4jt/Q9EM
リンカだけならSDKにも入ってる
46デフォルトの名無しさん
垢版 |
2017/01/09(月) 18:23:46.66ID:jHsLLpyz
超初歩的な質問ですが、
三次元配列をGPUにメモリ確保してCPUからデータコピーってどうやればいいんでしょうか
2017/01/09(月) 18:25:23.28ID:4OeNzyzM
三次元配列とは?
x,y,z頂点の一次元配列のことを言ってる?
48デフォルトの名無しさん
垢版 |
2017/01/09(月) 18:47:08.26ID:jHsLLpyz
そんな感じです、C言語でいうとarray[][][]みたいな

1次元のように簡単にはできないですよね…
2017/01/09(月) 20:17:49.87ID:qK/ZEr7s
キラッ☆
2017/01/09(月) 20:36:08.40ID:EVa/TTkG
GPUじゃない普通のプログラムは配列のサイズ計算してmallocするだろ?GPUでも同じだ。
51デフォルトの名無しさん
垢版 |
2017/01/09(月) 21:12:30.61ID:jHsLLpyz
三次元配列で連続したアドレスにしたいんですが、CPUはできるんですけどGPUはそのままだとエラーが出てできませんでした…
エラーはa value of type "cudaError_t" cannot be assigned to an entity of typeです
2017/01/10(火) 08:26:07.18ID:WdYb5nlV
そりゃ関数の使い方間違えてるんだろ
53デフォルトの名無しさん
垢版 |
2017/01/10(火) 14:21:30.09ID:s989ZmsY
>>51
alignmentかな
2017/01/10(火) 17:18:06.48ID:oQDfLvCT
初歩的な質問かもしれませんが、
.cファイルから.cuファイルの関数を呼び出す際にリンカエラーが
出るのですがどうすればよいのでしょうか
2017/01/10(火) 18:10:08.05ID:UBJKCQag
export
56デフォルトの名無しさん
垢版 |
2017/01/10(火) 20:12:19.14ID:saSw9C20
>>51
四次元にしてみたら
2017/01/12(木) 13:45:58.21ID:E2IxQoCs
DRAMのパーティションはパーティションの数が3こあるとすると
3つおきの連続した256バイトが一つのパティーションになると
いう理解であってますか?
58デフォルトの名無しさん
垢版 |
2017/01/20(金) 22:13:42.62ID:8IF0nMvZ
gpuを買い替えるか迷ってるんだけどcuda使う上で参考になるベンチマーク的なものを公開してるサイトってありますか?

ちなみに現在使ってるのはgtx970です
10シリーズは機械学習に最適化していると聞いたので気になっています。
2017/01/20(金) 23:20:57.30ID:2XlTkpSB
うん
60デフォルトの名無しさん
垢版 |
2017/01/20(金) 23:30:22.94ID:GGUqy8t5
>>58
のようなサイトがあればURLを教えてください
2017/01/21(土) 07:48:29.10ID:CO+HRz8i
>>58
目的から若干ずれるかもしれんが
http://qiita.com/jiny2001/items/7af1f5dbfaa6c5e4a9f2
2017/01/21(土) 09:11:33.99ID:ij3ZsOnR
CompuBenchが定番。
63デフォルトの名無しさん
垢版 |
2017/01/21(土) 13:43:41.18ID:2F79DqM2
>>61
>>62

参考になります
compubenchでcudaのスコアを比較してみましたが1060でも970より若干スコアは良いようですね
64デフォルトの名無しさん
垢版 |
2017/02/02(木) 13:38:03.58ID:OYwNsjcS
cudaコアはどういう単位なの?
cudaコアがn個あったら、n種類のcudaプログラムを同時実行できますか?
コア内でスレッド数等が足りるとして。
2017/02/02(木) 17:08:50.92ID:j/3vYI1G
cudaコア1個でスレッドが1個動く
2017/02/10(金) 05:08:21.15ID:o/o/Ki2Y
viennacl
実質1年ぐらい更新ない気がするんだが
使って大丈夫なのかな
67デフォルトの名無しさん
垢版 |
2017/02/10(金) 08:22:35.29ID:s5e3qUT1
シンギュラリティしてるぅ?
68デフォルトの名無しさん
垢版 |
2017/02/15(水) 12:32:42.97ID:6MEGowR3
Alea GPUでええな
69デフォルトの名無しさん
垢版 |
2017/05/07(日) 11:41:59.26ID:ehHyxLGM
a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソース ファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソース ファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
2017/05/07(日) 15:33:02.73ID:ehHyxLGM
色々実験してみたらnmake.exeではメイクできました。
mingwのmake.exeは駄目でした。
2017/05/10(水) 23:13:56.55ID:ecawysuy
ウインドーズなんて書いてる人、この二十数年の間でも聞いたことがない。初めて見たよw
あまりに斬新過ぎてワロタ
2017/05/10(水) 23:18:39.73ID:wBX7tx0w
そんなことで笑えるならすごい人生楽しそう
2017/05/11(木) 00:41:43.46ID:s9cCeBkh
みたことあるな
新聞だったかな
2017/05/30(火) 01:31:23.24ID:Dd0ZuLcv
空いてるメモリ目一杯floatの配列で埋めたい
メモリ容量足りなくてエラーになると遅くなるので
ちょい余裕あるぐらいでmallocする方法ない?
2017/05/31(水) 23:20:29.74ID:R/fqZ1ir
C++に触るの自体がほぼ初めてなのですが、CUDAと併せて勉強できるいい本は有りませんか?
プログラムはFortranしか触ったことがなく、CUDA by exampleだけだと難易度が高く困ってます
76デフォルトの名無しさん
垢版 |
2017/06/01(木) 11:43:59.76ID:o/dQD8LP
詳しくはwebで検索
77デフォルトの名無しさん
垢版 |
2017/06/20(火) 11:52:28.52ID:IZ7YVmtC
cuspが疎行列だけじゃなくて密行列も便利だった
2017/07/03(月) 14:29:28.07ID:0WiPHc69
>>75
内容古いかもしれないが
インプレスの CUDA by Example 汎用GPUプログラミング入門 とかは?
2017/07/03(月) 14:32:00.95ID:0WiPHc69
>>78
あ ゴメン
c++の文法説明込みだったら 違った
80デフォルトの名無しさん
垢版 |
2017/08/06(日) 16:23:07.09ID:XG7YRxUk
カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか?
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。

LinuxでCUDA8、GTX1080です。
2017/08/10(木) 06:57:43.66ID:YyeIUrZv
openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある
2017/08/10(木) 07:55:32.26ID:OxRJE4uH
多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい
8380
垢版 |
2017/08/11(金) 09:30:37.96ID:TMX2lDFt
レスありがとうございます。

>>81
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。

>>82
Hyper-Q機能?でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか?
84デフォルトの名無しさん
垢版 |
2017/08/15(火) 16:51:41.09ID:3/BBM8NB
>>29
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理
2017/08/21(月) 21:00:28.62ID:Q24iB0o5
vs2017で使えん
86デフォルトの名無しさん
垢版 |
2017/08/31(木) 18:49:59.24ID:MFovTTnL
初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか?
2017/08/31(木) 18:58:29.12ID:Ce9FMcgb
何のために?
2017/08/31(木) 19:58:21.56ID:oZkhTD7w
モンテカルロ内でやりたいんだろ
89デフォルトの名無しさん
垢版 |
2017/09/26(火) 05:36:17.39ID:/zEF5028
Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか?
2017/09/26(火) 06:32:45.58ID:mvSUAuA/
もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず

でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない

兼用バイナリというのは、ない

ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない
2017/10/19(木) 22:15:29.66ID:O7DpKIC1
DirectSoundの処理をCUDAで処理するようなライブラリないのかしら
2017/12/04(月) 23:59:10.12ID:2+MXhE1C
配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで
2017/12/05(火) 08:13:25.32ID:lkNfeWcr
配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。
94デフォルトの名無しさん
垢版 |
2017/12/20(水) 04:47:46.09ID:tW5VNkV2
windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか?
95デフォルトの名無しさん
垢版 |
2017/12/21(木) 13:14:18.72ID:PbmhXIq3
おk
96デフォルトの名無しさん
垢版 |
2017/12/31(日) 05:34:34.69ID:vNK2XdUl
科学技術計算に使うならtitanではなくteslaでしょうか?
97デフォルトの名無しさん
垢版 |
2017/12/31(日) 10:17:54.45ID:KA+WHx0L
scipy
2017/12/31(日) 12:13:16.21ID:7AfK40Dq
>>96
買えればな
2018/01/03(水) 03:49:56.24ID:t6kCNeZE
visual profilerのwindows環境での使い方を解説してるサイトって無いですか?
2018/01/03(水) 04:21:39.75ID:beBP1q3i
>>99
調べる前に使う方が手っ取り早く覚えられるよ。
101デフォルトの名無しさん
垢版 |
2018/01/04(木) 03:47:25.18ID:TAoyqhSr
>>100
https://qiita.com/Hiroki11x/items/3737e4e267c1035a4b55
ちょっといじったりはしてるんですけどこのページの「nvprofでprofileをとる」の部分でwindowsでのやり方が分からず詰んでます

ちなみにこのソフトって実行中のプログラムの動きを見るのではなくソースコードからどういう風に動くかを表示してくれるものですよね?
2018/01/04(木) 07:08:13.82ID:SKENGrTB
>>101
宗教的な理由がないならVisualStudioとセットで使った方がいい。
ほぼ悩むことなく使えるから。
2018/01/04(木) 14:37:10.89ID:TAoyqhSr
>>102
Nsightって奴ですねありがとうございます
やってみます
2018/02/01(木) 16:47:45.03ID:Oiw/v1s8
cuda9.1 でコンパイルに成功している人はいませんか?
サンプル simpleTemplates を VisualStudio2017(msvc++19.11) で鬼のようエラーが出てコンパイルできません
http://codepad.org/2kWkUrQ0
105デフォルトの名無しさん
垢版 |
2018/02/02(金) 07:32:53.45ID:sggyuymU
エラー無視すんな
2018/02/02(金) 14:42:34.94ID:NNrLuZbI
>>105
メーカー提供のライブラリがこんなエラーを吐くんですが…
107デフォルトの名無しさん
垢版 |
2018/02/02(金) 16:24:33.04ID:UHwa6yjc
>cl : コマンド ライン warning D9002 : 不明なオプション 'Wp64' を無視します。
2018/02/12(月) 10:28:57.39ID:0YWRNu0p
nvccだけ使えればいいと思ってVirtualBox+Ubuntu16.04にCUDA 9.1 Toolkitをインストールしてみたら
ログイン直後にgnome-sessionが死ぬようになってGUIが使えなくなってしまった。
どこで聞こうか迷ったけど、とりあえず同じような経験の人いないだろうか。

ドライバ周りが原因のような気もするけど、Windows版みたいにディスプレイドライバだけ除いて
インストールするとかできないのかな。
2018/02/12(月) 14:52:40.91ID:e1PHkpUL
>>108
そもそも一般ユーザーでインストールすれば、ドライバが書き換わってしまうことはない
2018/02/12(月) 16:57:29.11ID:0YWRNu0p
cudaとかの大きなくくりのメタパッケージじゃなくてcuda-compilersとか個別に指定すりゃいいんだな。
ドライバを含まないcuda-toolkit-9-1でも駄目だったから何かGUIツールでも関係していたんだろうか。
2018/02/16(金) 14:06:42.48ID:dBpGhFbZ
NVIDIA GeForce MX150 って使える?
2018/02/16(金) 21:00:32.13ID:6Qg41lNJ
対応GPUがスタートガイドやマニュアルにあるからそれを確認
2018/02/17(土) 02:17:22.97ID:ub0BBZWD
逝けるよって書けば信用するのか
すばらしき2ちゃん
2018/02/17(土) 02:31:09.51ID:/cKWkF1j
ほれ
https://www.geforce.com/hardware/notebook-gpus/geforce-mx150/specifications
2018/02/17(土) 02:36:13.64ID:/cKWkF1j
こっちか
https://www.geforce.com/hardware/technology/cuda/supported-gpus?field_gpu_type_value=All&;page=3
2018/02/18(日) 02:05:22.31ID:xYXxBey2
>>111
これな
https://devtalk.nvidia.com/default/topic/1023574/cuda-toolkit-9-is-not-available-in-geforce-mx150/
2018/02/18(日) 11:07:01.37ID:6C73cEwr
これ古過ぎますか?まだ役に立つ?

CUDA C
https://www.amazon.co.jp/dp/4844338919
118デフォルトの名無しさん
垢版 |
2018/02/18(日) 11:32:49.61ID:+kz6+qRG
これからCUDAを勉強するなら問題ないでしょ
基本は変わっていないんで
2018/02/18(日) 13:03:27.13ID:AAhzNgFK
問題なのは、最新のcuda9.1が最新のmsvc++ でコンパイルできないことなんだが…
2018/02/19(月) 23:00:57.77ID:sfd5KCmN
>>117
これかなりいいよ。
最新は網羅できてないが、日本語では最新じゃないかな。
cuda 6世代で検証は7でされてる
121デフォルトの名無しさん
垢版 |
2018/02/21(水) 14:09:43.32ID:fC+mQq8B
>>119
gcc使おう!
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況