X



【GPGPU】くだすれCUDAスレ part8【NVIDIA】 [無断転載禁止]©2ch.net
0001デフォルトの名無しさん
垢版 |
2016/06/15(水) 14:41:15.11ID:d2Xou3GL
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
http://peace.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
【GPGPU】くだすれCUDAスレ part7【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
0034デフォルトの名無しさん
垢版 |
2016/11/26(土) 13:36:47.19ID:jHyXikRe
http://www.newsweekjapan.jp/yukawa/2016/11/ai-4_2.php
「Universal Probability Language」って言う技術を使うと「東大君」が最近断念した
自然言語処理が出来るようになるらしいね

日本と英米だとこの分野は天地の差がある
0035デフォルトの名無しさん
垢版 |
2016/11/26(土) 15:41:52.96ID:e21MHUPR
>その結果、われわれが達した結論は、「完成」の定義が人によって異なるのではないか、ということだった。
0036デフォルトの名無しさん
垢版 |
2016/11/26(土) 18:56:34.99ID:F5v+97Am
>>35
なんでも完璧を目指すのではなく、ADSLやD-WAVE量子コンピューターのような
「現実解」を目指すと言う事
0037デフォルトの名無しさん
垢版 |
2016/11/26(土) 19:26:09.59ID:Ry2z2nBI
>日本と英米だとこの分野は天地の差がある
「この分野」ってのが何を指してるのかはっきりしないけど
AI分野って意味では現状、天地の差と言えるのは予算で規定される研究規模くらいやで
まあそれが決定的な違いを産んでるって言えなくもないけど
金銭的バックアップのもとで色んな種を蒔く余裕は日本の科学技術界にないからね


あとその件の技術は記事の本文でも疑ってるけど、
所謂「中国語の部屋」の完成を目指しているものなんじゃない?

×「東大君」○「東ロボ君」の新井さんの講演聴いて懇親会で話もできたんだけど
東ロボ君プロジェクトはそもそも現状のAI技術の限界をある程度認識してて、
その上で入試問題への挑戦っていうベンチマーク的な実践実験で証拠を提示するってことをやってたよ
そもそも東ロボ君は技術的に新しいことをやるというより現状の技術の可能性と課題を洗い出すためのプロジェクトだし
その成果の一つが自然言語の意味的理解の困難さを示したってことだよ
つまり今回「断念」って報道のされ方をしたお話ね
繰り返すけど自然言語処理(中国語の部屋)とは違うお話だよ
0038デフォルトの名無しさん
垢版 |
2016/11/29(火) 13:13:11.65ID:qCrQS1UU
今CUDA by Example 汎用GPUプログラミング入門を読んで勉強しているんですけど
この本のサンプルコードってもう手に入らないんでしょうか?
0041デフォルトの名無しさん
垢版 |
2017/01/06(金) 07:11:43.14ID:8Ia4s/0Q
windowsでcudaやってるんだけど
visual studio commutity消してcl.exeだけ残しておけば
コンパイル通る?
0044デフォルトの名無しさん
垢版 |
2017/01/07(土) 17:06:51.33ID:aP/UyWiv
cl.exeだけじゃコンパイルも出来ない。
コンパイラ本体は c1.dll と c1xx.dll と c2.dll。
昔はWindowsSDKにVSのIDEなしでコマンドラインツールだけ入ってたりしたけどな。
よく解らんかったら インストールディレクトリの VC/bin/ をまるごと残しとけ。
0046デフォルトの名無しさん
垢版 |
2017/01/09(月) 18:23:46.66ID:jHsLLpyz
超初歩的な質問ですが、
三次元配列をGPUにメモリ確保してCPUからデータコピーってどうやればいいんでしょうか
0048デフォルトの名無しさん
垢版 |
2017/01/09(月) 18:47:08.26ID:jHsLLpyz
そんな感じです、C言語でいうとarray[][][]みたいな

1次元のように簡単にはできないですよね…
0050デフォルトの名無しさん
垢版 |
2017/01/09(月) 20:36:08.40ID:EVa/TTkG
GPUじゃない普通のプログラムは配列のサイズ計算してmallocするだろ?GPUでも同じだ。
0051デフォルトの名無しさん
垢版 |
2017/01/09(月) 21:12:30.61ID:jHsLLpyz
三次元配列で連続したアドレスにしたいんですが、CPUはできるんですけどGPUはそのままだとエラーが出てできませんでした…
エラーはa value of type "cudaError_t" cannot be assigned to an entity of typeです
0053デフォルトの名無しさん
垢版 |
2017/01/10(火) 14:21:30.09ID:s989ZmsY
>>51
alignmentかな
0054デフォルトの名無しさん
垢版 |
2017/01/10(火) 17:18:06.48ID:oQDfLvCT
初歩的な質問かもしれませんが、
.cファイルから.cuファイルの関数を呼び出す際にリンカエラーが
出るのですがどうすればよいのでしょうか
0056デフォルトの名無しさん
垢版 |
2017/01/10(火) 20:12:19.14ID:saSw9C20
>>51
四次元にしてみたら
0057デフォルトの名無しさん
垢版 |
2017/01/12(木) 13:45:58.21ID:E2IxQoCs
DRAMのパーティションはパーティションの数が3こあるとすると
3つおきの連続した256バイトが一つのパティーションになると
いう理解であってますか?
0058デフォルトの名無しさん
垢版 |
2017/01/20(金) 22:13:42.62ID:8IF0nMvZ
gpuを買い替えるか迷ってるんだけどcuda使う上で参考になるベンチマーク的なものを公開してるサイトってありますか?

ちなみに現在使ってるのはgtx970です
10シリーズは機械学習に最適化していると聞いたので気になっています。
0060デフォルトの名無しさん
垢版 |
2017/01/20(金) 23:30:22.94ID:GGUqy8t5
>>58
のようなサイトがあればURLを教えてください
0063デフォルトの名無しさん
垢版 |
2017/01/21(土) 13:43:41.18ID:2F79DqM2
>>61
>>62

参考になります
compubenchでcudaのスコアを比較してみましたが1060でも970より若干スコアは良いようですね
0064デフォルトの名無しさん
垢版 |
2017/02/02(木) 13:38:03.58ID:OYwNsjcS
cudaコアはどういう単位なの?
cudaコアがn個あったら、n種類のcudaプログラムを同時実行できますか?
コア内でスレッド数等が足りるとして。
0067デフォルトの名無しさん
垢版 |
2017/02/10(金) 08:22:35.29ID:s5e3qUT1
シンギュラリティしてるぅ?
0068デフォルトの名無しさん
垢版 |
2017/02/15(水) 12:32:42.97ID:6MEGowR3
Alea GPUでええな
0069デフォルトの名無しさん
垢版 |
2017/05/07(日) 11:41:59.26ID:ehHyxLGM
a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソース ファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソース ファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
0070デフォルトの名無しさん
垢版 |
2017/05/07(日) 15:33:02.73ID:ehHyxLGM
色々実験してみたらnmake.exeではメイクできました。
mingwのmake.exeは駄目でした。
0071デフォルトの名無しさん
垢版 |
2017/05/10(水) 23:13:56.55ID:ecawysuy
ウインドーズなんて書いてる人、この二十数年の間でも聞いたことがない。初めて見たよw
あまりに斬新過ぎてワロタ
0074デフォルトの名無しさん
垢版 |
2017/05/30(火) 01:31:23.24ID:Dd0ZuLcv
空いてるメモリ目一杯floatの配列で埋めたい
メモリ容量足りなくてエラーになると遅くなるので
ちょい余裕あるぐらいでmallocする方法ない?
0075デフォルトの名無しさん
垢版 |
2017/05/31(水) 23:20:29.74ID:R/fqZ1ir
C++に触るの自体がほぼ初めてなのですが、CUDAと併せて勉強できるいい本は有りませんか?
プログラムはFortranしか触ったことがなく、CUDA by exampleだけだと難易度が高く困ってます
0076デフォルトの名無しさん
垢版 |
2017/06/01(木) 11:43:59.76ID:o/dQD8LP
詳しくはwebで検索
0077デフォルトの名無しさん
垢版 |
2017/06/20(火) 11:52:28.52ID:IZ7YVmtC
cuspが疎行列だけじゃなくて密行列も便利だった
0078デフォルトの名無しさん
垢版 |
2017/07/03(月) 14:29:28.07ID:0WiPHc69
>>75
内容古いかもしれないが
インプレスの CUDA by Example 汎用GPUプログラミング入門 とかは?
0080デフォルトの名無しさん
垢版 |
2017/08/06(日) 16:23:07.09ID:XG7YRxUk
カーネル呼び出し含むループをOpenMPで並列化すると遅くなっちゃったんですけど、
心当たりある方居ませんか?
nvvpで見たらcudaLaunchが伸び伸びで200ms近くなってます。並列化前は数ms程度です。
各カーネル呼び出しは別個のストリームを使用してます。

LinuxでCUDA8、GTX1080です。
0081デフォルトの名無しさん
垢版 |
2017/08/10(木) 06:57:43.66ID:YyeIUrZv
openmpは並列処理開始前にスレッド生成、終了後に同期して後始末しているらしく、そこでそこそこ時間を食う
並列化する箇所があまり時間がかからない処理だとopenmpで遅くなることもある
0082デフォルトの名無しさん
垢版 |
2017/08/10(木) 07:55:32.26ID:OxRJE4uH
多くのスレッドからCUDAを使えばそりゃ遅くなるでしょ
並列化はOpenMPかCUDAかどちらにしなさい
008380
垢版 |
2017/08/11(金) 09:30:37.96ID:TMX2lDFt
レスありがとうございます。

>>81
本番で呼ぶカーネルは結構時間かかる処理になりますが、
今は自前の検証コードから呼ぶ短いカーネルでカーネル呼び出し部分(cudaLaunch)のみの処理時間を見てます。

>>82
Hyper-Q機能?でハードウェア的にキューを複数持てるということで、スレッド毎に別ストリームを生成すれば問題ないと思っていたのですが違うのでしょうか?
0084デフォルトの名無しさん
垢版 |
2017/08/15(火) 16:51:41.09ID:3/BBM8NB
>>29
hsaみたいなのにやる気ないからなあ
そもそもスケジューラー持ってないから無理
0086デフォルトの名無しさん
垢版 |
2017/08/31(木) 18:49:59.24ID:MFovTTnL
初歩的な質問なんですがcuFFTを複数同時に呼び出して並列の並列みたいなことってできるんでしょうか?
0089デフォルトの名無しさん
垢版 |
2017/09/26(火) 05:36:17.39ID:/zEF5028
Ubuntu Linux のNvccでコンパイルしたのをcentosで動かすことできますか?
0090デフォルトの名無しさん
垢版 |
2017/09/26(火) 06:32:45.58ID:mvSUAuA/
もし異なるOS で、バイナリ互換があるなら、1つのバイナリで、
すべてのLinux ディストリビューションで動くはず

でも実際には、たいていのアプリは、
Ubuntu か、CentOS 用ぐらいの、バイナリしか用意していない

兼用バイナリというのは、ない

ソースコードを異なるディストリビューションへコピーして、
コンパイルすれば動くかも知れないけど、
修正しないと動かないかも知れない
0092デフォルトの名無しさん
垢版 |
2017/12/04(月) 23:59:10.12ID:2+MXhE1C
配列の中の1要素だけ排他制御する関数って自分で作るしかない?
稀に同じ要素を読み書きするスレッドがあるんだけどthreadfenceみたいな関数だと関係ないスレッドまで止めそうで
0093デフォルトの名無しさん
垢版 |
2017/12/05(火) 08:13:25.32ID:lkNfeWcr
配列要素でもatomic関数は使えるんじゃないかな。
まぁ毎回atomic関数使ってパフォーマンスはどうか知らんけど。
0094デフォルトの名無しさん
垢版 |
2017/12/20(水) 04:47:46.09ID:tW5VNkV2
windowsでnvccを使うとclコンパイラが使われますができればgccを使いたいと思ってます
可能でしょうか?
0095デフォルトの名無しさん
垢版 |
2017/12/21(木) 13:14:18.72ID:PbmhXIq3
おk
0096デフォルトの名無しさん
垢版 |
2017/12/31(日) 05:34:34.69ID:vNK2XdUl
科学技術計算に使うならtitanではなくteslaでしょうか?
0097デフォルトの名無しさん
垢版 |
2017/12/31(日) 10:17:54.45ID:KA+WHx0L
scipy
0101デフォルトの名無しさん
垢版 |
2018/01/04(木) 03:47:25.18ID:TAoyqhSr
>>100
https://qiita.com/Hiroki11x/items/3737e4e267c1035a4b55
ちょっといじったりはしてるんですけどこのページの「nvprofでprofileをとる」の部分でwindowsでのやり方が分からず詰んでます

ちなみにこのソフトって実行中のプログラムの動きを見るのではなくソースコードからどういう風に動くかを表示してくれるものですよね?
0102デフォルトの名無しさん
垢版 |
2018/01/04(木) 07:08:13.82ID:SKENGrTB
>>101
宗教的な理由がないならVisualStudioとセットで使った方がいい。
ほぼ悩むことなく使えるから。
0105デフォルトの名無しさん
垢版 |
2018/02/02(金) 07:32:53.45ID:sggyuymU
エラー無視すんな
0107デフォルトの名無しさん
垢版 |
2018/02/02(金) 16:24:33.04ID:UHwa6yjc
>cl : コマンド ライン warning D9002 : 不明なオプション 'Wp64' を無視します。
0108デフォルトの名無しさん
垢版 |
2018/02/12(月) 10:28:57.39ID:0YWRNu0p
nvccだけ使えればいいと思ってVirtualBox+Ubuntu16.04にCUDA 9.1 Toolkitをインストールしてみたら
ログイン直後にgnome-sessionが死ぬようになってGUIが使えなくなってしまった。
どこで聞こうか迷ったけど、とりあえず同じような経験の人いないだろうか。

ドライバ周りが原因のような気もするけど、Windows版みたいにディスプレイドライバだけ除いて
インストールするとかできないのかな。
0110デフォルトの名無しさん
垢版 |
2018/02/12(月) 16:57:29.11ID:0YWRNu0p
cudaとかの大きなくくりのメタパッケージじゃなくてcuda-compilersとか個別に指定すりゃいいんだな。
ドライバを含まないcuda-toolkit-9-1でも駄目だったから何かGUIツールでも関係していたんだろうか。
0118デフォルトの名無しさん
垢版 |
2018/02/18(日) 11:32:49.61ID:+kz6+qRG
これからCUDAを勉強するなら問題ないでしょ
基本は変わっていないんで
0119デフォルトの名無しさん
垢版 |
2018/02/18(日) 13:03:27.13ID:AAhzNgFK
問題なのは、最新のcuda9.1が最新のmsvc++ でコンパイルできないことなんだが…
0120デフォルトの名無しさん
垢版 |
2018/02/19(月) 23:00:57.77ID:sfd5KCmN
>>117
これかなりいいよ。
最新は網羅できてないが、日本語では最新じゃないかな。
cuda 6世代で検証は7でされてる
0121デフォルトの名無しさん
垢版 |
2018/02/21(水) 14:09:43.32ID:fC+mQq8B
>>119
gcc使おう!
0123デフォルトの名無しさん
垢版 |
2018/02/21(水) 15:49:25.59ID:zwuXHePG
そりゃバイナリならそうだがそういう話じゃなくて
0124デフォルトの名無しさん
垢版 |
2018/02/21(水) 16:30:30.19ID:jU0tYaxw
>>123
Windows 環境で cuda に対応するコードを生成するには、msvc++ しか選択できない、Windows で走るバイナリーを作るのに g++ は使えない
0125デフォルトの名無しさん
垢版 |
2018/02/22(木) 17:44:56.30ID:j8QCdBbM
>>122
WSLでubuntu動かせばよくね?
0126デフォルトの名無しさん
垢版 |
2018/02/22(木) 18:06:40.02ID:Ee7revq9
>>125
その ubuntu 上で生成したコードは、ubuntu なしの Windows 上で動くのか?
動かないのならば、よいわけがあるまい
0128デフォルトの名無しさん
垢版 |
2018/02/23(金) 17:00:07.99ID:mpvgXBL2
>>127
クロスコンパイルとはいわないのでは?
Linux 上で gcc を使ったコンパイル成果物は、Windows では動かない
Windows 上で cl を使ったコンパイル成果物は、Linux 上では動かない
レスを投稿する


ニューススポーツなんでも実況