【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net

レス数が1000を超えています。これ以上書き込みはできません。
2014/11/20(木) 23:14:46.66ID:jr3oZn27
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
2016/03/09(水) 00:29:18.66ID:EC2EcKU9
スマホゲーの体力ゲージ消化してるだけじゃね?
2chなんてとっくにブーム終わってるだろ
903デフォルトの名無しさん
垢版 |
2016/03/09(水) 12:01:37.54ID:Bn2mru1A
>>901
話し相手が欲しいんだよ
スレをウンコ臭くしておいて
2016/03/09(水) 17:46:55.52ID:+SKBM1r7
へえ、お前、寂しがり屋なんだな
2016/03/09(水) 19:21:18.15ID:QI7bsFp8
糞団子が急に大人しくなって笑える
かなり効いた様だなw
2016/03/09(水) 19:28:24.12ID:n0++16X2
かまってちゃん
907デフォルトの名無しさん
垢版 |
2016/03/09(水) 21:45:15.09ID:Bn2mru1A
コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
2016/03/09(水) 22:07:10.45ID:F7KphU9Z
そんなにかまってほしいのか
2016/03/09(水) 22:13:39.55ID:QI7bsFp8
それはお前だろ
さっきからチョロチョロウザい
2016/03/09(水) 22:45:09.81ID:F7KphU9Z
おまえがそれを言うのか
2016/03/10(木) 00:12:27.45ID:lJwnXkdm
なんだ
やっぱり、かまってちゃんか?
2016/03/10(木) 05:26:45.85ID:ElNFIbXj
っ鏡
2016/03/10(木) 20:04:24.43ID:lJwnXkdm
いや、朝の5時から鏡出されても…
2016/03/10(木) 22:07:55.24ID:Kwch6Nj+
ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう?
2016/03/10(木) 23:24:17.96ID:36+0Q/RN
ミラーマン!
植草教授!
2016/03/11(金) 00:12:19.52ID:0VtVfbcA
はい
かまってちゃんの変な奴来ました
917デフォルトの名無しさん
垢版 |
2016/03/12(土) 13:14:03.96ID:7MrNfl0C
誰も居ない?
2016/03/14(月) 00:27:24.09ID:tMjTpPPM
糞団子が荒らして過疎ったな
ホントろくでもねぇ奴だったな
2016/03/15(火) 19:07:06.06ID:NepgFCLn
では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね?
消しても動くのでいらなさそうではあるんですけど一応残してます
2016/04/06(水) 05:42:39.04ID:b0ehB924
https://devblogs.nvidia.com/parallelforall/inside-pascal/
https://devblogs.nvidia.com/parallelforall/wp-content/uploads/2016/04/gp100_SM_diagram.png
2016/04/08(金) 23:49:33.98ID:Oe8UeTI2
>>862
この辺りからの流れはとても勉強になる
2016/04/13(水) 00:20:39.50ID:vTxSOF48
>>918
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
2016/04/13(水) 00:37:51.36ID:uE1XEE4+
レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう
2016/04/13(水) 18:30:01.95ID:P1TlabSM
言っているそばからw
2016/04/18(月) 20:53:52.86ID:npM92plo
以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
2016/04/29(金) 07:41:21.25ID:H9O34uIX
>>922
機械学習はマルチGPU
927デフォルトの名無しさん
垢版 |
2016/04/29(金) 19:49:33.11ID:F6Ql+W8p
Pascalは忘れられてるけど、倍精度も強化されてるんだよね
単精度を徹底的に削った思い切った方針には目を見張った
2016/04/29(金) 21:17:01.56ID:RuK53SvA
大型スパコン案件に特化して設計したものをGPUに流用してるだけで
それが全部だと言い張られても困りますが
2016/04/29(金) 22:49:34.54ID:wZxrhoKH
なんでおまえが困るんだよw
2016/04/30(土) 00:41:27.46ID:oV2mml7H
GPGPUは深層学習のブレークで今後一気に需要が高まる?
931デフォルトの名無しさん
垢版 |
2016/04/30(土) 11:52:36.46ID:xhIIf3AZ
高まるだろうね
倍精度と半精度がちょうどいい具合

そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
2016/04/30(土) 22:20:59.01ID:4IpkHcLg
その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは
2016/04/30(土) 22:33:42.88ID:wNNJHcCv
あれはCNNに特化したものでGPUほどのプログラマビリティはない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
2016/04/30(土) 22:45:19.47ID:tL+Fobdg
CNNに特化て具体的には行列演算てこと?
2016/04/30(土) 23:20:42.71ID:wNNJHcCv
疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素
って覚えておけば大体間違いない
実はGPUの特性と正反対(GPUは密行列なら得意)
2016/04/30(土) 23:25:48.76ID:WnEgJTfp
fermi世代ってdouble⇒floatで倍速なはずだよね?
ちっとも速くならないんだが。
2016/05/01(日) 05:03:39.83ID:IAB0IXGv
大分前だけど構造体でデータを渡すとdouble扱いになったことはある
原因は不明
2016/05/01(日) 10:04:45.15ID:c2Ftkl1w
>>937
thx。

調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。

fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
939デフォルトの名無しさん
垢版 |
2016/05/01(日) 10:24:43.67ID:tKi6j9CT
匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?

Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw


The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
2016/05/01(日) 11:36:33.54ID:4G1NPxxh
eyerissは大量のデーターが複数のフィルター処理されるのに向いてる
941デフォルトの名無しさん
垢版 |
2016/05/09(月) 19:46:40.50ID:ZKk/r1uF
質問があります
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です

#include <stdio.h>

__global__ void a(char *A){
}

int main(){
a<<1, 1>>(); // (1)
}

(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか

コンパイルに使用したコマンドは
windows
 nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
 (失念したが大体同じ)
です
2016/05/09(月) 23:47:16.41ID:+C4ZnXlR
>>941
≪≫のところじゃない?
二重カッコじゃなくて、三重カッコにすべきかな

二重カッコだと別の演算子になって、意味が変わってくる
943デフォルトの名無しさん
垢版 |
2016/05/09(月) 23:54:10.06ID:ZKk/r1uF
ああ、3重括弧でしたか
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます
2016/05/20(金) 21:20:51.03ID:OCEBmLiZ
グーグルがTensolFlow用のTPUとかいうの作ってたらしいがどうなの?
945sage
垢版 |
2016/05/23(月) 17:33:55.45ID:w8cwn6FF
CUDA fortranで一つの配列に対して2GB以上のメモリを
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね?
2016/05/23(月) 18:16:51.67ID:rInNNyjw
>>945
何gbくらい必要なの?
2016/05/23(月) 18:47:01.54ID:hrdyo10f
>>945
fortranなんか使っているからだよ。
2016/05/23(月) 19:56:12.00ID:Y87SDCLt
32ビットの壁ってこと?
2016/05/23(月) 22:17:34.30ID:COcpIksW
CU_LIMIT_MALLOC_HEAP_SIZE か cudaLimitMallocHeapSize を拡げりゃいいんじゃないかな。
950デフォルトの名無しさん
垢版 |
2016/06/01(水) 19:25:08.39ID:XXwwXNx4
ttps://developer.nvidia.com/cudnn
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか?
2016/06/03(金) 02:14:25.16ID:qw00fiPh
CUDA APIで1番始めに呼んだAPIは時間がかかるとのことですが、
時間計測に影響が出ないように事前にどんな関数を呼んでますか?
慣習だったり、よく使われる関数があれば教えてください。
2016/06/04(土) 23:09:31.90ID:EzTgQ+dX
工学じゃなくて物理系でもcuda覚える価値ってある?
2016/06/04(土) 23:54:08.10ID:64JgiXiE
安く実験したいなら
N体や粒子法なんかは普通のCPUじゃたいしたことはできない
2016/06/05(日) 01:52:52.19ID:2/2r2xD9
むしろ、科学計算したい人のための技術だと思う
2016/06/12(日) 02:11:09.53ID:F98p4y3q
他人にも聞こえんの?
2016/06/12(日) 12:50:48.33ID:4gtPrZLr
この部分がエラー吐くんだが
cuda7.5

struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};
2016/06/12(日) 13:24:56.47ID:MCoM6cvm
CUDA by EXAMPLEのサンプル?
<cuComplex.h>の定義とぶつかってるんじゃね?
2016/06/12(日) 13:39:51.78ID:4gtPrZLr
>>957
そうそう
エラーはこんな感じ

Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed
2016/06/12(日) 13:50:41.56ID:MCoM6cvm
試してないけど、コンストラクタに__device__付けてないのが悪いと言っているような。
2016/06/12(日) 14:09:28.62ID:4gtPrZLr
>>959
ありがとうございます
解決しました
961デフォルトの名無しさん
垢版 |
2016/06/15(水) 14:42:46.55ID:d2Xou3GL
【GPGPU】くだすれCUDAスレ part8【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1416492886/
2016/06/15(水) 14:44:14.63ID:d2Xou3GL
誤爆

【GPGPU】くだすれCUDAスレ part8【NVIDIA】
http://echo.2ch.net/test/read.cgi/tech/1465969275/
2016/06/16(木) 14:11:42.71ID:hLUHI1zp
615 :名前は開発中のものです。:02/06/10 21:48 ID:???
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか?つらそー。

616 :◆CKmHzWpc:02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
1.モデルを分割するのが嫌→頂点シェーダ−を使うorシステムメモリに置いてソフトでやる
2.モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います

>>615
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです
964デフォルトの名無しさん
垢版 |
2016/07/20(水) 14:03:52.95ID:S0wpPWZM
tess
965デフォルトの名無しさん
垢版 |
2016/09/02(金) 13:17:38.94ID:W3BuWeJb
erlangならね
966デフォルトの名無しさん
垢版 |
2016/09/06(火) 19:38:14.96ID:MfZbc6Jb
まだ埋まってなかった
2016/10/03(月) 10:11:13.82ID:1bWakqV9
pascal titan xでcudaを動かしている人に質問ですが高負荷時にクロックダウンは起きませんか
968デフォルトの名無しさん
垢版 |
2017/02/11(土) 05:41:42.45ID:GCRxMqXs
埋め
2017/03/01(水) 20:35:36.75ID:G4g91z/5
は最多か
2017/03/03(金) 13:35:21.41ID:nBceVUOh
サクラ
2017/03/03(金) 14:59:54.92ID:GURukhR9
浜田
2017/03/06(月) 16:46:29.52ID:7tw9lmnR
かいな
973デフォルトの名無しさん
垢版 |
2017/05/07(日) 11:40:19.10ID:ehHyxLGM
a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソース ファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソース ファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
2017/05/07(日) 11:42:54.14ID:ehHyxLGM
>>973
は新スレに移行しました
2017/10/21(土) 21:44:51.57ID:ch8ppFz8
975
2017/10/21(土) 21:45:16.89ID:ch8ppFz8
976
2017/10/21(土) 21:45:35.47ID:ch8ppFz8
977
2017/10/21(土) 21:46:09.62ID:ch8ppFz8
978
2017/10/21(土) 21:46:43.41ID:ch8ppFz8
979
2017/10/21(土) 21:47:04.64ID:ch8ppFz8
980
2017/10/21(土) 21:47:23.30ID:ch8ppFz8
981
2017/10/21(土) 21:47:46.15ID:ch8ppFz8
982
2017/10/21(土) 21:48:12.14ID:ch8ppFz8
983
2017/10/21(土) 21:48:31.31ID:ch8ppFz8
984
2017/10/21(土) 21:48:48.87ID:ch8ppFz8
985
2017/10/21(土) 21:49:04.73ID:ch8ppFz8
986
2017/10/21(土) 21:49:28.95ID:ch8ppFz8
987
2017/10/21(土) 21:49:46.87ID:ch8ppFz8
988
2017/10/21(土) 21:50:13.50ID:ch8ppFz8
989
2017/10/21(土) 21:51:07.97ID:ch8ppFz8
990
2017/10/21(土) 21:51:27.98ID:ch8ppFz8
991
2017/10/21(土) 21:51:48.54ID:ch8ppFz8
992
2017/10/21(土) 21:52:08.22ID:ch8ppFz8
993
2017/10/21(土) 21:52:26.37ID:ch8ppFz8
994
2017/10/21(土) 21:52:42.66ID:ch8ppFz8
995
2017/10/21(土) 21:53:11.93ID:ch8ppFz8
996
2017/10/21(土) 21:53:27.63ID:ch8ppFz8
997
2017/10/21(土) 21:53:44.96ID:ch8ppFz8
998
2017/10/21(土) 21:54:02.51ID:ch8ppFz8
999
2017/10/21(土) 21:54:28.40ID:ch8ppFz8
1000
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1065日 22時間 39分 42秒
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況