X



【GPGPU】くだすれCUDAスレ part7【NVIDIA】 [転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
0001デフォルトの名無しさん
垢版 |
2014/11/20(木) 23:14:46.66ID:jr3oZn27
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
http://toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
0901デフォルトの名無しさん
垢版 |
2016/03/09(水) 00:03:43.04ID:QI7bsFp8
平日仕事サボって2chなら、まぁわからなくも無い
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
0902,,・´∀`・,,)っ-○○○
垢版 |
2016/03/09(水) 00:29:18.66ID:EC2EcKU9
スマホゲーの体力ゲージ消化してるだけじゃね?
2chなんてとっくにブーム終わってるだろ
0903デフォルトの名無しさん
垢版 |
2016/03/09(水) 12:01:37.54ID:Bn2mru1A
>>901
話し相手が欲しいんだよ
スレをウンコ臭くしておいて
0907デフォルトの名無しさん
垢版 |
2016/03/09(水) 21:45:15.09ID:Bn2mru1A
コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
0914デフォルトの名無しさん
垢版 |
2016/03/10(木) 22:07:55.24ID:Kwch6Nj+
ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう?
0917デフォルトの名無しさん
垢版 |
2016/03/12(土) 13:14:03.96ID:7MrNfl0C
誰も居ない?
0919デフォルトの名無しさん
垢版 |
2016/03/15(火) 19:07:06.06ID:NepgFCLn
では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね?
消しても動くのでいらなさそうではあるんですけど一応残してます
0922デフォルトの名無しさん
垢版 |
2016/04/13(水) 00:20:39.50ID:vTxSOF48
>>918
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
0923,,・´∀`・,,)っ-○○○
垢版 |
2016/04/13(水) 00:37:51.36ID:uE1XEE4+
レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう
0925デフォルトの名無しさん
垢版 |
2016/04/18(月) 20:53:52.86ID:npM92plo
以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
0927デフォルトの名無しさん
垢版 |
2016/04/29(金) 19:49:33.11ID:F6Ql+W8p
Pascalは忘れられてるけど、倍精度も強化されてるんだよね
単精度を徹底的に削った思い切った方針には目を見張った
0928,,・´∀`・,,)っ-○○○
垢版 |
2016/04/29(金) 21:17:01.56ID:RuK53SvA
大型スパコン案件に特化して設計したものをGPUに流用してるだけで
それが全部だと言い張られても困りますが
0931デフォルトの名無しさん
垢版 |
2016/04/30(土) 11:52:36.46ID:xhIIf3AZ
高まるだろうね
倍精度と半精度がちょうどいい具合

そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
0932デフォルトの名無しさん
垢版 |
2016/04/30(土) 22:20:59.01ID:4IpkHcLg
その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは
0933,,・´∀`・,,)っ-○○○
垢版 |
2016/04/30(土) 22:33:42.88ID:wNNJHcCv
あれはCNNに特化したものでGPUほどのプログラマビリティはない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
0935,,・´∀`・,,)っ-○○○
垢版 |
2016/04/30(土) 23:20:42.71ID:wNNJHcCv
疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素
って覚えておけば大体間違いない
実はGPUの特性と正反対(GPUは密行列なら得意)
0936デフォルトの名無しさん
垢版 |
2016/04/30(土) 23:25:48.76ID:WnEgJTfp
fermi世代ってdouble⇒floatで倍速なはずだよね?
ちっとも速くならないんだが。
0937デフォルトの名無しさん
垢版 |
2016/05/01(日) 05:03:39.83ID:IAB0IXGv
大分前だけど構造体でデータを渡すとdouble扱いになったことはある
原因は不明
0938デフォルトの名無しさん
垢版 |
2016/05/01(日) 10:04:45.15ID:c2Ftkl1w
>>937
thx。

調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。

fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
0939デフォルトの名無しさん
垢版 |
2016/05/01(日) 10:24:43.67ID:tKi6j9CT
匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?

Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw


The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
0941デフォルトの名無しさん
垢版 |
2016/05/09(月) 19:46:40.50ID:ZKk/r1uF
質問があります
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です

#include <stdio.h>

__global__ void a(char *A){
}

int main(){
a<<1, 1>>(); // (1)
}

(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか

コンパイルに使用したコマンドは
windows
 nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
 (失念したが大体同じ)
です
0942デフォルトの名無しさん
垢版 |
2016/05/09(月) 23:47:16.41ID:+C4ZnXlR
>>941
≪≫のところじゃない?
二重カッコじゃなくて、三重カッコにすべきかな

二重カッコだと別の演算子になって、意味が変わってくる
0943デフォルトの名無しさん
垢版 |
2016/05/09(月) 23:54:10.06ID:ZKk/r1uF
ああ、3重括弧でしたか
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます
0945sage
垢版 |
2016/05/23(月) 17:33:55.45ID:w8cwn6FF
CUDA fortranで一つの配列に対して2GB以上のメモリを
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね?
0950デフォルトの名無しさん
垢版 |
2016/06/01(水) 19:25:08.39ID:XXwwXNx4
ttps://developer.nvidia.com/cudnn
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか?
0951デフォルトの名無しさん
垢版 |
2016/06/03(金) 02:14:25.16ID:qw00fiPh
CUDA APIで1番始めに呼んだAPIは時間がかかるとのことですが、
時間計測に影響が出ないように事前にどんな関数を呼んでますか?
慣習だったり、よく使われる関数があれば教えてください。
0953デフォルトの名無しさん
垢版 |
2016/06/04(土) 23:54:08.10ID:64JgiXiE
安く実験したいなら
N体や粒子法なんかは普通のCPUじゃたいしたことはできない
0956デフォルトの名無しさん
垢版 |
2016/06/12(日) 12:50:48.33ID:4gtPrZLr
この部分がエラー吐くんだが
cuda7.5

struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};
0958デフォルトの名無しさん
垢版 |
2016/06/12(日) 13:39:51.78ID:4gtPrZLr
>>957
そうそう
エラーはこんな感じ

Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed
0959デフォルトの名無しさん
垢版 |
2016/06/12(日) 13:50:41.56ID:MCoM6cvm
試してないけど、コンストラクタに__device__付けてないのが悪いと言っているような。
0963デフォルトの名無しさん
垢版 |
2016/06/16(木) 14:11:42.71ID:hLUHI1zp
615 :名前は開発中のものです。:02/06/10 21:48 ID:???
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか?つらそー。

616 :◆CKmHzWpc:02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
1.モデルを分割するのが嫌→頂点シェーダ−を使うorシステムメモリに置いてソフトでやる
2.モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います

>>615
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです
0964デフォルトの名無しさん
垢版 |
2016/07/20(水) 14:03:52.95ID:S0wpPWZM
tess
0965デフォルトの名無しさん
垢版 |
2016/09/02(金) 13:17:38.94ID:W3BuWeJb
erlangならね
0966デフォルトの名無しさん
垢版 |
2016/09/06(火) 19:38:14.96ID:MfZbc6Jb
まだ埋まってなかった
0967デフォルトの名無しさん
垢版 |
2016/10/03(月) 10:11:13.82ID:1bWakqV9
pascal titan xでcudaを動かしている人に質問ですが高負荷時にクロックダウンは起きませんか
0968デフォルトの名無しさん
垢版 |
2017/02/11(土) 05:41:42.45ID:GCRxMqXs
埋め
0973デフォルトの名無しさん
垢版 |
2017/05/07(日) 11:40:19.10ID:ehHyxLGM
a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソース ファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソース ファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況