さてついにOpenCLの仕様が公開されました。
http://www.khronos.org/opencl/
公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。
探検
OpenCLプログラミング#1
■ このスレッドは過去ログ倉庫に格納されています
1a36 ◆K0BqlCB3.k
2008/12/10(水) 15:38:25396デフォルトの名無しさん
2010/11/29(月) 19:38:51 日本語でおk
397デフォルトの名無しさん
2010/11/29(月) 22:13:20 >>395
コストが無駄になるので特定の用途向けの計算に使います。
コストが無駄になるので特定の用途向けの計算に使います。
398デフォルトの名無しさん
2010/12/01(水) 11:07:07 じゃあ、グラフィックカードの付いてないノートパソコンでは無意味ということだな。
399デフォルトの名無しさん
2010/12/02(木) 01:56:33 C言語っぽく書いて、コンパイラがうまいことSIMDに変換してくれるから意味あるよ。
400デフォルトの名無しさん
2010/12/04(土) 11:20:13 GPUでmalloc作った論文どこだっけ?
401デフォルトの名無しさん
2010/12/18(土) 09:11:15 外付けと内蔵グラフィック切り替えるタイプのノートでopenCL使うとどうなるの
NVkernelそこまで対応してるのかな?
NVkernelそこまで対応してるのかな?
402デフォルトの名無しさん
2010/12/25(土) 19:51:36 全ワークアイテムでは同期とれないんだね。ワークグループ内のみか。
さて、どうやって同期とるか・・・
さて、どうやって同期とるか・・・
403デフォルトの名無しさん
2010/12/31(金) 18:12:58 OpenCLを始めようと思ってサンプルコードを動かしてみたんですが
コンテキストを作るところで躓いてしまいました。
何がいけないんでしょうか?
具体的には
cl_int status;
cl_context context = clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU, NULL, NULL, &status);
とやると、status に CL_INVALID_PLATFORM が返ってきます。
clGetPlatformInfo 関数は、たとえば CL_PLATFORM_VERSION を引数にして実行すると
"OpenCL 1.0 CUDA 3.2.1" という文字列が返ってくるので
OpenCLドライバが入ってないわけではなさそうなんですが・・・
環境はCore2Duo E8400、GeForce9600GT、Windows7 32bitです。
コンテキストを作るところで躓いてしまいました。
何がいけないんでしょうか?
具体的には
cl_int status;
cl_context context = clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU, NULL, NULL, &status);
とやると、status に CL_INVALID_PLATFORM が返ってきます。
clGetPlatformInfo 関数は、たとえば CL_PLATFORM_VERSION を引数にして実行すると
"OpenCL 1.0 CUDA 3.2.1" という文字列が返ってくるので
OpenCLドライバが入ってないわけではなさそうなんですが・・・
環境はCore2Duo E8400、GeForce9600GT、Windows7 32bitです。
404デフォルトの名無しさん
2010/12/31(金) 18:39:37 第一引数がNULLだとそうなるのがある
ならないのがあるのかは知らん
秀和の本読んでると思うけど公式から修正されたソース落としてこれるからそれを参考にしてくれ
今規制中で携帯からコード打つ気にならんw
ならないのがあるのかは知らん
秀和の本読んでると思うけど公式から修正されたソース落としてこれるからそれを参考にしてくれ
今規制中で携帯からコード打つ気にならんw
405403
2010/12/31(金) 20:39:19 >>404
秀和のサイトの修正済サンプルコードを参考にしたら、うまく動きました。
第一引数にNULLではなくコンテキストのプロパティを与えればいいみたいですね。
秀和の本で勉強してると言い当てられてビックリですw
この本わかりやすいですね。
大学の研究で何千枚の画像相関やってるんで、OpenCLで夢がひろがりんぐ。
秀和のサイトの修正済サンプルコードを参考にしたら、うまく動きました。
第一引数にNULLではなくコンテキストのプロパティを与えればいいみたいですね。
秀和の本で勉強してると言い当てられてビックリですw
この本わかりやすいですね。
大学の研究で何千枚の画像相関やってるんで、OpenCLで夢がひろがりんぐ。
406デフォルトの名無しさん
2011/01/01(土) 10:51:11 グラフィックスドゥライヴァのヴァージョンは?
407404
2011/01/01(土) 16:41:42408デフォルトの名無しさん
2011/01/04(火) 05:00:19 openCLを使っています。
CL_DEVICE_TYPE_DEFAULTという値について質問があります。
この値はプラットフォームの標準デバイスを使うと書いてありました。
どのようにしたら、プラットフォームの標準デバイスがGPUなのか、CPU
なのかを知ることができるのでしょうか。
CL_DEVICE_TYPE_DEFAULTという値について質問があります。
この値はプラットフォームの標準デバイスを使うと書いてありました。
どのようにしたら、プラットフォームの標準デバイスがGPUなのか、CPU
なのかを知ることができるのでしょうか。
409デフォルトの名無しさん
2011/01/26(水) 11:02:46 Radeon5850と6970を二本さして、FFTの負荷分散させたいと思ってcontextにデバイス2つのせてキューも2本立てたんだけど、
データ転送も並列実行も同時並列的に実行されないで逐次的に実行されてるみたいなんですよ。
コードは1GPUの場合のものをキューだけ変えて単純に2つ並べただけなんですけれども。
OpenCL StramSDKでマルチGPU?実行されてる方いらっしゃいます?
データ転送も並列実行も同時並列的に実行されないで逐次的に実行されてるみたいなんですよ。
コードは1GPUの場合のものをキューだけ変えて単純に2つ並べただけなんですけれども。
OpenCL StramSDKでマルチGPU?実行されてる方いらっしゃいます?
410デフォルトの名無しさん
2011/01/26(水) 12:09:39 AMDからメール来た
AMD Accelerated Parallel Processing (APP) SDK | AMD Developer Central
http://developer.amd.com/gpu/AMDAPPSDK/Pages/default.aspx
OpenCL? H.264/AVC: MainConcept
http://www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
AMD Accelerated Parallel Processing (APP) SDK | AMD Developer Central
http://developer.amd.com/gpu/AMDAPPSDK/Pages/default.aspx
OpenCL? H.264/AVC: MainConcept
http://www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
411409
2011/01/28(金) 13:15:14 OpenMP使えばいいんですね.自己解決しましたw
412デフォルトの名無しさん
2011/01/28(金) 18:00:42 OpenCLはCUDAやTBBのラッパーという理解で宜しいか?
413デフォルトの名無しさん
2011/01/31(月) 10:23:07 OpenMPはCPUしか並列化できない
GPUも並列化したいならOpenMPじゃなくてOpenCL使わなきゃだめだろ
GPUも並列化したいならOpenMPじゃなくてOpenCL使わなきゃだめだろ
414デフォルトの名無しさん
2011/01/31(月) 21:48:44415デフォルトの名無しさん
2011/01/31(月) 23:26:33 AMDのH264のSDKってどうなの?
416デフォルトの名無しさん
2011/02/01(火) 20:28:57 >>415
んなもんあったっけ??
んなもんあったっけ??
417デフォルトの名無しさん
2011/02/02(水) 01:05:26418デフォルトの名無しさん
2011/02/02(水) 15:44:26 >>417
それAMD製じゃないしAMD専用でも無いじゃん
http://www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
それAMD製じゃないしAMD専用でも無いじゃん
http://www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
419デフォルトの名無しさん
2011/02/02(水) 21:39:51 >>417
ぷw
ぷw
420デフォルトの名無しさん
2011/02/03(木) 00:23:39421デフォルトの名無しさん
2011/02/03(木) 00:34:19 >>420
と思ったんですよ。とりあえず同じコンテクストにデバイス2つ乗っけて、キューを二本立ててやってみると計算はされるんだけど、プロファイラーで動作みてみると見事に逐次実行されてて。コンテクスト2つ立ててもダメでした。
ヘテロジニアスなんて謳ってるわりに面倒ですよねぇ^^;
と思ったんですよ。とりあえず同じコンテクストにデバイス2つ乗っけて、キューを二本立ててやってみると計算はされるんだけど、プロファイラーで動作みてみると見事に逐次実行されてて。コンテクスト2つ立ててもダメでした。
ヘテロジニアスなんて謳ってるわりに面倒ですよねぇ^^;
422デフォルトの名無しさん
2011/02/04(金) 03:56:08423デフォルトの名無しさん
2011/02/04(金) 20:08:07424デフォルトの名無しさん
2011/02/09(水) 20:10:42 >>421
プロファイラで実行すると逐次実行されるが、プロファイラ上でなければ並列実行される。
ジョブ投入や実行の時間を記録して表示させてみ。
また、同一コンテキストのメモリが二つのデバイスのどちらからでもアクセスできる裏技もあるよ。
最初のアクセスは遅いが、それ以降は早いので、CPU側に読み込んで書き戻すとかしなくてもダミーでメモリをアクセスするジョブを流せばデバイス間のデータ移動ができる。
1年ほど前にデバイス2本同時駆動の実験だけして本チャンの計算プログラムはまだつくってなかったな、そういや。
プロファイラで実行すると逐次実行されるが、プロファイラ上でなければ並列実行される。
ジョブ投入や実行の時間を記録して表示させてみ。
また、同一コンテキストのメモリが二つのデバイスのどちらからでもアクセスできる裏技もあるよ。
最初のアクセスは遅いが、それ以降は早いので、CPU側に読み込んで書き戻すとかしなくてもダミーでメモリをアクセスするジョブを流せばデバイス間のデータ移動ができる。
1年ほど前にデバイス2本同時駆動の実験だけして本チャンの計算プログラムはまだつくってなかったな、そういや。
425デフォルトの名無しさん
2011/03/08(火) 07:32:39.91 昨日1日使ってボトルネックをOpenCLに移植したけど、
余計遅くなったわ。やれやれ
余計遅くなったわ。やれやれ
426デフォルトの名無しさん
2011/03/08(火) 08:28:07.93 ボトルネックを移植するんじゃなくてOpenCLに向いている部分を移植しろよ
または並列性を極大化したりif文などの分岐を全部排除するなどアルゴリズム最適化をしてみれば?
または並列性を極大化したりif文などの分岐を全部排除するなどアルゴリズム最適化をしてみれば?
427デフォルトの名無しさん
2011/04/07(木) 03:06:36.77 VLIW5のtパイプ埋まらん
428デフォルトの名無しさん
2011/04/13(水) 04:08:44.89 深く考えずに2^26スレッドenqueueしたらひどいことになった。
429デフォルトの名無しさん
2011/04/21(木) 23:37:32.85 なんでこれ有料なんだ?
ttp://web.me.com/cducommun/CLBuilder/Home.html
ttp://web.me.com/cducommun/CLBuilder/Home.html
430デフォルトの名無しさん
2011/04/22(金) 00:28:47.04 Appleが提供しているツールならまだしも第三者が開発しているツールを無料にしろってのは横暴だろ
シェアウェアや市販ソフトを完全否定なお人ですか?
シェアウェアや市販ソフトを完全否定なお人ですか?
431デフォルトの名無しさん
2011/04/23(土) 23:18:19.02 AMD APPのOpenCLについてご存じの方がいたら教えて欲しいんですが、
wavefront=64 って事は、例えばwork_group = 128 の場合 work_itemが64ずつ完全に並列実行って認識で合ってるでしょうか?
(wavefront内のやりとりは同期が必要ないかどうかを知りたいです)
wavefront=64 って事は、例えばwork_group = 128 の場合 work_itemが64ずつ完全に並列実行って認識で合ってるでしょうか?
(wavefront内のやりとりは同期が必要ないかどうかを知りたいです)
432デフォルトの名無しさん
2011/04/24(日) 03:56:08.00 >>431
何の保証もないけど、今のところ大丈夫な気がする。
何の保証もないけど、今のところ大丈夫な気がする。
433デフォルトの名無しさん
2011/04/24(日) 05:50:16.61 最大3クロックのタイミング差があると思うんだけど。
434デフォルトの名無しさん
2011/05/26(木) 04:58:19.55 XOR_INT*4とMULADD*4が同じ時間食うって納得いかん…
435デフォルトの名無しさん
2011/06/14(火) 22:58:32.16 for(d=0;省略){
clSetKernelArg(省略&d);
clEnqueueNDRangekernel(省略);
clEnqueueReadBuffer(省略);
for(省略){読み出したメモリ合算}
}
で1024*dで実行して
読み出して合算して再度実行・・・の形にしてもアドレス違反が起きてしまう・・・
イベントリストもバリア同期も意味なし
GPU実行でアドレス違反は画面だけ真っ黒になってびっくりした
デバックはCPUデバイス使ったほうがいいよ
clSetKernelArg(省略&d);
clEnqueueNDRangekernel(省略);
clEnqueueReadBuffer(省略);
for(省略){読み出したメモリ合算}
}
で1024*dで実行して
読み出して合算して再度実行・・・の形にしてもアドレス違反が起きてしまう・・・
イベントリストもバリア同期も意味なし
GPU実行でアドレス違反は画面だけ真っ黒になってびっくりした
デバックはCPUデバイス使ったほうがいいよ
436デフォルトの名無しさん
2011/06/26(日) 01:59:15.81 最近OpenCLに興味もったんですが皆さん楽しいですか?
437デフォルトの名無しさん
2011/06/26(日) 14:59:58.32 楽しいとか楽しくないとか問題じゃねえよ
438デフォルトの名無しさん
2011/06/26(日) 15:03:37.91 でっかいうんこかどうかだな
439デフォルトの名無しさん
2011/07/04(月) 00:47:28.82 AMD gDEBugger
ttp://developer.amd.com/tools/gDEBugger/Pages/default.aspx
いろいろ便利かもな
ttp://developer.amd.com/tools/gDEBugger/Pages/default.aspx
いろいろ便利かもな
440デフォルトの名無しさん
2011/07/04(月) 00:50:00.35 nsightもOpenCLデバッグ対応してなかったっけ?
441天使 ◆uL5esZLBSE
2011/07/04(月) 06:50:33.14 2011年になっても未だにJAVA使い続けてる奴ってさ
仕事で仕方なくならわかるけど
家でもJAVAやってるなら本当にバカだよね。哀れ
ゴミだし
仕事で仕方なくならわかるけど
家でもJAVAやってるなら本当にバカだよね。哀れ
ゴミだし
442デフォルトの名無しさん
2011/07/04(月) 07:59:16.86 最近みかける天使うぜー死ねと思っていたが
松本龍の阿呆発言と比べると実害無いだけマシだと思った
松本龍の阿呆発言と比べると実害無いだけマシだと思った
443デフォルトの名無しさん
2011/07/05(火) 22:49:02.30 つまんねー書き込みしてないでとっととNG登録しろよ
444デフォルトの名無しさん
2011/07/05(火) 22:51:03.29 このコテハン「天使 ◆uL5esZLBSE」は天才チンパンジー「アイちゃん」が
言語訓練のために使用しているハンドルです。
アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。
京都大学霊長類研究所
言語訓練のために使用しているハンドルです。
アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。
京都大学霊長類研究所
445デフォルトの名無しさん
2011/07/06(水) 01:40:07.31 intelのopencl SDKをlinuxにインスコったけどコンパイルのやり方わからん
gcc使ってどうにかならんの?
gcc使ってどうにかならんの?
446デフォルトの名無しさん
2011/07/06(水) 09:49:42.54 OpenCLってもう1年もバージョン変わって無いけど、開発中止したの?
447デフォルトの名無しさん
2011/07/06(水) 11:06:10.67 バージョンUPしなくていいほど今の版が完成されたすばらしい出来だという事なんだよ
という事にしておきたい
という事にしておきたい
448デフォルトの名無しさん
2011/07/06(水) 11:57:01.57 グラボはどんどん進化してるのに、ライブラリは完成されてるとかねーよ
449デフォルトの名無しさん
2011/07/06(水) 18:08:10.55 進化しても演算部分のコンパイラが底まで進化する必要があるか?
MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
450デフォルトの名無しさん
2011/07/09(土) 07:08:13.674511
2011/07/26(火) 06:44:48.46452デフォルトの名無しさん
2011/07/27(水) 23:22:22.79 HD4850が最新のドライバではOpenCL動かないし、古いドライバでは動くがゲロ遅
アムドはあかんな
アムドはあかんな
453デフォルトの名無しさん
2011/07/28(木) 01:08:32.77454デフォルトの名無しさん
2011/07/28(木) 14:50:27.81 HD4850, APP 2.4, CCC 11.6で動かず(カーネルコンパイルエラー)。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
455デフォルトの名無しさん
2011/07/28(木) 15:07:33.48 アムドとか言ってるあたりでお察し・・・
456デフォルトの名無しさん
2011/07/28(木) 20:28:57.67 アムドいうただけでレッテル貼りとかどんだけ・・・
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで
457デフォルトの名無しさん
2011/07/29(金) 09:43:45.32 どっちも自社ライブラリ使えってことだよ
458デフォルトの名無しさん
2011/07/29(金) 12:23:00.19 data parallelで簡単な2重forならできるけどそれ使って複雑な計算するのが
できぬ・・・CUDAと違って1024が最大なのがネック
できぬ・・・CUDAと違って1024が最大なのがネック
459452
2011/07/30(土) 22:03:20.57 職場のC1060に家パソのHD4850が10倍以上の大差で惨敗してムカついたのでHD6950買ってきた。
2倍以上でHD6950の勝利!
アムド最高やで
2倍以上でHD6950の勝利!
アムド最高やで
460デフォルトの名無しさん
2011/07/30(土) 22:25:54.10 6970や6990じゃなくて6950なのか。てかC1060はもうどうでもよかろう。
461デフォルトの名無しさん
2011/07/30(土) 23:10:14.10462デフォルトの名無しさん
2011/08/01(月) 20:49:14.86 いつの間にか WebCL とか出来てて驚いた。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
463デフォルトの名無しさん
2011/08/01(月) 21:47:49.14 WebGLについてはこちらでお願いします
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
http://hibari.2ch.net/test/read.cgi/tech/1308761577/
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
http://hibari.2ch.net/test/read.cgi/tech/1308761577/
464デフォルトの名無しさん
2011/08/01(月) 22:13:20.26 WebGLの話なんてしてないが
465デフォルトの名無しさん
2011/08/01(月) 23:26:04.83 サイトを開くだけで分散コンピューティングに参加…胸熱。
466デフォルトの名無しさん
2011/08/02(火) 10:29:42.77467デフォルトの名無しさん
2011/08/02(火) 14:03:26.64 頻繁にメインメモリと同期するような計算にはJavaScriptが遅くて使い物にならないだろうし
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん
468デフォルトの名無しさん
2011/08/02(火) 15:29:27.41 技術というのは、早い者勝ちでなぁ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ
469デフォルトの名無しさん
2011/08/02(火) 16:18:14.25 それはわかるんだが、特許を取るタイミングとかが難しいよな
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか
まー特許引き延ばしって裏技もあるけど
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか
まー特許引き延ばしって裏技もあるけど
470デフォルトの名無しさん
2011/08/02(火) 19:41:55.79 まあ、あれや
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。
んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。
んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
471デフォルトの名無しさん
2011/08/03(水) 01:09:07.14 ブラウザで超広大なライフゲーム
472デフォルトの名無しさん
2011/08/04(木) 04:52:42.94 APP SDK 2.5 で BFI_INT が使われるようになったけど、
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
473デフォルトの名無しさん
2011/08/04(木) 18:42:12.38 CAL ILコンパイラはもう誰もメンテできないんだろうな。BFI_INT を付け足すのがそんなに苦痛かね?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?
474デフォルトの名無しさん
2011/08/04(木) 23:21:28.44 OpenCLってCellみたいなプロセッサが普及しないと面白くないよね。
GPU型の抽象化だけじゃ。
GPU型の抽象化だけじゃ。
475デフォルトの名無しさん
2011/08/05(金) 09:45:21.35 そのCellがコケたからなー
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに
476デフォルトの名無しさん
2011/08/06(土) 00:40:12.65 i7であえてOpenCL
477デフォルトの名無しさん
2011/08/06(土) 02:51:44.01 OpenCLのアプリを配布するときってAMDとnVidiaで別に実行ファイル作らなきゃいけないの?
478デフォルトの名無しさん
2011/08/06(土) 03:08:35.23 何でんなこと思った。
479デフォルトの名無しさん
2011/08/06(土) 03:57:16.00 今のところ、OpenCLなアプリケーションを"配布"するための良い方法は無い。(除 MacOS X)
480デフォルトの名無しさん
2011/08/06(土) 07:16:37.83 *.cl カーネルを露出させるのがそんなに恥ずかしいか!
難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
481デフォルトの名無しさん
2011/08/07(日) 08:06:38.42 nVidiaから最新ドライバでOpenCL1.1対応とかメールきたんだけど、
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。
482デフォルトの名無しさん
2011/08/07(日) 08:08:49.28 >>480
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
483デフォルトの名無しさん
2011/08/08(月) 05:22:20.10 Windows用OpenCL1.1ドライバを試してみたが、
どうも上手く動かないのでもう一寸待った方が良いと思う
どうも上手く動かないのでもう一寸待った方が良いと思う
484デフォルトの名無しさん
2011/08/09(火) 01:37:46.04485デフォルトの名無しさん
2011/08/11(木) 20:59:03.48 >>484
ノウハウが全て開示されているとでも思っているのか?
ノウハウが全て開示されているとでも思っているのか?
486デフォルトの名無しさん
2011/08/11(木) 22:05:51.96 世間一般に知られていなければ十分じゃん
487デフォルトの名無しさん
2011/08/12(金) 21:31:49.60 世間一般に知られないようにするためにカーネルを晒したくないわけだろ
488デフォルトの名無しさん
2011/08/14(日) 01:34:57.52 >>473
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。
でもBFI_INTは置いてけぼり
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。
でもBFI_INTは置いてけぼり
489デフォルトの名無しさん
2011/08/14(日) 09:57:57.76 マスクが定数なら、iand,iand,ior で BFI_INT になるとおもうけど、
そうじゃないときになー。
そうじゃないときになー。
490デフォルトの名無しさん
2011/08/31(水) 17:10:54.28 初心者です。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか?
また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか?
当方LINUXでのプログラミングをしております。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか?
また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか?
当方LINUXでのプログラミングをしております。
491デフォルトの名無しさん
2011/08/31(水) 21:06:58.51 並列化はアルゴリズムをかなり選ぶよ。GPGPUなんて尚更。
まず普通にマルチスレッドで並列化してみたら?
まず普通にマルチスレッドで並列化してみたら?
492デフォルトの名無しさん
2011/09/15(木) 10:02:24.21 opencl用の自動並列化コンパイラってある?
493デフォルトの名無しさん
2011/09/16(金) 05:07:07.00494デフォルトの名無しさん
2011/09/16(金) 18:41:47.81 「Ivy Bridge」プロセッサ、「OpenCL 」をサポート
495デフォルトの名無しさん
2011/09/16(金) 23:43:18.97 OpenCLを使ったおぉっとなるアプリってありますか?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【給食無償化】国が全額負担 自維公3党、近く合意へ★2 [ぐれ★]
- 【サッカー】Jリーグ、43億円の赤字予算を承認 ★2 [鉄チーズ烏★]
- 40代教員、1億8600万円分の暗号資産だまし取られる 「警察手帳のような物」見せられ−滋賀県草津市 [蚤の市★]
- 上野動物園の双子パンダ、1月末に中国に返還へ 国内でパンダ不在に ★4 [蚤の市★]
- 【ラブホ】小川晶前市長、出直し立候補意向 周囲に伝達 群馬・前橋市長選 [ぐれ★]
- なだぎ武、イベントチケットが売れず悲鳴「10枚しか売れておりません」 [muffin★]
- しっとり歌い上げる系地下アイドルの供給が増えてもいいんじゃないか
- XのDM更新されたけどバグ直った?
- 維新・吉村はん「国民よ思い出せ! 悪夢の民主党時代を!!」 [592058334]
- 楽しく生きると決めたんだが
- 『赤いきつねCMの性的さがOKなら、弱者男性オタクのオナニー自撮りもCMにしよう』の声、ネットで上がり始める [932029429]
- レズだけどひま
