さてついにOpenCLの仕様が公開されました。
http://www.khronos.org/opencl/
公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。
OpenCLプログラミング#1
■ このスレッドは過去ログ倉庫に格納されています
1a36 ◆K0BqlCB3.k
2008/12/10(水) 15:38:25439デフォルトの名無しさん
2011/07/04(月) 00:47:28.82 AMD gDEBugger
ttp://developer.amd.com/tools/gDEBugger/Pages/default.aspx
いろいろ便利かもな
ttp://developer.amd.com/tools/gDEBugger/Pages/default.aspx
いろいろ便利かもな
440デフォルトの名無しさん
2011/07/04(月) 00:50:00.35 nsightもOpenCLデバッグ対応してなかったっけ?
441天使 ◆uL5esZLBSE
2011/07/04(月) 06:50:33.14 2011年になっても未だにJAVA使い続けてる奴ってさ
仕事で仕方なくならわかるけど
家でもJAVAやってるなら本当にバカだよね。哀れ
ゴミだし
仕事で仕方なくならわかるけど
家でもJAVAやってるなら本当にバカだよね。哀れ
ゴミだし
442デフォルトの名無しさん
2011/07/04(月) 07:59:16.86 最近みかける天使うぜー死ねと思っていたが
松本龍の阿呆発言と比べると実害無いだけマシだと思った
松本龍の阿呆発言と比べると実害無いだけマシだと思った
443デフォルトの名無しさん
2011/07/05(火) 22:49:02.30 つまんねー書き込みしてないでとっととNG登録しろよ
444デフォルトの名無しさん
2011/07/05(火) 22:51:03.29 このコテハン「天使 ◆uL5esZLBSE」は天才チンパンジー「アイちゃん」が
言語訓練のために使用しているハンドルです。
アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。
京都大学霊長類研究所
言語訓練のために使用しているハンドルです。
アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。
京都大学霊長類研究所
445デフォルトの名無しさん
2011/07/06(水) 01:40:07.31 intelのopencl SDKをlinuxにインスコったけどコンパイルのやり方わからん
gcc使ってどうにかならんの?
gcc使ってどうにかならんの?
446デフォルトの名無しさん
2011/07/06(水) 09:49:42.54 OpenCLってもう1年もバージョン変わって無いけど、開発中止したの?
447デフォルトの名無しさん
2011/07/06(水) 11:06:10.67 バージョンUPしなくていいほど今の版が完成されたすばらしい出来だという事なんだよ
という事にしておきたい
という事にしておきたい
448デフォルトの名無しさん
2011/07/06(水) 11:57:01.57 グラボはどんどん進化してるのに、ライブラリは完成されてるとかねーよ
449デフォルトの名無しさん
2011/07/06(水) 18:08:10.55 進化しても演算部分のコンパイラが底まで進化する必要があるか?
MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
450デフォルトの名無しさん
2011/07/09(土) 07:08:13.674511
2011/07/26(火) 06:44:48.46452デフォルトの名無しさん
2011/07/27(水) 23:22:22.79 HD4850が最新のドライバではOpenCL動かないし、古いドライバでは動くがゲロ遅
アムドはあかんな
アムドはあかんな
453デフォルトの名無しさん
2011/07/28(木) 01:08:32.77454デフォルトの名無しさん
2011/07/28(木) 14:50:27.81 HD4850, APP 2.4, CCC 11.6で動かず(カーネルコンパイルエラー)。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
455デフォルトの名無しさん
2011/07/28(木) 15:07:33.48 アムドとか言ってるあたりでお察し・・・
456デフォルトの名無しさん
2011/07/28(木) 20:28:57.67 アムドいうただけでレッテル貼りとかどんだけ・・・
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで
457デフォルトの名無しさん
2011/07/29(金) 09:43:45.32 どっちも自社ライブラリ使えってことだよ
458デフォルトの名無しさん
2011/07/29(金) 12:23:00.19 data parallelで簡単な2重forならできるけどそれ使って複雑な計算するのが
できぬ・・・CUDAと違って1024が最大なのがネック
できぬ・・・CUDAと違って1024が最大なのがネック
459452
2011/07/30(土) 22:03:20.57 職場のC1060に家パソのHD4850が10倍以上の大差で惨敗してムカついたのでHD6950買ってきた。
2倍以上でHD6950の勝利!
アムド最高やで
2倍以上でHD6950の勝利!
アムド最高やで
460デフォルトの名無しさん
2011/07/30(土) 22:25:54.10 6970や6990じゃなくて6950なのか。てかC1060はもうどうでもよかろう。
461デフォルトの名無しさん
2011/07/30(土) 23:10:14.10462デフォルトの名無しさん
2011/08/01(月) 20:49:14.86 いつの間にか WebCL とか出来てて驚いた。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
463デフォルトの名無しさん
2011/08/01(月) 21:47:49.14 WebGLについてはこちらでお願いします
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
http://hibari.2ch.net/test/read.cgi/tech/1308761577/
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
http://hibari.2ch.net/test/read.cgi/tech/1308761577/
464デフォルトの名無しさん
2011/08/01(月) 22:13:20.26 WebGLの話なんてしてないが
465デフォルトの名無しさん
2011/08/01(月) 23:26:04.83 サイトを開くだけで分散コンピューティングに参加…胸熱。
466デフォルトの名無しさん
2011/08/02(火) 10:29:42.77467デフォルトの名無しさん
2011/08/02(火) 14:03:26.64 頻繁にメインメモリと同期するような計算にはJavaScriptが遅くて使い物にならないだろうし
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん
468デフォルトの名無しさん
2011/08/02(火) 15:29:27.41 技術というのは、早い者勝ちでなぁ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ
469デフォルトの名無しさん
2011/08/02(火) 16:18:14.25 それはわかるんだが、特許を取るタイミングとかが難しいよな
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか
まー特許引き延ばしって裏技もあるけど
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか
まー特許引き延ばしって裏技もあるけど
470デフォルトの名無しさん
2011/08/02(火) 19:41:55.79 まあ、あれや
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。
んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。
んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
471デフォルトの名無しさん
2011/08/03(水) 01:09:07.14 ブラウザで超広大なライフゲーム
472デフォルトの名無しさん
2011/08/04(木) 04:52:42.94 APP SDK 2.5 で BFI_INT が使われるようになったけど、
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
473デフォルトの名無しさん
2011/08/04(木) 18:42:12.38 CAL ILコンパイラはもう誰もメンテできないんだろうな。BFI_INT を付け足すのがそんなに苦痛かね?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?
474デフォルトの名無しさん
2011/08/04(木) 23:21:28.44 OpenCLってCellみたいなプロセッサが普及しないと面白くないよね。
GPU型の抽象化だけじゃ。
GPU型の抽象化だけじゃ。
475デフォルトの名無しさん
2011/08/05(金) 09:45:21.35 そのCellがコケたからなー
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに
476デフォルトの名無しさん
2011/08/06(土) 00:40:12.65 i7であえてOpenCL
477デフォルトの名無しさん
2011/08/06(土) 02:51:44.01 OpenCLのアプリを配布するときってAMDとnVidiaで別に実行ファイル作らなきゃいけないの?
478デフォルトの名無しさん
2011/08/06(土) 03:08:35.23 何でんなこと思った。
479デフォルトの名無しさん
2011/08/06(土) 03:57:16.00 今のところ、OpenCLなアプリケーションを"配布"するための良い方法は無い。(除 MacOS X)
480デフォルトの名無しさん
2011/08/06(土) 07:16:37.83 *.cl カーネルを露出させるのがそんなに恥ずかしいか!
難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
481デフォルトの名無しさん
2011/08/07(日) 08:06:38.42 nVidiaから最新ドライバでOpenCL1.1対応とかメールきたんだけど、
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。
482デフォルトの名無しさん
2011/08/07(日) 08:08:49.28 >>480
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
483デフォルトの名無しさん
2011/08/08(月) 05:22:20.10 Windows用OpenCL1.1ドライバを試してみたが、
どうも上手く動かないのでもう一寸待った方が良いと思う
どうも上手く動かないのでもう一寸待った方が良いと思う
484デフォルトの名無しさん
2011/08/09(火) 01:37:46.04485デフォルトの名無しさん
2011/08/11(木) 20:59:03.48 >>484
ノウハウが全て開示されているとでも思っているのか?
ノウハウが全て開示されているとでも思っているのか?
486デフォルトの名無しさん
2011/08/11(木) 22:05:51.96 世間一般に知られていなければ十分じゃん
487デフォルトの名無しさん
2011/08/12(金) 21:31:49.60 世間一般に知られないようにするためにカーネルを晒したくないわけだろ
488デフォルトの名無しさん
2011/08/14(日) 01:34:57.52 >>473
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。
でもBFI_INTは置いてけぼり
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。
でもBFI_INTは置いてけぼり
489デフォルトの名無しさん
2011/08/14(日) 09:57:57.76 マスクが定数なら、iand,iand,ior で BFI_INT になるとおもうけど、
そうじゃないときになー。
そうじゃないときになー。
490デフォルトの名無しさん
2011/08/31(水) 17:10:54.28 初心者です。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか?
また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか?
当方LINUXでのプログラミングをしております。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか?
また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか?
当方LINUXでのプログラミングをしております。
491デフォルトの名無しさん
2011/08/31(水) 21:06:58.51 並列化はアルゴリズムをかなり選ぶよ。GPGPUなんて尚更。
まず普通にマルチスレッドで並列化してみたら?
まず普通にマルチスレッドで並列化してみたら?
492デフォルトの名無しさん
2011/09/15(木) 10:02:24.21 opencl用の自動並列化コンパイラってある?
493デフォルトの名無しさん
2011/09/16(金) 05:07:07.00494デフォルトの名無しさん
2011/09/16(金) 18:41:47.81 「Ivy Bridge」プロセッサ、「OpenCL 」をサポート
495デフォルトの名無しさん
2011/09/16(金) 23:43:18.97 OpenCLを使ったおぉっとなるアプリってありますか?
496デフォルトの名無しさん
2011/09/17(土) 08:21:50.52 うわぁってなるあぷりならある
497デフォルトの名無しさん
2011/09/17(土) 08:36:22.90 たとえば?
498デフォルトの名無しさん
2011/09/17(土) 18:08:09.83 まってて、ちょっと調べてくる
499デフォルトの名無しさん
2011/09/18(日) 07:57:32.03500デフォルトの名無しさん
2011/09/23(金) 23:20:48.33 なんでAMDのOpenCLってこんなにサポートが糞なの?
501デフォルトの名無しさん
2011/09/24(土) 06:50:26.05 OpenCLに関しちゃAMDが一番マシじゃね。
502デフォルトの名無しさん
2011/09/24(土) 15:07:51.08 >>500
ヒトイネ
ヒトイネ
503デフォルトの名無しさん
2011/09/27(火) 22:25:38.34 >500
バグレポートしたら、ちゃんと対応してもらえたよ?
バグレポートしたら、ちゃんと対応してもらえたよ?
504デフォルトの名無しさん
2011/10/03(月) 02:47:52.78 もしかして関数呼び出しはOpenCL Cで記述出来ない...?
cudaでいう__device__のように記述出来るかと思ったらそんなことはないのかひどいぞこれは
cudaでいう__device__のように記述出来るかと思ったらそんなことはないのかひどいぞこれは
505デフォルトの名無しさん
2011/10/03(月) 02:54:10.32 そんなことはなかったすみませんでした
506デフォルトの名無しさん
2011/10/03(月) 22:18:02.72 >>503
バグレポートなんか出来るの?
バグレポートなんか出来るの?
507デフォルトの名無しさん
2011/10/04(火) 00:03:56.22 コンパイル時に死ぬバグだけどコンパイラのサポート窓口は分からなかったので
KernelAnalyzerのAboutにあるメアドに「KernelAnalyzerが死ぬんだけど」
って送った。(嘘はついてないつもり)
コンパイラチームに転送してくれて11.10/2.6で直るって連絡来たよ。
実行時に死ぬのとか結果が変なのもForumに書けば結構みてくれるよ。
KernelAnalyzerのAboutにあるメアドに「KernelAnalyzerが死ぬんだけど」
って送った。(嘘はついてないつもり)
コンパイラチームに転送してくれて11.10/2.6で直るって連絡来たよ。
実行時に死ぬのとか結果が変なのもForumに書けば結構みてくれるよ。
508デフォルトの名無しさん
2011/10/05(水) 23:41:21.79 >>507
Forumに書いても放置が多いみたいで困る。。
Forumに書いても放置が多いみたいで困る。。
509デフォルトの名無しさん
2011/10/06(木) 05:23:23.41 俺が今書いてるJavaプログラムの中で
2つのbyte配列に対する100〜5万回くらいの論理積(単にforループで2つの配列の論理積をとる)が頻繁に発生するんだけど
そういうとこでOpenCL使ったら高速化期待できる?
まとめて100万回くらいならGPUが速そうなんだけど
100回で済むとかだとオーバーヘッドがでかいのかなと思って躊躇してる
2つのbyte配列に対する100〜5万回くらいの論理積(単にforループで2つの配列の論理積をとる)が頻繁に発生するんだけど
そういうとこでOpenCL使ったら高速化期待できる?
まとめて100万回くらいならGPUが速そうなんだけど
100回で済むとかだとオーバーヘッドがでかいのかなと思って躊躇してる
510デフォルトの名無しさん
2011/10/06(木) 18:38:50.63 aparapiでも使ってみたら?
511デフォルトの名無しさん
2011/10/17(月) 07:38:26.26 C++のラッパーを最近使い始めたけどかなり使いやすいね。
とくにメモリ解放が楽になった。
とくにメモリ解放が楽になった。
512デフォルトの名無しさん
2011/11/02(水) 21:22:05.07 OpenCLは構造体のメモリオブジェクトを作成できますか?
CUDAだったら
typedef struct {
float *num;
} DATA;
DATA data;
cudaMalloc( &data.num, sizeof(float) * 1024 );
みたいにできるんですけど
CUDAだったら
typedef struct {
float *num;
} DATA;
DATA data;
cudaMalloc( &data.num, sizeof(float) * 1024 );
みたいにできるんですけど
513デフォルトの名無しさん
2011/11/02(水) 23:38:01.05 >>512
例が意味不明
それじゃGPU上に単なるfloat型の配列を確保して、
そのdeviceポインタをCPUの構造体メンバに代入しているだけ。
OpenCLでもGPU上にfloat型の配列をbufferとして確保して、
それをCPUの構造体メンバに代入することは出来る。
メンバ変数の型はfloat*では無く、cl_memだけどね。
でも、その配列自体をGPU側にコピーして、
間接アクセスしようとするとCUDAとOpenCLでは全く違う。
OpenCLではGPU上のポインタは1つのカーネル呼び出し内でしか
一貫性が保証されないから、ポインタを保存しておいて
次のカーネル呼び出しで使うという事が不可能
(cl_memはハンドルに過ぎず、OpenCLのランタイムは
GPU上のオブジェクトを再配置する可能性があるから)
まあ、やるとしたら大きなbufferをメモリプールとして生成して、offsetをポインタの代わりに保存
後でアクセスするときにはbufferを引数に渡して、それにoffset足した位置を触るという
形にするしかない。
まあ、CUDAでも実際にはこの方がCPUとGPUで同じデータを扱えるし、
性能面でも悪くないやり方なんだけど。
例が意味不明
それじゃGPU上に単なるfloat型の配列を確保して、
そのdeviceポインタをCPUの構造体メンバに代入しているだけ。
OpenCLでもGPU上にfloat型の配列をbufferとして確保して、
それをCPUの構造体メンバに代入することは出来る。
メンバ変数の型はfloat*では無く、cl_memだけどね。
でも、その配列自体をGPU側にコピーして、
間接アクセスしようとするとCUDAとOpenCLでは全く違う。
OpenCLではGPU上のポインタは1つのカーネル呼び出し内でしか
一貫性が保証されないから、ポインタを保存しておいて
次のカーネル呼び出しで使うという事が不可能
(cl_memはハンドルに過ぎず、OpenCLのランタイムは
GPU上のオブジェクトを再配置する可能性があるから)
まあ、やるとしたら大きなbufferをメモリプールとして生成して、offsetをポインタの代わりに保存
後でアクセスするときにはbufferを引数に渡して、それにoffset足した位置を触るという
形にするしかない。
まあ、CUDAでも実際にはこの方がCPUとGPUで同じデータを扱えるし、
性能面でも悪くないやり方なんだけど。
514デフォルトの名無しさん
2011/11/03(木) 01:23:08.95 ラデ外付けGPUに大量にデータを送りたいんだけど、1/4までって制限どうにかならないの?256MBまでしか送れん
515デフォルトの名無しさん
2011/11/03(木) 10:05:29.53 いや、1/4なのではなく 256MBまでという制限。
sizeof(float4) * 4096 * 4096.
sizeof(float4) * 4096 * 4096.
516デフォルトの名無しさん
2011/11/03(木) 10:38:23.81 >>515
これって変えられないの?
これって変えられないの?
517デフォルトの名無しさん
2011/11/04(金) 11:46:02.78 馬鹿には無理
518デフォルトの名無しさん
2011/11/07(月) 02:56:58.68 並列化させるのも結構苦労するよね。
簡単な演算ならいいけど、データ依存がちょっとでも複雑になると
動かすカーネルの順番とか数とか
気にしなきゃいけないことイパーイ
簡単な演算ならいいけど、データ依存がちょっとでも複雑になると
動かすカーネルの順番とか数とか
気にしなきゃいけないことイパーイ
519デフォルトの名無しさん
2011/11/15(火) 23:57:17.03520デフォルトの名無しさん
2011/11/16(水) 00:44:39.04 NVIDIAのドライバがカオスになるな
gdgdの果てに漸く1.0対応が落ち着いたと思ったら
28x世代の1.1対応でまたおかしくなってまだ終息してないのに
gdgdの果てに漸く1.0対応が落ち着いたと思ったら
28x世代の1.1対応でまたおかしくなってまだ終息してないのに
521デフォルトの名無しさん
2011/11/16(水) 01:54:02.46 彼らにはCUDAがあるからなぁ。。
頑張る必要が無いのだろう。
頑張る必要が無いのだろう。
522デフォルトの名無しさん
2011/11/19(土) 02:59:11.80523デフォルトの名無しさん
2011/11/19(土) 19:26:18.05 それはOpenMPのGPU版みたいなものなので、CUDAやOpenCLとは衝突しない
524デフォルトの名無しさん
2011/11/19(土) 20:50:05.10 AlteraがFPGAでOpenCLを、とか言い出してて面白そうな感じ。
525デフォルトの名無しさん
2011/11/19(土) 21:07:31.87 C++AMPのNVIDIA版ぽいね
まぁC++AMPはNVIDIAでも動くけど
インライン記述の世代でどれが主導権を握れるかは気になるところ
まぁC++AMPはNVIDIAでも動くけど
インライン記述の世代でどれが主導権を握れるかは気になるところ
526デフォルトの名無しさん
2011/11/19(土) 23:38:32.61 MSは最終的にC++AMPをオープンにすると言ってはいるが、結局オプソ系コミュニティがどう動くかだな
CPUの並列ライブラリはMSはOpenMPからPPL推し、オプソ系は主にTBBと別れてしまっているので、
GPUではどうにかして歩調を揃えてもらいたいところ
ただ、一応オープン化を標榜するC++ AMPに介入するわけでもなくかといってCUDAの様に自社GPU専用に囲い込むわけでもなく、
立ち位置の被るオープン規格を立ち上げたNVIDIAの意図が分からんといえば分からん
GPUに全てを賭けるメーカーとしては握れる手綱は全て握っておきたい、という事なのかな
CPUの並列ライブラリはMSはOpenMPからPPL推し、オプソ系は主にTBBと別れてしまっているので、
GPUではどうにかして歩調を揃えてもらいたいところ
ただ、一応オープン化を標榜するC++ AMPに介入するわけでもなくかといってCUDAの様に自社GPU専用に囲い込むわけでもなく、
立ち位置の被るオープン規格を立ち上げたNVIDIAの意図が分からんといえば分からん
GPUに全てを賭けるメーカーとしては握れる手綱は全て握っておきたい、という事なのかな
527デフォルトの名無しさん
2011/11/20(日) 01:50:41.74 >>523
使う側は思いっきり衝突するだろ
使う側は思いっきり衝突するだろ
528デフォルトの名無しさん
2011/11/20(日) 02:32:04.15529デフォルトの名無しさん
2011/11/22(火) 14:27:24.23 インタビューで簡単にOpenACCについてふれてる
http://insidehpc.com/2011/11/21/cuda-reaches-5th-birthday-openacc-ramps-up/
http://insidehpc.com/2011/11/21/cuda-reaches-5th-birthday-openacc-ramps-up/
530デフォルトの名無しさん
2011/11/22(火) 23:50:42.88 カーネルの実行順位はイベントで指定できる
OpenCLのバイナリコンパイルと読み込みうまくできない・・・
バイナリなしだと環境自由になるけど
ソース丸出しになるから計算高速化くらいしか使い道ないね
OpenCLのバイナリコンパイルと読み込みうまくできない・・・
バイナリなしだと環境自由になるけど
ソース丸出しになるから計算高速化くらいしか使い道ないね
531デフォルトの名無しさん
2011/11/25(金) 00:37:00.99532デフォルトの名無しさん
2011/11/25(金) 22:22:16.51 >>531
ダイナミックに追加が変更があったのって、DirectX関係だけだな。。。
ダイナミックに追加が変更があったのって、DirectX関係だけだな。。。
533デフォルトの名無しさん
2011/11/28(月) 10:27:25.45 なんかもーGPUメーカーは独自に動いてるし、開発する気無いだろw
534デフォルトの名無しさん
2011/11/29(火) 19:35:56.69 intel CPU制限多すぎ・・・SSE4.1対応って書いておいてくれよ・・・
core2 quad全部対応してるかのようなのはやめてほしい・・・
XPで使えないのはちょっと困る・・・
core2 quad全部対応してるかのようなのはやめてほしい・・・
XPで使えないのはちょっと困る・・・
535デフォルトの名無しさん
2011/11/29(火) 23:11:26.28 SSE見逃してたごめん
536デフォルトの名無しさん
2011/11/30(水) 00:12:08.31 SSEぐらいOpenCL使わなくってもいいじゃん
537デフォルトの名無しさん
2011/11/30(水) 00:50:42.75 >>536
OpenCLの機能実現するのに都合がいい命令がSSE4.1にあるからインテルの開発ツールはSSE4.1対応の世代以降でないと使えないんだよ
どうせ普及する頃には古い世代のCPUいなくなってるよねって方針なんだろ
OpenCLの機能実現するのに都合がいい命令がSSE4.1にあるからインテルの開発ツールはSSE4.1対応の世代以降でないと使えないんだよ
どうせ普及する頃には古い世代のCPUいなくなってるよねって方針なんだろ
538デフォルトの名無しさん
2011/11/30(水) 00:58:02.95 GPUが使えない環境での互換性用と割り切って広くサポートしてくれたほうがまだ有用なのにな
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 上野動物園の双子パンダ、1月末に中国に返還へ 国内でパンダ不在に [蚤の市★]
- 「婚活中の男女の8割以上が婚活疲れ」続ければ続けるほど蟻地獄にハマる必然とは? ★2 [ぐれ★]
- フジ、元日夜に『なるほど!ザ・ワールド』6年ぶり復活 MCは有吉弘行&指原莉乃「衝撃的」「ビックリ」予告 [征夷大将軍★]
- 【福岡】男女2人刺傷事件、関与ほのめかす30代男を確保 刃物も発見 [ぐれ★]
- 中国軍機のレーダー照射1週間 駆け引き続く 中国、米のレッドライン模索 日本、米以外の同志国とも連携探る 米は対立から距離置く★3 [ぐれ★]
- ゼレンスキー氏、NATO加盟断念に言及 ドイツで米代表団と [蚤の市★]
- 【悲報】花王、女性用品だけ量を少なくしてることがバレ大炎上中wwwwwwwwwwwwwwwwwwww [802034645]
- パナソニック、ほぼ全て20%値上げ… ありがとう高市早苗 働いて働いて働いてまいります [667744927]
- 高市早苗、病気か?ろれつ回らず上手く喋れずwwwwww [153490809]
- 🏡すこふさん、とうだ…w🏡
- 世界『日本人男性は女性にモテナイ』 女性が国際ロマンス詐欺に騙されるのは、幼く振る舞いに問題のある日本人男性が原因 [932029429]
- ローソンのセルフレジに不満が続出!「わかりづらい」「操作ミスした」 [769050516]
