さてついにOpenCLの仕様が公開されました。
http://www.khronos.org/opencl/
公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。
OpenCLプログラミング#1
■ このスレッドは過去ログ倉庫に格納されています
1a36 ◆K0BqlCB3.k
2008/12/10(水) 15:38:25685デフォルトの名無しさん
2013/02/11(月) 23:11:22.51 標準のC++に替わり今後はOpenCLが標準に確定したな
OpenCLでパフォーマンスが激向上するから当然か
OpenCLでパフォーマンスが激向上するから当然か
686デフォルトの名無しさん
2013/02/12(火) 06:11:15.51 寝言は寝て言え
687デフォルトの名無しさん
2013/02/17(日) 21:21:57.05 >>684
ありがとう。VLIW4だとスレッド数1/4にして、1スレッドで4つずつ処理するようにしたら倍速になった。
ありがとう。VLIW4だとスレッド数1/4にして、1スレッドで4つずつ処理するようにしたら倍速になった。
688デフォルトの名無しさん
2013/02/18(月) 04:23:25.11 R600のISA解説したpdfもどっかにあって、あれ読むとKernel Analyzerの右側の命令が読めるようになって捗るぞ。
689デフォルトの名無しさん
2013/05/09(木) 04:25:55.54 Intel Releases SDK with OpenCL 1.2 Support for Intel Xeon Phi Coprocessors | techPowerUp
http://www.techpowerup.com/183718/intel-releases-sdk-with-opencl-1-2-support-for-intel-xeon-phi-coprocessors.html
http://www.techpowerup.com/183718/intel-releases-sdk-with-opencl-1-2-support-for-intel-xeon-phi-coprocessors.html
690デフォルトの名無しさん
2013/05/10(金) 23:28:13.87 CUDAが動かない古いNvidiaのビデオカードでも
OpenCLなら動いたりするものなのでしょうか?
OpenCLなら動いたりするものなのでしょうか?
691デフォルトの名無しさん
2013/05/11(土) 17:38:28.19 確かnvidiaがOpenCLサポートしているのは、
チップがGeforce8以降かつ、ドライバの対応も必要だったと思う。
でもgeforce8以降はほとんどCUDA(とPhysXが)乗ってたはず。
それ以前はサポートされていないから動かないんじゃないかな(機材とドライバがないから検証できん)
チップがGeforce8以降かつ、ドライバの対応も必要だったと思う。
でもgeforce8以降はほとんどCUDA(とPhysXが)乗ってたはず。
それ以前はサポートされていないから動かないんじゃないかな(機材とドライバがないから検証できん)
692デフォルトの名無しさん
2013/05/11(土) 23:50:31.95 CUDAにせよ、OpenCLにせよ古いマシンでやろうとする奴はなんなんだ?
古いGPUじゃ大して効果がないし、アーキテクチャがどんどん変わって
いるから使えないものが多いのに。
最新のアーキテクチャでも1万円も出せばそれなりのものが買えるのになあ。
古いGPUじゃ大して効果がないし、アーキテクチャがどんどん変わって
いるから使えないものが多いのに。
最新のアーキテクチャでも1万円も出せばそれなりのものが買えるのになあ。
693デフォルトの名無しさん
2013/05/12(日) 10:11:53.81 研究目的なら最新ので良いけど、実用だと4年前に導入した
数百台の計算機で高速化したい、とかもあるからな。
数百台の計算機で高速化したい、とかもあるからな。
694デフォルトの名無しさん
2013/05/13(月) 17:15:31.08 GeForce8以前って、どんだけ古いカード使っているんだよw
いろんな意味で、無理無理。
いろんな意味で、無理無理。
695デフォルトの名無しさん
2013/05/15(水) 13:05:11.17 とりあえずGPGPU普及させたいならGPU各社ともミドルレンジ以下でFP64対応切るのやめてくんないかな
性能出るかどうかより使えたり使えなかったりってのが一番困る
性能出るかどうかより使えたり使えなかったりってのが一番困る
696デフォルトの名無しさん
2013/06/05(水) 08:17:39.89 OpenCLのチューニングって、まずどのあたりから手を付ければいいかな?
ワークグループ分割数で結構変わるという話は聞くけど、やっぱり
おまかせより明示的に指定した方がいいんだろうか?
ワークグループ分割数で結構変わるという話は聞くけど、やっぱり
おまかせより明示的に指定した方がいいんだろうか?
697デフォルトの名無しさん
2013/06/05(水) 09:35:33.06 おまかせとかやる気無さすぎだろう…
色々変えてみて速さを測れ。
色々変えてみて速さを測れ。
698デフォルトの名無しさん
2013/06/05(水) 20:55:53.52 ハードに合わせて適当な値を選んでくれると思ってたんで自分で下手な値を設定するより
いいかと思ってたんだけど、たしかに明示的に指定した方がよくなるケースが多いですね。
目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか?
それ以外、これは押さえておけ、というようなチューニングポイントってありますか?
いいかと思ってたんだけど、たしかに明示的に指定した方がよくなるケースが多いですね。
目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか?
それ以外、これは押さえておけ、というようなチューニングポイントってありますか?
699デフォルトの名無しさん
2013/06/06(木) 22:37:43.71 アドレスモードが便利そうなのでイメージオブジェクトを使ってみようと思ったんだけど、
これって4ch固定なんですかね?できれば1chで使いたいんだけど。
これって4ch固定なんですかね?できれば1chで使いたいんだけど。
700デフォルトの名無しさん
2013/06/17(月) 09:44:11.96!701デフォルトの名無しさん
2013/06/18(火) 23:31:21.64 つか、勉強目的でエミュレータみたいなのが欲しい
遅くていいから
遅くていいから
702デフォルトの名無しさん
2013/06/24(月) 22:41:41.16 最近のハードなら何でも出来るだろ。
新しいの買えよ。それぐらい自己投資だ。
新しいの買えよ。それぐらい自己投資だ。
703デフォルトの名無しさん
2013/07/23(火) NY:AN:NY.AN ついに 2.0 で Dynamic Parallelism きちゃったじゃねぇか!
704デフォルトの名無しさん
2013/07/23(火) NY:AN:NY.AN nVidiaがいまだに1.1なのはどうにかならんのかな。
705デフォルトの名無しさん
2013/07/24(水) NY:AN:NY.AN CUDAがあるから、あまり積極的にやりたくないんじゃね?
706デフォルトの名無しさん
2013/08/01(木) NY:AN:NY.AN 今AMDの環境で開発しているんだけど、NVIDIAの環境でもビルドできるよう
1.1の機能に限定することってできないんですかね?
CL_USE_DEPRECATED_OPENCL_1_1_APISみたいな。
1.1の機能に限定することってできないんですかね?
CL_USE_DEPRECATED_OPENCL_1_1_APISみたいな。
707デフォルトの名無しさん
2013/08/18(日) NY:AN:NY.AN OpenGLとの連携やっている人いますか?
OpenGLのHGLRCからcl_device_idを得るのにclGetGLContextInfoKHRというのが
ありますが、これを呼ぶ際、properties引数にCL_CONTEXT_PLATFORMを含めないと
エラー(CL_INVALID_PLATFORM)になります。
Platformを決め打ちで入れてやれば成功はしますが、cl_device_idを得る前にそれが
含まれるcl_platform_idを本来どうやって求めるのでしょうか?
OpenGLのHGLRCからcl_device_idを得るのにclGetGLContextInfoKHRというのが
ありますが、これを呼ぶ際、properties引数にCL_CONTEXT_PLATFORMを含めないと
エラー(CL_INVALID_PLATFORM)になります。
Platformを決め打ちで入れてやれば成功はしますが、cl_device_idを得る前にそれが
含まれるcl_platform_idを本来どうやって求めるのでしょうか?
708デフォルトの名無しさん
2013/08/18(日) NY:AN:NY.AN >>707
clCreateContext に渡した properties と同じもので GL context を1つに特定できるものを渡せって書いてあるだろうに
clGetGLContextInfoKHR で指定せずにエラーになるなら clCreateContext ではデフォルト値以外の cl_platform_id を指定したんだろう
gl_sharing が有効な CL context は作成済みなのになんで cl_platform_id だけ行方不明なんだよ
余所のライブラリが作った CL context に問い合わせたいなら clGetContextInfo で CL_CONTEXT_PROPERTIES
clCreateContext に渡した properties と同じもので GL context を1つに特定できるものを渡せって書いてあるだろうに
clGetGLContextInfoKHR で指定せずにエラーになるなら clCreateContext ではデフォルト値以外の cl_platform_id を指定したんだろう
gl_sharing が有効な CL context は作成済みなのになんで cl_platform_id だけ行方不明なんだよ
余所のライブラリが作った CL context に問い合わせたいなら clGetContextInfo で CL_CONTEXT_PROPERTIES
709デフォルトの名無しさん
2013/08/18(日) NY:AN:NY.AN 回答ありがとうございます。
ただ、clCreateContextはclGetGLContextInfoKHRでデバイスを得た後に呼ぶことに
なると思うのですが?
手順は以下で間違ってますかね?
GLコンテキスト(HGLRC)作成
→clGetGLContextInfoKHRで関連付けられているCLデバイスを取得
→clCreateContextでCLコンテキストを作成
いずれにしても、どのデバイスを使っているかがわからないとプラットフォームも
決まらないと思うのですが。
ただ、clCreateContextはclGetGLContextInfoKHRでデバイスを得た後に呼ぶことに
なると思うのですが?
手順は以下で間違ってますかね?
GLコンテキスト(HGLRC)作成
→clGetGLContextInfoKHRで関連付けられているCLデバイスを取得
→clCreateContextでCLコンテキストを作成
いずれにしても、どのデバイスを使っているかがわからないとプラットフォームも
決まらないと思うのですが。
710デフォルトの名無しさん
2013/10/24(木) 01:02:02.86 vloadn ってあるけど、直接ポインタを p[i] するのと速度違ったりするのか?
711デフォルトの名無しさん
2013/10/24(木) 21:28:52.21 vloadはアラインメントの制約がゆるい。要素でそろってればOK。
速度は実装によるだろうけど同じか制約がゆるいvloadのほうが少し遅い。
速度は実装によるだろうけど同じか制約がゆるいvloadのほうが少し遅い。
712デフォルトの名無しさん
2013/10/24(木) 22:48:45.60 なるほど。
アラインメントの制約のせいで、ちょっと冗長になってたあのコードとかを小さく綺麗に書き直せるかも。
これは良いことを知った。サンクス。
アラインメントの制約のせいで、ちょっと冗長になってたあのコードとかを小さく綺麗に書き直せるかも。
これは良いことを知った。サンクス。
713デフォルトの名無しさん
2013/11/22(金) 19:43:38.99 Khronos Groupが「OpenCL 2.0」を完成、コンピュータビジョン向け「OpenVX 1.0」の暫定仕様も発表
http://sourceforge.jp/magazine/13/11/22/095200
https://www.khronos.org/news/press/khronos-releases-opencl-2.0
http://sourceforge.jp/magazine/13/11/22/095200
https://www.khronos.org/news/press/khronos-releases-opencl-2.0
714デフォルトの名無しさん
2013/11/22(金) 19:46:35.85 タラタラ完成してんじゃねーよ
715デフォルトの名無しさん
2013/11/22(金) 20:47:48.41 OpenVXってのが気になる
716デフォルトの名無しさん
2013/11/25(月) 08:28:25.60 JOCLも、早く OpenCL 2.0 に対応しろよ
717デフォルトの名無しさん
2013/11/30(土) 20:57:20.27 OpenCLって初期化とかやたら面倒なんですが、
OpenGL に対する glfw や GLUT みたいなライブラリはないんですか?
勉強してみたい(というか、勉強しかけた)のですが、
計算処理を楽しむ前に挫折しそうです。
OpenGL に対する glfw や GLUT みたいなライブラリはないんですか?
勉強してみたい(というか、勉強しかけた)のですが、
計算処理を楽しむ前に挫折しそうです。
718デフォルトの名無しさん
2013/11/30(土) 21:26:47.63 あるけどない
独自API、英語のみのマニュアル…
初期化なんて一度書けば使い回しだからとりあえずやってみるべき
独自API、英語のみのマニュアル…
初期化なんて一度書けば使い回しだからとりあえずやってみるべき
719デフォルトの名無しさん
2013/11/30(土) 22:18:44.90 マニュアルが英語なのは全く問題ないので紹介していただけないでしょうか。
それでも枝葉末節の部分が面倒であれば、今はそういうものだと諦め、
コピペで使い回してかんばります。
ただ、私はたとえば OpenGL 入門者に対して、同じ理由
つまり「初期化なんて一度書けば使い回しだから」という理由で
ウィンドウ作らせたり、レンダリングコンテキストを作らせたりはしたくないです。
使い回し
幸い OpenGL にはユーティリティライブラリがあり、入門者にはありがたいです。
なので OpenCL にも入門者用にきっと何かあるだろうと思っていました。
それでも枝葉末節の部分が面倒であれば、今はそういうものだと諦め、
コピペで使い回してかんばります。
ただ、私はたとえば OpenGL 入門者に対して、同じ理由
つまり「初期化なんて一度書けば使い回しだから」という理由で
ウィンドウ作らせたり、レンダリングコンテキストを作らせたりはしたくないです。
使い回し
幸い OpenGL にはユーティリティライブラリがあり、入門者にはありがたいです。
なので OpenCL にも入門者用にきっと何かあるだろうと思っていました。
720デフォルトの名無しさん
2013/11/30(土) 22:34:05.19 OpenGL ほど広く使われていたらあっただろうね。
721デフォルトの名無しさん
2013/11/30(土) 22:53:53.35 NVIDIAやAMDのサンプルコードには簡単なユーティリティが入っているよ。
OpenGLみたいに糞面倒なわけじゃないから、わざわざGLUTみたいなものを
作ろうと思った人はいなかったんだろう。
OpenGLみたいに糞面倒なわけじゃないから、わざわざGLUTみたいなものを
作ろうと思った人はいなかったんだろう。
722デフォルトの名無しさん
2013/12/01(日) 02:54:53.01 そんなに面倒か?
必要十分しかないと思うんだが
必要十分しかないと思うんだが
723デフォルトの名無しさん
2013/12/01(日) 03:12:45.40 CUDAの簡単さと比較すると面倒
724デフォルトの名無しさん
2013/12/01(日) 03:18:23.16 あほか
725デフォルトの名無しさん
2013/12/01(日) 03:47:08.42 c++binding使えば簡単じゃないか。
まあ、プラットフォーム選択する時点で
cudaには必要ない工程だが
まあ、プラットフォーム選択する時点で
cudaには必要ない工程だが
726デフォルトの名無しさん
2013/12/01(日) 07:35:28.28 >>719
intelが最近OpenCLライブラリやGPU向けライブラリのプレビュー版を発表してる
ttp://software.intel.com/en-us/intel-ipp-preview
IPPはこれまで最適化済みCPUライブラリだったけど、それをGPUにも拡張しようとしてる模様
intelが最近OpenCLライブラリやGPU向けライブラリのプレビュー版を発表してる
ttp://software.intel.com/en-us/intel-ipp-preview
IPPはこれまで最適化済みCPUライブラリだったけど、それをGPUにも拡張しようとしてる模様
727デフォルトの名無しさん
2013/12/03(火) 07:13:40.30728デフォルトの名無しさん
2013/12/03(火) 13:47:40.89 amd apu+linuxでaparapi経由で使ってみたんですが面白そうですね。
はるか昔に、javaで配列関係はどうしようかjniにでもしようかと悩んでたんですがこれでやっと悩みは解決できました。
java9.stream.parallelがopenclに対応してaparapiも不要になる(jvmと結合する)ようなので、openclを使えばjavaのままで配列のソリューションが得られるようです。
まだ触って4日ぐらいですが勉強がてらに、行列などの配列依存のライブラリを書き直してみようと思います。
はるか昔に、javaで配列関係はどうしようかjniにでもしようかと悩んでたんですがこれでやっと悩みは解決できました。
java9.stream.parallelがopenclに対応してaparapiも不要になる(jvmと結合する)ようなので、openclを使えばjavaのままで配列のソリューションが得られるようです。
まだ触って4日ぐらいですが勉強がてらに、行列などの配列依存のライブラリを書き直してみようと思います。
729デフォルトの名無しさん
2013/12/30(月) 11:40:26.21 kaveriが販売される模様
730デフォルトの名無しさん
2014/01/11(土) 01:38:48.46 >>717
software.intel.com/en-us/vcsource/tools/opencl-sdk/clu-api
CLUとか
github.com/Computing-Language-Utility/CLU/blob/master/simple/simple.c
このぐらいに書ける。
使ったことはないので便利かどうかは知らない。
software.intel.com/en-us/vcsource/tools/opencl-sdk/clu-api
CLUとか
github.com/Computing-Language-Utility/CLU/blob/master/simple/simple.c
このぐらいに書ける。
使ったことはないので便利かどうかは知らない。
731デフォルトの名無しさん
2014/02/24(月) 15:19:36.59 Core iとグラボつんでグラボで画面表示しててもIntelHDでOpenCLの計算をさせることはできるのでしょうか
732デフォルトの名無しさん
2014/02/24(月) 16:36:29.14 遅くはなろうが計算は出来るでしょう
733デフォルトの名無しさん
2014/02/24(月) 17:04:11.19 あれ?遅くなる要因あるのでしょうか
使ってないIntelHDも使いたいというイメージだったのですが
使ってないIntelHDも使いたいというイメージだったのですが
734デフォルトの名無しさん
2014/02/24(月) 18:04:09.93 CPUでやったほうが速いってだけ
735デフォルトの名無しさん
2014/02/24(月) 18:14:29.38 CPUスレッドとは排他でしか使えないと言うことですか?
736デフォルトの名無しさん
2014/02/24(月) 18:17:43.70 732だけど、単純にIntelHDをグラボと取り違えただけだよ
737デフォルトの名無しさん
2014/02/24(月) 18:34:07.15 了解です
738デフォルトの名無しさん
2014/03/23(日) 07:57:03.89ID:2/mKAdk3 Ubuntu用のSDKはDebian GNU/Linuxで使えますか?
739デフォルトの名無しさん
2014/03/24(月) 20:46:02.33ID:+qxUA/lQ >>733
俺も今日勉強始めたばっかだから実態よく分からんが、
規格ミニマムだとGPUで実行するバイナリを、
プログラム実行時に動的にコンパイルしてマウントする場合があるらしく、
それだとコンパイルのオーバーヘッドで遅くなりそう。
実行時にコンパイルせず事前にコンパイルしたバイナリを使うこともできるそうで
NVidia, AMDあたりはLLVMで動いてるからまず大丈夫だろうけど、HD Graphicsはどうなるんだろうか?
俺も今日勉強始めたばっかだから実態よく分からんが、
規格ミニマムだとGPUで実行するバイナリを、
プログラム実行時に動的にコンパイルしてマウントする場合があるらしく、
それだとコンパイルのオーバーヘッドで遅くなりそう。
実行時にコンパイルせず事前にコンパイルしたバイナリを使うこともできるそうで
NVidia, AMDあたりはLLVMで動いてるからまず大丈夫だろうけど、HD Graphicsはどうなるんだろうか?
740デフォルトの名無しさん
2014/04/04(金) 10:41:37.63ID:YtPgho8U CentOSにAMDのドライバを入れることに成功したけど、Debianには入らなかった。
741デフォルトの名無しさん
2014/04/23(水) 21:27:46.80ID:Xxk46iNW 質問スレってないかな?
Debian testing 64bit環境でbeignet 0.80をインストールしてclinfoしたら
GPU一個しか積んでないはずなのにPlatformが2個検出されるのですよ
これって正常なの?
Debian testing 64bit環境でbeignet 0.80をインストールしてclinfoしたら
GPU一個しか積んでないはずなのにPlatformが2個検出されるのですよ
これって正常なの?
742デフォルトの名無しさん
2014/04/23(水) 21:53:33.92ID:e3QPM/2Y GPU持ってるCPUを使っているとか?
743741
2014/04/23(水) 22:38:07.40ID:Xxk46iNW はい、haswell(i7-4771)を使っています。
その他のグラフィックボードは積んでいません
その他のグラフィックボードは積んでいません
744デフォルトの名無しさん
2014/04/23(水) 23:16:57.80ID:RpkkzUGi Platformの数とデバイスの数はイコールじゃない。
デバイスはCPUとGPUの2個見つかるはず。ちなみに内蔵かどうかは関係ない。
気になるならclGetPlatformIDs/clGetPlatformInfoで見てみりゃいい。
デバイスはCPUとGPUの2個見つかるはず。ちなみに内蔵かどうかは関係ない。
気になるならclGetPlatformIDs/clGetPlatformInfoで見てみりゃいい。
745741
2014/04/23(水) 23:39:22.71ID:Xxk46iNW はしょって書くと以下のように2回出力、Platform IDが一緒でプログラムなどでcl::Platform::getをすると
2個で返ってきます。(DeviceはALLで情報をとってもGPUしか返ってきません。CPUでDeviceをとろうとするとエラーが出ます)
Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0
Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0
2個で返ってきます。(DeviceはALLで情報をとってもGPUしか返ってきません。CPUでDeviceをとろうとするとエラーが出ます)
Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0
Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0
746デフォルトの名無しさん
2014/04/23(水) 23:55:44.68ID:TUgA9FPl Platform数はドライバの数
汎用のドライバとIntelチューンのドライバの2つが入っていたら2つのプラットフォームが出てくる
少なくともWindowsだとそんな感じ
あと745の結果でPlatformIDが同じなのはおかしい
多分745のプログラムはバグってる
汎用のドライバとIntelチューンのドライバの2つが入っていたら2つのプラットフォームが出てくる
少なくともWindowsだとそんな感じ
あと745の結果でPlatformIDが同じなのはおかしい
多分745のプログラムはバグってる
747741
2014/04/24(木) 00:06:20.94ID:T0adDPXi ドライバの数ですか・・・Debianのパッケージを入れる時にたしかに
汎用ローダとか言うのとintelドライバを入れた記憶があります
それで2つ出ているのか、入れたのは以下のパッケージだったような
opencl-headers - OpenCL (Open Computing Language) header files
beignet - Intel OpenCL library
beignet-dev - Intel OpenCL library
ocl-icd-dev - Development files to build a ICD Loader
ocl-icd-libopencl1 - Generic OpenCL ICD Loader
clinfo - Query OpenCL system information
汎用ローダとか言うのとintelドライバを入れた記憶があります
それで2つ出ているのか、入れたのは以下のパッケージだったような
opencl-headers - OpenCL (Open Computing Language) header files
beignet - Intel OpenCL library
beignet-dev - Intel OpenCL library
ocl-icd-dev - Development files to build a ICD Loader
ocl-icd-libopencl1 - Generic OpenCL ICD Loader
clinfo - Query OpenCL system information
748デフォルトの名無しさん
2014/06/26(木) 07:45:11.00ID:DsGyZECt749デフォルトの名無しさん
2014/06/26(木) 08:39:51.72ID:rajeiAxv デフォルトのコンテキストやキューが追加されたのはOpenCL1.2からだから
NVIDIAじゃ使えないことに注意な。
NVIDIAじゃ使えないことに注意な。
750デフォルトの名無しさん
2014/06/26(木) 12:05:53.66ID:u/fLSVr/ >>748
// OpenCL側に結果を書き込む領域を作成する
const size_t
length = 0x10;
cl::Buffer
array( CL_MEM_READ_ONLY, length * sizeof( float ) );
( ´,_ゝ`)
// OpenCL側に結果を書き込む領域を作成する
const size_t
length = 0x10;
cl::Buffer
array( CL_MEM_READ_ONLY, length * sizeof( float ) );
( ´,_ゝ`)
751デフォルトの名無しさん
2014/06/26(木) 22:35:19.78ID:BVAAIzQv >>750
答えといてやれよ。
答えといてやれよ。
752デフォルトの名無しさん
2014/08/29(金) 13:36:44.60ID:P9znXDYB AMDとMS,GPU演算用途向けのコンパイラ「C++ AMP v1.2」を発表
http://www.4gamer.net/games/032/G003263/20140828031/
C++ AMP v1.2は、C++開発者が広範なハードウェア構成および
ソフトウェア構成でアプリケーションを高速化できるよう、
以下の3つのアウトプットをサポートしています。
・Khronos GroupのOpenCL:AMD CPU/APU/GPU、Intel CPU/APU、NVIDIA GPU、Apple Mac OS X、その他のOpenCLに準拠したプラットフォームをサポート
・Khronos GroupのSPIR:AMD CPU/APU/GPU、Intel CPU/APU、将来的なSPIRに準拠したプラットフォームをサポート
:HSA FoundationのHSAIL:AMD APU、将来的なヘテロジニアス・システム・アーキテクチャー(HSA)に準拠したプラットフォームをサポート
http://www.4gamer.net/games/032/G003263/20140828031/
C++ AMP v1.2は、C++開発者が広範なハードウェア構成および
ソフトウェア構成でアプリケーションを高速化できるよう、
以下の3つのアウトプットをサポートしています。
・Khronos GroupのOpenCL:AMD CPU/APU/GPU、Intel CPU/APU、NVIDIA GPU、Apple Mac OS X、その他のOpenCLに準拠したプラットフォームをサポート
・Khronos GroupのSPIR:AMD CPU/APU/GPU、Intel CPU/APU、将来的なSPIRに準拠したプラットフォームをサポート
:HSA FoundationのHSAIL:AMD APU、将来的なヘテロジニアス・システム・アーキテクチャー(HSA)に準拠したプラットフォームをサポート
753デフォルトの名無しさん
2014/08/30(土) 20:21:59.78ID:rOGhcjm5 ム板はしょっちゅう落ちるな。
754デフォルトの名無しさん
2014/08/30(土) 20:24:50.83ID:nZ1XDijW よく落ちるな‥
755デフォルトの名無しさん
2014/09/19(金) 08:34:07.91ID:KzrQAxPc OpenCL 1.2が現在のstableになるのかな?
1.1だとOpenCVは動かないですね
1.1だとOpenCVは動かないですね
756デフォルトの名無しさん
2014/09/19(金) 23:42:34.05ID:dfKMMaQo NVIDIAが1.2に対応しないからうちは1.1縛りだな。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。
757デフォルトの名無しさん
2014/10/15(水) 00:45:43.10ID:bIoSVMWH VBAで使いたいのですが、ラッパーDLL何か
ご存知ないでしょうか?
C#用のは幾つか見つかるのですが…
ご存知ないでしょうか?
C#用のは幾つか見つかるのですが…
758デフォルトの名無しさん
2014/10/15(水) 01:04:21.97ID:bIoSVMWH 質問あげ m(_ _)m
759デフォルトの名無しさん
2014/10/15(水) 10:11:05.56ID:3rwOGNYw760デフォルトの名無しさん
2014/10/15(水) 10:36:01.03ID:bIoSVMWH >>759
そうなんですけど、既にあるならそれ使いたいなと。
いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ?とか
DLL作ったことないのでチョット途方に暮れてます…
(シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…)
そうなんですけど、既にあるならそれ使いたいなと。
いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ?とか
DLL作ったことないのでチョット途方に暮れてます…
(シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…)
761デフォルトの名無しさん
2014/10/15(水) 19:03:22.75ID:oTkKZ4Eq 既にあるもので使い方覚えるより
自分で造った方が早い場合も多い
自分で造った方が早い場合も多い
762デフォルトの名無しさん
2014/10/15(水) 22:49:10.60ID:y41AVgB1 口だけ番長
763757
2014/10/16(木) 00:06:46.03ID:1e+5gfAa >>761
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの?ディクショナリ?ってとこで
早速つまづいてしまいました(;_;)
なので、VBAでラッパー作ろうかと迷走中…
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの?ディクショナリ?ってとこで
早速つまづいてしまいました(;_;)
なので、VBAでラッパー作ろうかと迷走中…
764デフォルトの名無しさん
2014/10/16(木) 00:45:29.59ID:925HRnD9 別に何しようと勝手だけど
VBAでOpenCL使う必要性って何?
非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし
VBAでOpenCL使う必要性って何?
非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし
765デフォルトの名無しさん
2014/10/16(木) 15:24:45.15ID:7O3aHiya そもそもVBAに固執してる時点で視野狭窄。
766757
2014/10/16(木) 17:11:21.81ID:8j84DcHT 固執?( ´????×????` ) プッ
767757
2014/10/16(木) 17:12:09.70ID:8j84DcHT ありゃw
768デフォルトの名無しさん
2014/10/17(金) 13:05:53.28ID:npcZf8Up あらあら可哀想なひとでしたか。
769デフォルトの名無しさん
2014/10/17(金) 16:09:50.28ID:aw+RiOqr こんなところにもシナが湧くようになったか
770デフォルトの名無しさん
2014/10/18(土) 01:23:16.18ID:sx5ESDLm そもそもそんな方法よりこうした方が・・とか
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない?
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか?
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない?
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか?
771デフォルトの名無しさん
2014/10/18(土) 13:19:15.72ID:Z3gRebWt 余計なお世話だと感じたらスルーすればいいだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ
772デフォルトの名無しさん
2014/10/18(土) 15:49:20.82ID:mzkaImX0 >>770
あんた公務員やな
あんた公務員やな
773デフォルトの名無しさん
2014/10/18(土) 19:40:45.23ID:P/Strs7V 余計な世話しなきゃいい
774デフォルトの名無しさん
2014/10/19(日) 02:01:55.89ID:CeuU+CpH まあ、余計なお世話なやつは
わかってない(解決策はわからない)
ってことだから
解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと
わかってない(解決策はわからない)
ってことだから
解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと
775デフォルトの名無しさん
2015/01/12(月) 09:09:09.30ID:BHqm0X8b OpenCLとCUDAの相互運用について情報を探していたらCUDAカーネルを
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ?
http://www.4gamer.net/games/032/G003263/20091104040/
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ?
http://www.4gamer.net/games/032/G003263/20091104040/
776デフォルトの名無しさん
2015/02/04(水) 08:37:05.19ID:PgjHlyod いままでコンスタントに500[ms]程度でkernel処理が終わってたのが、
1分以上kernel処理が終了しない異常が、
処理2回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか?
1分以上kernel処理が終了しない異常が、
処理2回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか?
777デフォルトの名無しさん
2015/02/04(水) 11:47:15.88ID:kErMECZ6 windows update
778デフォルトの名無しさん
2015/02/08(日) 04:16:42.58ID:4RF7kRSx モバイルだと、GPU性能とCPU性能あんま大差ないからな。CPUだと4コアでNEON使えば最大性能で60GFLOPSぐらい?最新のTegraX1とかだと300GFLOPSオーバーするかもしれんが
現行のAdreno330ぐらいだと150GFLOPSくらい?
現行のAdreno330ぐらいだと150GFLOPSくらい?
779デフォルトの名無しさん
2015/02/08(日) 04:19:43.86ID:4RF7kRSx だからNEONのコードをわざわざ書き直す必要まだないかな?メモリアクセスのほうがボトルネックになってるっぽいのもあるし。まぁ、CPUとGPU実行じゃ消費電力ちがうかもしれんが。
780デフォルトの名無しさん
2015/02/15(日) 00:22:26.32ID:rqZ8R7KU 個人的にはこの言語産廃な気がするけどどうなんだろう
手続きの多さはさすがにちょっと…
CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ(最良)
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ(次善)
OpenCL←やめて
手続きの多さはさすがにちょっと…
CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ(最良)
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ(次善)
OpenCL←やめて
781デフォルトの名無しさん
2015/02/15(日) 10:01:14.87ID:MuMGrz7U OpenCLはハード非依存のGPGPUプラットフォームとして用意され、
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。
782デフォルトの名無しさん
2015/02/15(日) 12:56:46.74ID:TTUR8i8s OpenCLはDSPとかFPGAとかGPU以外もターゲットに入っているから
下手に統合しない方がいいと思う
下手に統合しない方がいいと思う
783デフォルトの名無しさん
2015/02/15(日) 20:42:11.90ID:aU4fh9i9 とか言いながら、触ればわかるが単なるCUDAの焼き直しなんだよな、これ
784デフォルトの名無しさん
2015/02/15(日) 21:52:13.56ID:DwKzmQqr nvidiaのquadro K620Mか
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ
785デフォルトの名無しさん
2015/02/15(日) 22:09:31.75ID:SQuQNCw8■ このスレッドは過去ログ倉庫に格納されています
ニュース
- れいわ議員「母親はね、子どもを戦争に行かせるために産んだんじゃないんだよ」 高市総理に“10秒回答”迫り、残り5分は“独壇場”★2 [♪♪♪★]
- 男女2人死亡の赤坂・個室サウナ火災、非常ボタン押された形跡…従業員は煙感知の報知機で気づく [蚤の市★]
- 中国国防省が再反論 SNSで公開した音声とは“別の通報”で日本に訓練の時間や海域を通報したと主張★3 [夜のけいちゃん★]
- 【東京】赤坂サウナ火事2人死亡 サウナ室のドアノブ外れ閉じ込められた可能性 ★7 [nita★]
- BreakingDown選手がくも膜下出血、瓜田純士、平手打ちを行った江口響は「もう格闘技も辞めます。責任取りたいです』とまで言ってきてる」 [muffin★]
- 資さんうどんが「PayPay」の取り扱いを停止 他のキャッシュレス決済は引き続き利用可能 [少考さん★]
- 【速報】高市早苗、文春砲wwwwwwwwwwwwwwwwwwwwwwwwwwwww [339035499]
- 【悲報】アメリカ株、今日もあかん…
- 現役JKのお茶会スレ( ¨̮ )︎︎𖠚ᐝ184
- サウナ火災焼死事件、死亡した夫婦は非常ボタンを押すも扉は開かず蒸し焼きに [963243619]
- 【実況】博衣こよりのえちえちダンガンロンパ6🧪
- 従兄弟を自殺させたんだけど
