さてついにOpenCLの仕様が公開されました。
http://www.khronos.org/opencl/
公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。
探検
OpenCLプログラミング#1
■ このスレッドは過去ログ倉庫に格納されています
1a36 ◆K0BqlCB3.k
2008/12/10(水) 15:38:25749デフォルトの名無しさん
2014/06/26(木) 08:39:51.72ID:rajeiAxv デフォルトのコンテキストやキューが追加されたのはOpenCL1.2からだから
NVIDIAじゃ使えないことに注意な。
NVIDIAじゃ使えないことに注意な。
750デフォルトの名無しさん
2014/06/26(木) 12:05:53.66ID:u/fLSVr/ >>748
// OpenCL側に結果を書き込む領域を作成する
const size_t
length = 0x10;
cl::Buffer
array( CL_MEM_READ_ONLY, length * sizeof( float ) );
( ´,_ゝ`)
// OpenCL側に結果を書き込む領域を作成する
const size_t
length = 0x10;
cl::Buffer
array( CL_MEM_READ_ONLY, length * sizeof( float ) );
( ´,_ゝ`)
751デフォルトの名無しさん
2014/06/26(木) 22:35:19.78ID:BVAAIzQv >>750
答えといてやれよ。
答えといてやれよ。
752デフォルトの名無しさん
2014/08/29(金) 13:36:44.60ID:P9znXDYB AMDとMS,GPU演算用途向けのコンパイラ「C++ AMP v1.2」を発表
http://www.4gamer.net/games/032/G003263/20140828031/
C++ AMP v1.2は、C++開発者が広範なハードウェア構成および
ソフトウェア構成でアプリケーションを高速化できるよう、
以下の3つのアウトプットをサポートしています。
・Khronos GroupのOpenCL:AMD CPU/APU/GPU、Intel CPU/APU、NVIDIA GPU、Apple Mac OS X、その他のOpenCLに準拠したプラットフォームをサポート
・Khronos GroupのSPIR:AMD CPU/APU/GPU、Intel CPU/APU、将来的なSPIRに準拠したプラットフォームをサポート
:HSA FoundationのHSAIL:AMD APU、将来的なヘテロジニアス・システム・アーキテクチャー(HSA)に準拠したプラットフォームをサポート
http://www.4gamer.net/games/032/G003263/20140828031/
C++ AMP v1.2は、C++開発者が広範なハードウェア構成および
ソフトウェア構成でアプリケーションを高速化できるよう、
以下の3つのアウトプットをサポートしています。
・Khronos GroupのOpenCL:AMD CPU/APU/GPU、Intel CPU/APU、NVIDIA GPU、Apple Mac OS X、その他のOpenCLに準拠したプラットフォームをサポート
・Khronos GroupのSPIR:AMD CPU/APU/GPU、Intel CPU/APU、将来的なSPIRに準拠したプラットフォームをサポート
:HSA FoundationのHSAIL:AMD APU、将来的なヘテロジニアス・システム・アーキテクチャー(HSA)に準拠したプラットフォームをサポート
753デフォルトの名無しさん
2014/08/30(土) 20:21:59.78ID:rOGhcjm5 ム板はしょっちゅう落ちるな。
754デフォルトの名無しさん
2014/08/30(土) 20:24:50.83ID:nZ1XDijW よく落ちるな‥
755デフォルトの名無しさん
2014/09/19(金) 08:34:07.91ID:KzrQAxPc OpenCL 1.2が現在のstableになるのかな?
1.1だとOpenCVは動かないですね
1.1だとOpenCVは動かないですね
756デフォルトの名無しさん
2014/09/19(金) 23:42:34.05ID:dfKMMaQo NVIDIAが1.2に対応しないからうちは1.1縛りだな。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。
757デフォルトの名無しさん
2014/10/15(水) 00:45:43.10ID:bIoSVMWH VBAで使いたいのですが、ラッパーDLL何か
ご存知ないでしょうか?
C#用のは幾つか見つかるのですが…
ご存知ないでしょうか?
C#用のは幾つか見つかるのですが…
758デフォルトの名無しさん
2014/10/15(水) 01:04:21.97ID:bIoSVMWH 質問あげ m(_ _)m
759デフォルトの名無しさん
2014/10/15(水) 10:11:05.56ID:3rwOGNYw760デフォルトの名無しさん
2014/10/15(水) 10:36:01.03ID:bIoSVMWH >>759
そうなんですけど、既にあるならそれ使いたいなと。
いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ?とか
DLL作ったことないのでチョット途方に暮れてます…
(シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…)
そうなんですけど、既にあるならそれ使いたいなと。
いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ?とか
DLL作ったことないのでチョット途方に暮れてます…
(シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…)
761デフォルトの名無しさん
2014/10/15(水) 19:03:22.75ID:oTkKZ4Eq 既にあるもので使い方覚えるより
自分で造った方が早い場合も多い
自分で造った方が早い場合も多い
762デフォルトの名無しさん
2014/10/15(水) 22:49:10.60ID:y41AVgB1 口だけ番長
763757
2014/10/16(木) 00:06:46.03ID:1e+5gfAa >>761
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの?ディクショナリ?ってとこで
早速つまづいてしまいました(;_;)
なので、VBAでラッパー作ろうかと迷走中…
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの?ディクショナリ?ってとこで
早速つまづいてしまいました(;_;)
なので、VBAでラッパー作ろうかと迷走中…
764デフォルトの名無しさん
2014/10/16(木) 00:45:29.59ID:925HRnD9 別に何しようと勝手だけど
VBAでOpenCL使う必要性って何?
非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし
VBAでOpenCL使う必要性って何?
非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし
765デフォルトの名無しさん
2014/10/16(木) 15:24:45.15ID:7O3aHiya そもそもVBAに固執してる時点で視野狭窄。
766757
2014/10/16(木) 17:11:21.81ID:8j84DcHT 固執?( ´????×????` ) プッ
767757
2014/10/16(木) 17:12:09.70ID:8j84DcHT ありゃw
768デフォルトの名無しさん
2014/10/17(金) 13:05:53.28ID:npcZf8Up あらあら可哀想なひとでしたか。
769デフォルトの名無しさん
2014/10/17(金) 16:09:50.28ID:aw+RiOqr こんなところにもシナが湧くようになったか
770デフォルトの名無しさん
2014/10/18(土) 01:23:16.18ID:sx5ESDLm そもそもそんな方法よりこうした方が・・とか
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない?
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか?
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない?
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか?
771デフォルトの名無しさん
2014/10/18(土) 13:19:15.72ID:Z3gRebWt 余計なお世話だと感じたらスルーすればいいだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ
772デフォルトの名無しさん
2014/10/18(土) 15:49:20.82ID:mzkaImX0 >>770
あんた公務員やな
あんた公務員やな
773デフォルトの名無しさん
2014/10/18(土) 19:40:45.23ID:P/Strs7V 余計な世話しなきゃいい
774デフォルトの名無しさん
2014/10/19(日) 02:01:55.89ID:CeuU+CpH まあ、余計なお世話なやつは
わかってない(解決策はわからない)
ってことだから
解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと
わかってない(解決策はわからない)
ってことだから
解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと
775デフォルトの名無しさん
2015/01/12(月) 09:09:09.30ID:BHqm0X8b OpenCLとCUDAの相互運用について情報を探していたらCUDAカーネルを
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ?
http://www.4gamer.net/games/032/G003263/20091104040/
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ?
http://www.4gamer.net/games/032/G003263/20091104040/
776デフォルトの名無しさん
2015/02/04(水) 08:37:05.19ID:PgjHlyod いままでコンスタントに500[ms]程度でkernel処理が終わってたのが、
1分以上kernel処理が終了しない異常が、
処理2回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか?
1分以上kernel処理が終了しない異常が、
処理2回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか?
777デフォルトの名無しさん
2015/02/04(水) 11:47:15.88ID:kErMECZ6 windows update
778デフォルトの名無しさん
2015/02/08(日) 04:16:42.58ID:4RF7kRSx モバイルだと、GPU性能とCPU性能あんま大差ないからな。CPUだと4コアでNEON使えば最大性能で60GFLOPSぐらい?最新のTegraX1とかだと300GFLOPSオーバーするかもしれんが
現行のAdreno330ぐらいだと150GFLOPSくらい?
現行のAdreno330ぐらいだと150GFLOPSくらい?
779デフォルトの名無しさん
2015/02/08(日) 04:19:43.86ID:4RF7kRSx だからNEONのコードをわざわざ書き直す必要まだないかな?メモリアクセスのほうがボトルネックになってるっぽいのもあるし。まぁ、CPUとGPU実行じゃ消費電力ちがうかもしれんが。
780デフォルトの名無しさん
2015/02/15(日) 00:22:26.32ID:rqZ8R7KU 個人的にはこの言語産廃な気がするけどどうなんだろう
手続きの多さはさすがにちょっと…
CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ(最良)
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ(次善)
OpenCL←やめて
手続きの多さはさすがにちょっと…
CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ(最良)
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ(次善)
OpenCL←やめて
781デフォルトの名無しさん
2015/02/15(日) 10:01:14.87ID:MuMGrz7U OpenCLはハード非依存のGPGPUプラットフォームとして用意され、
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。
782デフォルトの名無しさん
2015/02/15(日) 12:56:46.74ID:TTUR8i8s OpenCLはDSPとかFPGAとかGPU以外もターゲットに入っているから
下手に統合しない方がいいと思う
下手に統合しない方がいいと思う
783デフォルトの名無しさん
2015/02/15(日) 20:42:11.90ID:aU4fh9i9 とか言いながら、触ればわかるが単なるCUDAの焼き直しなんだよな、これ
784デフォルトの名無しさん
2015/02/15(日) 21:52:13.56ID:DwKzmQqr nvidiaのquadro K620Mか
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ
785デフォルトの名無しさん
2015/02/15(日) 22:09:31.75ID:SQuQNCw8786デフォルトの名無しさん
2015/02/15(日) 22:20:29.24ID:DwKzmQqr >>785
ありがとうございます
ありがとうございます
787デフォルトの名無しさん
2015/02/15(日) 22:26:41.71ID:SSlwb3yD 実は正しくないコードが他の環境ではたまたま通っていただけ、てのはよくある。
たしかにIntelのコンパイラは厳しいから、普段の開発は他のGPUでやっていても
IntelのKernel Builderでカーネルのチェックしたりするな。
たしかにIntelのコンパイラは厳しいから、普段の開発は他のGPUでやっていても
IntelのKernel Builderでカーネルのチェックしたりするな。
788デフォルトの名無しさん
2015/02/16(月) 00:42:06.13ID:bUgXoWHZ789デフォルトの名無しさん
2015/02/16(月) 00:55:29.94ID:0cGz3jVB IntelはGlobalWorkingGroupとLocalWGのサイズがN倍じゃないと動かないんだけどAMDは変な比率でも動く
原因調べるのの時間かかったよ
原因調べるのの時間かかったよ
790デフォルトの名無しさん
2015/02/16(月) 02:05:22.57ID:bUgXoWHZ791デフォルトの名無しさん
2015/02/16(月) 07:56:11.60ID:F7oc1qZ/ >>785
同意
同意
792デフォルトの名無しさん
2015/02/16(月) 13:24:15.63ID:LR9r89r7 AMDのコンパイラも最適化オンにしたらコンパイル終わらなかった事あったので、結構怪しい。(2011年ぐらいの話だけど)
793デフォルトの名無しさん
2015/02/16(月) 13:44:20.54ID:bUgXoWHZ >>792
確かにAMDのコンパイラの最適化は完全に地雷だったw
確かにAMDのコンパイラの最適化は完全に地雷だったw
794デフォルトの名無しさん
2015/02/16(月) 21:40:57.33ID:HyfDl27x >>784
初心者がこれからOpenCLを始めるのにどの環境を選ぶか、という話なら
NVIDIAは避けるのが無難だな。デバッガやオフラインコンパイラなんかの
ツールが皆無に等しい。
CUDAもやりたいとかいうなら別だが。
初心者がこれからOpenCLを始めるのにどの環境を選ぶか、という話なら
NVIDIAは避けるのが無難だな。デバッガやオフラインコンパイラなんかの
ツールが皆無に等しい。
CUDAもやりたいとかいうなら別だが。
795デフォルトの名無しさん
2015/02/16(月) 22:38:07.54ID:QHeQ+cdL >>794
多くの奴はGPGPUするぞ、じゃメジャーなCUDAで良いやだからな
OpenCL使ってIntel,Nv,AMD(あとFPGAとか?)でちゃんと動くものを作らなければいけないってあんまりないだろからな
多くの奴はGPGPUするぞ、じゃメジャーなCUDAで良いやだからな
OpenCL使ってIntel,Nv,AMD(あとFPGAとか?)でちゃんと動くものを作らなければいけないってあんまりないだろからな
796デフォルトの名無しさん
2015/02/17(火) 02:24:50.68ID:xvdMpEI6 OpenCL使ったところで、同じコードでどんなCPU/GPUでも効率よく動くとかレアケースだしなぁ。
797デフォルトの名無しさん
2015/02/17(火) 08:22:15.68ID:fCIGE3+K 最高のパフォーマンスを引き出すチューニングというなら別だが、どれかGPUを想定した
コードならそこそこの速度で動くだろ。たいてい、従来のCPUより速けりゃ十分だろうし。
FPGAだけは別格で、GPUと同じコードじゃぜんぜん速度が出ないだろうが。
コードならそこそこの速度で動くだろ。たいてい、従来のCPUより速けりゃ十分だろうし。
FPGAだけは別格で、GPUと同じコードじゃぜんぜん速度が出ないだろうが。
798デフォルトの名無しさん
2015/02/18(水) 10:38:35.72ID:CGhwPhC5 SSEレジスタに乗ること期待して書いたchar16とかGPUに食わせたら憤死するで。
799デフォルトの名無しさん
2015/02/18(水) 16:12:46.20ID:pennC58Z アーキテクチャ毎に最適化しないと、
OpenCLで性能なんか出せないよ。
OpenCLで性能なんか出せないよ。
800デフォルトの名無しさん
2015/02/18(水) 22:51:48.89ID:Z2YWe05s >>798
ベクタ型は想定するターゲットで効果が見込まれる場合に使うべきで、そういう意味では
どっちかというとチューニングの範疇だろう。
そもそも、インテルのコンパイラならベクタ型使わずに普通に書いてSSE/AVXを
使ってくれるんだが。CL_DEVICE_PREFERRED_VECTOR_WIDTH_CHAR=1だしな。
下手に最適化しようとして却って駄目にしているように思える。
ベクタ型は想定するターゲットで効果が見込まれる場合に使うべきで、そういう意味では
どっちかというとチューニングの範疇だろう。
そもそも、インテルのコンパイラならベクタ型使わずに普通に書いてSSE/AVXを
使ってくれるんだが。CL_DEVICE_PREFERRED_VECTOR_WIDTH_CHAR=1だしな。
下手に最適化しようとして却って駄目にしているように思える。
801デフォルトの名無しさん
2015/02/19(木) 01:05:51.96ID:f67JHinc かたやGPUになるとパイプラインのスカスカ具合見ながら
int2とかint4とか使って依存関係のない演算で埋めていかないとお話にならんしなぁ。
int2とかint4とか使って依存関係のない演算で埋めていかないとお話にならんしなぁ。
802デフォルトの名無しさん
2015/02/19(木) 02:14:32.89ID:KUEe9MYM アーキテクチャごとの最適化は、まだコンパイラとかの成長中の部分もあるだろうしなぁ
そのうち改善はしてくれるような気がするけど
そのうち改善はしてくれるような気がするけど
803デフォルトの名無しさん
2015/02/19(木) 22:30:01.89ID:t/UF4QVL そうは言っても今のアーキが向かってる方向ってコンパイラ実装の難易度上がってるから
コンパイラの苦手な部分を補填してやらにゃ速くならないってのは改善される事はないと思う
むしろそこまで賢いコンパイラとか使いたくない
コンパイラの苦手な部分を補填してやらにゃ速くならないってのは改善される事はないと思う
むしろそこまで賢いコンパイラとか使いたくない
804デフォルトの名無しさん
2015/02/19(木) 23:19:07.50ID:1LBnym+M 技術的側面もあるが
それ以上にIA64がコケたことが
コンパイラを賢くしてプロセッサを脳筋にする道を
決定的に閉ざした
コンパイラの賢さに関して言えば
足並みがそろってない事の方が問題だと思う
それ以上にIA64がコケたことが
コンパイラを賢くしてプロセッサを脳筋にする道を
決定的に閉ざした
コンパイラの賢さに関して言えば
足並みがそろってない事の方が問題だと思う
805デフォルトの名無しさん
2015/02/26(木) 07:17:19.04ID:BKvgQceT クロノスってなんかのアニメであったような
806デフォルトの名無しさん
2015/02/26(木) 14:44:53.01ID:ZlyxtZ3O クロノスはゼウスのお父さん
807デフォルトの名無しさん
2015/02/26(木) 20:31:41.27ID:yDVFOiWq マッシーンロボッ!
お前には、敵はない!
お前には、敵はない!
808デフォルトの名無しさん
2015/03/08(日) 09:21:28.42ID:rJrv12ko OpenCL2.1は発表されたが相変わらずNVIDIAはやる気なさそうだなぁ、コメントくれないし。
おかげでいまだに開発は1.1ベースだよ。
おかげでいまだに開発は1.1ベースだよ。
809デフォルトの名無しさん
2015/04/12(日) 20:37:22.82ID:4fkLnYAO OpenCLでHEVCをGPUに部分的にデコードさせる実験やってるな
まあ新製品はハードウェアでHEVCに対応してるから不要になっちゃうんだけど
まあ新製品はハードウェアでHEVCに対応してるから不要になっちゃうんだけど
810デフォルトの名無しさん
2015/04/12(日) 20:37:43.88ID:4fkLnYAO ×やってるな
○やってたな去年の夏ごろ
○やってたな去年の夏ごろ
811デフォルトの名無しさん
2015/04/12(日) 21:03:58.32ID:b726GPIq 結局使えるのは、いつくらいになるのか…
812デフォルトの名無しさん
2015/04/25(土) 14:51:39.69ID:zIE5htjK vexcl使えばopenclもcudaも関係なくGPUが使えるっぽいけど
813デフォルトの名無しさん
2015/04/25(土) 16:55:17.48ID:DlB5+dQK NVIDIAでやっと1.2が使えるようになったと思ったらバグってんじゃねーか。
本当にやる気無いのな。
本当にやる気無いのな。
814デフォルトの名無しさん
2015/04/26(日) 16:04:03.54ID:ljYoE8AT そらやる気ないやろ。
cudaなら囲い込みできるのに、
cudaの焼き直しのOpenCLなんて協力するだけ損だし。
cudaなら囲い込みできるのに、
cudaの焼き直しのOpenCLなんて協力するだけ損だし。
815デフォルトの名無しさん
2015/04/27(月) 10:52:17.46ID:1JZfjbGY816デフォルトの名無しさん
2015/06/06(土) 14:22:49.99ID:xHuAhJj5 Core i7 3990とGeForce使ってるんだけど、IntelHDが認識されてなくてデバイスマネージャに表示されない
OpenCLの性能評価を試したいんだけど、IntelHDのドライバをインストールすれば認識されますかね?
OpenCLの性能評価を試したいんだけど、IntelHDのドライバをインストールすれば認識されますかね?
817デフォルトの名無しさん
2015/06/07(日) 15:10:46.44ID:OFY6KtcL818デフォルトの名無しさん
2015/06/07(日) 15:14:39.85ID:OFY6KtcL あ、それとintel Opencl driver インストールうまくできるか試してみて結果おしえて
819デフォルトの名無しさん
2015/06/07(日) 20:39:44.84ID:NnypvtRT >>817
モニタはGeForceに接続。ドライバインストール試してみる。
モニタはGeForceに接続。ドライバインストール試してみる。
820デフォルトの名無しさん
2015/06/08(月) 05:35:15.96ID:ewd9hwV4 Intelのにモニターをつなげないと
いけなかったはず。
いけなかったはず。
821デフォルトの名無しさん
2015/06/08(月) 13:13:32.81ID:rnRcmo2O i7 3990は検索してもろくにヒットしないけど、Sandy Bridge-Eなら無理なのでは。
822デフォルトの名無しさん
2015/06/09(火) 01:36:37.47ID:c7FHKlcw そだね、そのくらい確認してるかと思って聞かなかったけど、
iGPUがついてないならそもそも無理だわな。
iGPUがついてないならそもそも無理だわな。
823デフォルトの名無しさん
2015/06/10(水) 12:18:07.90ID:VIG2W0Y+ うまくいけばCPUの方はOpenCLで動かせるかもしれない
やる意味ないけどね
やる意味ないけどね
824デフォルトの名無しさん
2015/06/19(金) 09:06:28.51ID:giF1KE9b GPUのないノートのCPUでデバックしてから
GPUで実行できるなら俺はうれしい
GPUで実行できるなら俺はうれしい
825デフォルトの名無しさん
2015/06/19(金) 21:38:40.35ID:s6jV56Gc 別途ドライバをインストールしなきゃならんってのが難点なんだよな。
SSE/AVXをお手軽に使えて、コア数に応じてマルチスレッドで実行してくれるから
使いではあると思うんだが。
SSE/AVXをお手軽に使えて、コア数に応じてマルチスレッドで実行してくれるから
使いではあると思うんだが。
826デフォルトの名無しさん
2015/06/19(金) 23:20:08.11ID:KZJPVbVq デバッグなんかよりチューニングが大事だからターゲットハード以外でコーディングしてもなぁ
827デフォルトの名無しさん
2015/06/20(土) 00:21:14.39ID:46SUOvEb なにがなんでも最高性能出さなきゃならん用途ばかりじゃあるまい。
一般的な並列化のみで大多数のハードでそこそこ速くなりゃ十分、という応用もある。
一般的な並列化のみで大多数のハードでそこそこ速くなりゃ十分、という応用もある。
828デフォルトの名無しさん
2015/06/22(月) 00:09:27.57ID:e4hiyCLD CLはチューニングなしだとCPUに惨敗もありえるのでな。
829デフォルトの名無しさん
2015/06/22(月) 01:11:03.05ID:rREKDKy5 メモリ転送とenqueueしてからの計算開始に時間かかるのがなぁ
830デフォルトの名無しさん
2015/06/22(月) 07:39:26.22ID:FYteK6ai CPUに惨敗してた処理がチューニングでどうかなるもんか?
単に並列化できてなかっただけじゃね?
単に並列化できてなかっただけじゃね?
831デフォルトの名無しさん
2015/06/22(月) 21:40:24.04ID:e4hiyCLD832デフォルトの名無しさん
2015/06/22(月) 21:41:31.55ID:e4hiyCLD833デフォルトの名無しさん
2015/06/23(火) 02:38:28.65ID:22fvktD/ チューニングは難しい
何となくやってみたら、処理時間が5倍遅くなったときの衝撃は大きかったな
何となくやってみたら、処理時間が5倍遅くなったときの衝撃は大きかったな
834デフォルトの名無しさん
2015/06/23(火) 08:25:00.27ID:drLPVFNo ターゲットのハードに特化したチューニングをしないと使い物にならんようなことを
言っている人がいるが、そんなこといったらユーザー環境を特定せずに広く配布する
アプリなんて作れんな。
うちじゃ一般的なGPU向けチューニングしかしてないが、NV/AMD安いのから高いのまで
テストしてみてローエンドでもCPUの数倍くらいで動くから十分、速く動かしたいなら
高いGPU使え、ってなノリだな。
言っている人がいるが、そんなこといったらユーザー環境を特定せずに広く配布する
アプリなんて作れんな。
うちじゃ一般的なGPU向けチューニングしかしてないが、NV/AMD安いのから高いのまで
テストしてみてローエンドでもCPUの数倍くらいで動くから十分、速く動かしたいなら
高いGPU使え、ってなノリだな。
835デフォルトの名無しさん
2015/06/23(火) 08:50:44.48ID:LQs/3Np0 一番遅いハードに合わせて作っとけば問題ないよ
836デフォルトの名無しさん
2015/06/23(火) 22:58:24.67ID:VwORpFDM >>834
AMDのHSAのAPUとAMDのOpenCl2のdGPUがHPCを除いたいまのデファクト
それ以外は無視で良い。Nvは一般用でGPGPUやる気ないし
HPC用ならターゲットのハードに特化したチューニングは当然だし
AMDのHSAのAPUとAMDのOpenCl2のdGPUがHPCを除いたいまのデファクト
それ以外は無視で良い。Nvは一般用でGPGPUやる気ないし
HPC用ならターゲットのハードに特化したチューニングは当然だし
837デフォルトの名無しさん
2015/06/24(水) 01:34:16.84ID:35TMs94C madとかそういう複合命令(?)を使ってチューニングする程度で抑えたいところ
838デフォルトの名無しさん
2015/08/31(月) 07:10:09.59ID:kH1QDWTh Vexclの開発が止まってる
誰か引き継ぐ人はいないのか?
誰か引き継ぐ人はいないのか?
839デフォルトの名無しさん
2015/09/02(水) 06:58:53.31ID:VNDyXTKC 早く2.0を使えるようにしてくれ
840デフォルトの名無しさん
2015/09/03(木) 00:02:12.18ID:iQnjIkb4 NVIDIA無視すりゃ幸せになれるぞ
841デフォルトの名無しさん
2015/09/03(木) 01:44:07.69ID:cb/ef9ik842デフォルトの名無しさん
2015/12/19(土) 10:21:19.84ID:7/8YsZOJ プログラマはMacを使ってるってマジ?
http://hayabusa3.2ch.net/test/read.cgi/news/1450395043/
http://hayabusa3.2ch.net/test/read.cgi/news/1450395043/
843デフォルトの名無しさん
2015/12/19(土) 10:23:37.79ID:qfRCvKdP 単なる世間知らずが踊らされてそう言ってるだけ
844デフォルトの名無しさん
2015/12/19(土) 12:49:21.08ID:BBUxwf4S マルチコピペだぞそれ
845デフォルトの名無しさん
2015/12/19(土) 15:25:38.18ID:iG82T79N 100スレ以上にレスしてNGにならないのは運営が公認してるマルチってことか
846デフォルトの名無しさん
2015/12/19(土) 16:25:03.85ID:2xl0Mjgh GeForceはOpenCL2.xに対応した?
CUDAに同様の機能が在るから技術的に無理という事はないだろうけど
CUDAに同様の機能が在るから技術的に無理という事はないだろうけど
847デフォルトの名無しさん
2015/12/19(土) 18:13:33.83ID:LGhGH2LK 358でやっと1.2正式サポートしたところ。
848デフォルトの名無しさん
2015/12/19(土) 19:06:17.07ID:2xl0Mjgh サンクス。IntelですらOpenCL2.0に対応しているのに業界最大手のnVIDIAがやらないのはなぁ
CUDAを使えという事なんだろうけど、それではnVIDIA専用になってしまうからそれは避けたい。
かといってnVIDIAを無視する訳にもいかないというジレンマ
そろそろOpenCL2.xをメインにしていきたいのだが
CUDAを使えという事なんだろうけど、それではnVIDIA専用になってしまうからそれは避けたい。
かといってnVIDIAを無視する訳にもいかないというジレンマ
そろそろOpenCL2.xをメインにしていきたいのだが
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 鈴木農相「おこめ券はお米しか買えないわけではない。例えば卵、味噌、しょうゆ、こうした購入に利用可能」 [Hitzeschleier★]
- なぜリベラルは人気がないのか 斎藤幸平さんが指し示す未来への道筋:朝日新聞 [少考さん★]
- なぜリベラルは人気がないのか 斎藤幸平さんが指し示す未来への道筋:朝日新聞 ★2 [少考さん★]
- 【日本人の旅行離れ】国内旅行すら行けなくなった……オーバーツーリズムだけじゃない 旅行者減少の異常事態 ★2 [ぐれ★]
- ベトナムのバイク「脱ガソリン」、シェア8割のホンダに打撃…政府が電動二輪普及を主導 [煮卵★]
- “ひとり焼肉”でおなじみ「焼肉ライク」が閉店ラッシュ。なぜ「コスパが悪い」と言われてしまうのか [Gecko★]
- 【ジャップ】村岡新駅(仮)誕生 [234045628]
- 男「托卵はレイプ以上の魂の殺人。人道に対する罪。刑事罰にするべき」高市聞いてるか?托卵に刑事罰を導入しろ [811796219]
- 【実況】博衣こよりのえちえちドラクエ1&2リメイク🧪
- 「SCORE」←これなんて読むんや?🙋🏡
- ちびまる子ちゃんで一番可愛い子wwwww
- 【高市朗報】鈴木大臣「嫌儲のデマに騙されないで。お米券の使い勝手は悪くない。卵味噌醤油も買えます。現金と変わりません」 [517459952]
