オフィシャルサイト
http://www.openmp.org/
リンクなどは>>2以下で
探検
OpenMPプログラミング
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
NGNG359デフォルトの名無しさん
2012/07/03(火) 15:32:38.77 OpenMP以前にC#とか使ってみ
360デフォルトの名無しさん
2012/07/03(火) 16:31:39.87361デフォルトの名無しさん
2012/07/03(火) 17:19:47.13 エラーに出てるけどビルドに必要なのはVCOMPD.libであってvcomp90.dllじゃないんで
362デフォルトの名無しさん
2012/07/03(火) 19:49:27.49 >>355
VS2010 (=verison 10.0) なのに、なんで vcomp90 (=version 9.0 : VS2008用) を
指定してたりするの?
あと、Debug用ライブラリ (vcompd.lib = Visual C++ OpneMP, debug) 使うなら、
VS2010 Pro (=有料版) が必要。
解決方法を4つ考えてみた:
(1) VS2010 Professional を買う
(2) VS2008 Express + Windows SDK 7.0 を使う
(3) Cygwin や MinGW をインストールして、付属のgcc/g++ を使う
(4) Linux や *BSD を使う (VMware/VirtualBoxでも併用すればよろし)
VS2010 (=verison 10.0) なのに、なんで vcomp90 (=version 9.0 : VS2008用) を
指定してたりするの?
あと、Debug用ライブラリ (vcompd.lib = Visual C++ OpneMP, debug) 使うなら、
VS2010 Pro (=有料版) が必要。
解決方法を4つ考えてみた:
(1) VS2010 Professional を買う
(2) VS2008 Express + Windows SDK 7.0 を使う
(3) Cygwin や MinGW をインストールして、付属のgcc/g++ を使う
(4) Linux や *BSD を使う (VMware/VirtualBoxでも併用すればよろし)
363デフォルトの名無しさん
2012/07/03(火) 20:26:40.35 VC++のOpenMPはデバッグビルドだと_DEBUGをundefしてからomp.hをincludeしないといけないってのが昔あったが
364デフォルトの名無しさん
2012/07/03(火) 23:09:00.31 VS2010 Pro 評価版を Virtual PC とかの捨て環境にインストールすれば vcompd.lib も入ってるけど、これコピーして使ったら逮捕されるかもしれないからやめたほうがいいね。
365355
2012/07/04(水) 16:57:37.98366355
2012/07/24(火) 17:16:07.86 久しぶりの書き込みです
言われた通りVS2008+SDK7.0でopenmpをコンパイラ実行することができました
できればサポ3.0以上を無償ソフトで使えればよかった・・・
言われた通りVS2008+SDK7.0でopenmpをコンパイラ実行することができました
できればサポ3.0以上を無償ソフトで使えればよかった・・・
367デフォルトの名無しさん
2012/08/03(金) 08:51:06.44 メモリのローカリティって何?
368デフォルトの名無しさん
2012/08/03(金) 11:28:21.30 なるべく近いアドレスのデータだけを
369デフォルトの名無しさん
2012/08/27(月) 13:57:29.01 本屋にOpenMPの新しげな本が置いてあったんだけど
あれって買った方がいいと思う?
あれって買った方がいいと思う?
370デフォルトの名無しさん
2012/08/28(火) 00:32:09.61 好きにすれば。
371デフォルトの名無しさん
2012/08/28(火) 08:21:46.94 元IBMのゴルゴ13こと
青山(名前あってるかな?)先生の本がいいからなぁ。
どこかでpdf版もあったと思うけど。
初心者なら青山さんの冊子でしばらく事足りるとおもうし、
だいぶ経験積んでいるのなら、買っても言うのではないかと。
青山(名前あってるかな?)先生の本がいいからなぁ。
どこかでpdf版もあったと思うけど。
初心者なら青山さんの冊子でしばらく事足りるとおもうし、
だいぶ経験積んでいるのなら、買っても言うのではないかと。
372デフォルトの名無しさん
2012/08/28(火) 08:24:31.34 あと、外人さんが書いたものの日本語訳なら
いっそのとこ原書買う方がいいかも。
アマゾンか丸善に
いっそのとこ原書買う方がいいかも。
アマゾンか丸善に
373デフォルトの名無しさん
2012/09/10(月) 09:28:48.06 ひょっとして並列できるところ全部並列化したら
かえって遅くなる?
かえって遅くなる?
374デフォルトの名無しさん
2012/09/10(月) 10:56:02.47 そういうこともある。
375デフォルトの名無しさん
2012/09/12(水) 16:33:48.58 TBBのスレってないんだね
376デフォルトの名無しさん
2012/09/12(水) 16:41:28.82 http://gcc.gnu.org/onlinedocs/libstdc++/manual/parallel_mode.html
std::for_eachがOpenMP使えるみたいだけど
どんな使い方すればいいんんだろ
std::for_eachがOpenMP使えるみたいだけど
どんな使い方すればいいんんだろ
377デフォルトの名無しさん
2012/09/12(水) 18:26:21.73378デフォルトの名無しさん
2012/09/12(水) 23:59:00.24 イテレータの実装はスレッドセーフになってんのかね?
379デフォルトの名無しさん
2012/09/20(木) 00:58:26.64 先週出た Visual Studio Express 2012 for Desktop で、
OpenMP が使えるかどうか試してみた。
WIN32 Release/Debug, x64 Release/Debug のすべてで、
omp_get_num_procs(), omp_get_num_threads() を使ったプログラムを
ビルドして実行できたよ。
OpenMP が使えるかどうか試してみた。
WIN32 Release/Debug, x64 Release/Debug のすべてで、
omp_get_num_procs(), omp_get_num_threads() を使ったプログラムを
ビルドして実行できたよ。
380デフォルトの名無しさん
2012/09/20(木) 02:12:25.71 VS 2010 ExpressはSDK入れても出来なかったのにな
2008はできていたのに
2008はできていたのに
381デフォルトの名無しさん
2012/09/23(日) 23:36:08.84 >>373
アムダールの法則
アムダールの法則
382デフォルトの名無しさん
2012/10/17(水) 09:15:52.02 OpenMP有効で、Core i 3 530(2.93GHz)の環境で
23.66Gflops出た。理論値は23.44Gflopsだが・・
OpenMP簡単でスゲーな
23.66Gflops出た。理論値は23.44Gflopsだが・・
OpenMP簡単でスゲーな
383デフォルトの名無しさん
2012/10/17(水) 17:33:00.60 結果が壊れてないか確認する必要はあるけどね
384デフォルトの名無しさん
2012/10/18(木) 15:22:42.12 spec.org だっけ・・・わすれたwけど
にSMP マシンのテストで
どういうコンパイルオプションを使ったか書いてあるので
それと同じでやってみるとなおいいかも。
ものにもよるけど、経験上は20CPU(コアか・・)くらいまでなら
コア数に比例して上がっていくよね。
大規模流体計算とかだとMPI とかになるだろうけど、
それでも、OpenMP はデュアルコアが一般になった今日では簡単でとても便利だ。
にSMP マシンのテストで
どういうコンパイルオプションを使ったか書いてあるので
それと同じでやってみるとなおいいかも。
ものにもよるけど、経験上は20CPU(コアか・・)くらいまでなら
コア数に比例して上がっていくよね。
大規模流体計算とかだとMPI とかになるだろうけど、
それでも、OpenMP はデュアルコアが一般になった今日では簡単でとても便利だ。
385デフォルトの名無しさん
2012/10/21(日) 22:56:24.36 >>384
OpenMPがいいかMPIがいいかの違いは、
共有メモリがいいか分散メモリがいいかの違いだけ。
大規模問題は往々にしてメモリ帯域が足りなくなったり、ロックの問題が出てくるから、MPIが使われる。
それ以外はOpenMPのほうが有利。
あと、メモリに依存しないオンキャッシュで収まる問題なら、
MPI、OpenMPに限らずほぼコア数にスケールする。
しかし、OpenMPで20コアまでスケールするような問題は見たことがないな。
OpenMPがいいかMPIがいいかの違いは、
共有メモリがいいか分散メモリがいいかの違いだけ。
大規模問題は往々にしてメモリ帯域が足りなくなったり、ロックの問題が出てくるから、MPIが使われる。
それ以外はOpenMPのほうが有利。
あと、メモリに依存しないオンキャッシュで収まる問題なら、
MPI、OpenMPに限らずほぼコア数にスケールする。
しかし、OpenMPで20コアまでスケールするような問題は見たことがないな。
386デフォルトの名無しさん
2012/10/21(日) 23:34:46.32 Opteron 24コアだと8コアくらいまでがリニアに速くなって
それ以上は足せば速くなるけど少しの違いだったな
メモリの帯域が問題だと思ってたけど
それ以上は足せば速くなるけど少しの違いだったな
メモリの帯域が問題だと思ってたけど
387デフォルトの名無しさん
2012/10/22(月) 00:15:04.44 >>386
Opteronで6コア以上だったらNUMAだからメモリバインドをしっかりしないとスピードは上がらんよ。
Linuxならnumactlが必要。Windowsは残念ながらOS任せなので、スケールは難しい。
Opteronで6コア以上だったらNUMAだからメモリバインドをしっかりしないとスピードは上がらんよ。
Linuxならnumactlが必要。Windowsは残念ながらOS任せなので、スケールは難しい。
388デフォルトの名無しさん
2012/10/25(木) 04:31:05.92 MPIだと一部だけパージ可能だからその点は楽
389デフォルトの名無しさん
2013/08/05(月) NY:AN:NY.AN openmp を使って並列化したプログラムを intel fortran コンパイラでコンパイル(最適化は -O0)して4コア(Xeon 5150)のマシンで実行したところ、-openmpオプションの有無によってかかる時間が
有:実時間3m39s、ユーザーcpu時間14m22s
無:実時間2m53s、ユーザーcpu時間2m53s
のようになりました。
つまり openmp で4コアを使っているのに実時間は減っておらず、cpu 時間がコア数の数にだいたい比例して増えています。
まったく同じプログラムを別のマシン Core i5-3470S で同じバージョンの ifort で -openmp オプション付きでコンパイル・実行したところ、かかった実時間は (-optionmp 無しでの実時間)/コア数より少し大きい程度だったので、このマシンでは問題が無さそうです。
どういった原因が考えられますか?
有:実時間3m39s、ユーザーcpu時間14m22s
無:実時間2m53s、ユーザーcpu時間2m53s
のようになりました。
つまり openmp で4コアを使っているのに実時間は減っておらず、cpu 時間がコア数の数にだいたい比例して増えています。
まったく同じプログラムを別のマシン Core i5-3470S で同じバージョンの ifort で -openmp オプション付きでコンパイル・実行したところ、かかった実時間は (-optionmp 無しでの実時間)/コア数より少し大きい程度だったので、このマシンでは問題が無さそうです。
どういった原因が考えられますか?
390デフォルトの名無しさん
2013/08/06(火) NY:AN:NY.ANID:ptOJnDCf!391デフォルトの名無しさん
2013/08/06(火) NY:AN:NY.AN >>389
ロックのしかたがクソとか
プログラム依存の話なのか環境の話なのか切り分けるために
配列要素を合計するような単純なforループで試してみたらいいんじゃないのかな
CPU時間が増えているということは複数コアが使われているのは確かだと思うけど
普通はコア数に比例してCPU時間が増えてコア数に反比例して実時間が減るよね
ロックのしかたがクソとか
プログラム依存の話なのか環境の話なのか切り分けるために
配列要素を合計するような単純なforループで試してみたらいいんじゃないのかな
CPU時間が増えているということは複数コアが使われているのは確かだと思うけど
普通はコア数に比例してCPU時間が増えてコア数に反比例して実時間が減るよね
392デフォルトの名無しさん
2013/08/06(火) NY:AN:NY.AN 処理を分割せずに同じ処理をマルチコアで実行してしまっている気がする
393389
2013/08/07(水) NY:AN:NY.AN みなさんありがとうございます。
FGSL のプログラムを使って多数回のモンテカルロ積分をしていて上記のような問題が起きたのですが、private, shared などの指定がまずかったようです。
積分値が異常ではなかったので、答えは間違いないが Xeon では時間短縮できていないと誤解してしまいました。しかし積分値の分散は openmp ありのほうが小さいので、どうも何らかの異常があったようです。
モンテカルロ積分に関係する量をすべて private にし、乱数の種をスレッドごとに異なる値にすることによって、積分値の異常も計算時間の異常も解決したようです。
ありがとうございました。
FGSL のプログラムを使って多数回のモンテカルロ積分をしていて上記のような問題が起きたのですが、private, shared などの指定がまずかったようです。
積分値が異常ではなかったので、答えは間違いないが Xeon では時間短縮できていないと誤解してしまいました。しかし積分値の分散は openmp ありのほうが小さいので、どうも何らかの異常があったようです。
モンテカルロ積分に関係する量をすべて private にし、乱数の種をスレッドごとに異なる値にすることによって、積分値の異常も計算時間の異常も解決したようです。
ありがとうございました。
394デフォルトの名無しさん
2013/11/23(土) 01:04:27.62 critical (name)
のnameってグローバル?
あるライブラリで
#pragma omp critical(hoge)
があった場合、別のライブラリの
#pragma omp critical(hoge)
と衝突する?
のnameってグローバル?
あるライブラリで
#pragma omp critical(hoge)
があった場合、別のライブラリの
#pragma omp critical(hoge)
と衝突する?
395デフォルトの名無しさん
2014/05/08(木) 22:30:36.12ID:9TYJ/CaO >>394
Cの場合、グローバル変数とローカル変数の名前が被っている時はローカル変数の方が優先されるので、衝突は起こりません
Cの場合、グローバル変数とローカル変数の名前が被っている時はローカル変数の方が優先されるので、衝突は起こりません
396デフォルトの名無しさん
2014/11/06(木) 04:20:52.83ID:iaZsweTc 何これ言語?
397デフォルトの名無しさん
2014/12/01(月) 17:06:44.85ID:K0YH10ym あ
398デフォルトの名無しさん
2015/01/21(水) 08:16:38.01ID:2itpjj+z い
399デフォルトの名無しさん
2015/01/21(水) 21:47:03.58ID:WAMGwClq を
400デフォルトの名無しさん
2016/02/05(金) 21:06:34.41ID:pgxZ4RMK つい最近、凝縮体の数値計算でお世話になりました
といっても6時間程度の規模の計算量でしたけど
といっても6時間程度の規模の計算量でしたけど
401デフォルトの名無しさん
2017/04/08(土) 10:41:47.71ID:8WOwQIDe ものすごく過疎っているね
OpenMPでGPUを使う時にC++のvectorくらい使わせてくれないものか
全くの素人だから知らないだけかも知れないけど・・・
OpenMPでGPUを使う時にC++のvectorくらい使わせてくれないものか
全くの素人だから知らないだけかも知れないけど・・・
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 「おこめ券は米以外の食品も買える。効果的な活用を」 地元で農水相 [山形県] [少考さん★]
- 【速報】「女芸人No.1決定戦 THE W」9代目女王にニッチェ! 7年ぶり3度目で悲願の優勝 [牛丼★]
- 【芸能】『女芸人No.1決定戦THE W』 粗品が最後にバッサリ「優勝賞金1000万円にしてはレベル低い大会」 [冬月記者★]
- 今年の流行語大賞 『働いて働いて働いてまいります』が受賞で不快感… 過労自殺の遺族らが会見「家族にむち打つような行為だ」 [冬月記者★]
- 【東京】「家族で話題にして」 “世田谷一家殺害から25年 警視庁が呼びかけ [煮卵★]
- 【広島】ペルー女性の国保加入を誤って認め、福山市が医療費484万円を肩代わりするミス…入院して手術を受ける [ぐれ★]
- 【高市悲報】女がカバンにつけてる謎マスコット「ラブブ」、4ヶ月で株4兆が蒸発wwwwwwwwwwww [242521385]
- 宅急便デス
- さっむ
- 千晴だけど30年前にゲームのカセット貸したら勝手に売られたんだけど
- ッシャー
- クズ「勉強頑張らなかった奴は一生DQNと一緒に肉体労働しろ」☚勉強頑張れるのも環境と巡り合わせなんだが? [783475554]
