オフィシャルサイト
http://www.openmp.org/
リンクなどは>>2以下で
探検
OpenMPプログラミング
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
NGNG2006/02/17(金) 16:15:54
>>43
VC++8は対応してるよ
VC++8は対応してるよ
2006/02/17(金) 17:36:01
49デフォルトの名無しさん
2006/03/12(日) 17:43:30 GOMPはどこのページからダウンロードできるのでしょうか?
2006/03/12(日) 17:47:28
C++相談室で教えてやっただろうが。
2006/03/18(土) 21:11:59
TextSS のWindowsXP(Professional)64bit化おながいします
もしくは64bitにネイティブ対応したテキスト置換ソフトありますか?
そういや64bitにネイティブ対応している2chブラウザてありましたっけ?
もしくは64bitにネイティブ対応したテキスト置換ソフトありますか?
そういや64bitにネイティブ対応している2chブラウザてありましたっけ?
2006/03/19(日) 09:25:20
>>50
kwsk
kwsk
2006/03/19(日) 14:16:22
54デフォルトの名無しさん
2006/04/11(火) 11:57:56 OpenMP初めて知りました。こんなに簡単にマルチスレッドプログラムが作れるなんて
時代が変わったようだな
時代が変わったようだな
2006/04/18(火) 12:54:01
大きい単位で独立性の高いスレッドを切り出すのがパフォーマンスを上げるポイントなので、
細かい単位であっちこちで同期を取るようなプログラムが手軽に作れてしまえるOpenMPは痛し痒し。
激しくパフォーマンスが出なくてシングルで動かしたときより遅くなることも。
細かい単位であっちこちで同期を取るようなプログラムが手軽に作れてしまえるOpenMPは痛し痒し。
激しくパフォーマンスが出なくてシングルで動かしたときより遅くなることも。
56デフォルトの名無しさん
2006/04/21(金) 15:19:26 OpenMPってwindowsでできるの?
2006/04/21(金) 15:25:08
>>56
VC++ 2005
VC++ 2005
2006/05/02(火) 14:09:55
>>55
細粒度はパフォーマンスでないけど、お手軽並列化〜♪って感じなんでないかい。
細粒度はパフォーマンスでないけど、お手軽並列化〜♪って感じなんでないかい。
59デフォルトの名無しさん
2006/06/02(金) 08:39:59 OpenMPってお手軽だけど、効率はあまり良くないよね
2006/06/04(日) 00:55:01
モチロンソウヨ
2006/06/10(土) 00:01:58
ハイパースレッディングでOpenMP使うと激しく遅くなるよね。
2006/06/10(土) 22:40:12
それは論理CPUにスレッドをバインドすれば
なおるんじゃね?
どうやってバインドするかしらねーけど。
なおるんじゃね?
どうやってバインドするかしらねーけど。
2006/06/10(土) 23:52:44
あまってる演算器や回路をつかって2CPUに見せかけるのがHTだから
行列の計算のような同じタイプの計算を並列化した場合遅くなるのは当たり前。
片方は整数もう片方で実数計算をさせると効果が出るかもしれない。
行列の計算のような同じタイプの計算を並列化した場合遅くなるのは当たり前。
片方は整数もう片方で実数計算をさせると効果が出るかもしれない。
2006/06/11(日) 01:38:10
そうなると #pragma omp for が全滅・・・
2006/06/11(日) 18:15:49
同じ回路を使う場合でもレジスタが倍になって依存性が減るから、パイプラインのストールが減るよ。
あと実数がメインの場合、実数程の負荷は無いにせよアドレスの計算やループカウンタで整数も結構忙しい。
実数をメインにするとそこらへん上手く住み分け出来てると思った。
演算器を効率良く使えてウマー。
あと実数がメインの場合、実数程の負荷は無いにせよアドレスの計算やループカウンタで整数も結構忙しい。
実数をメインにするとそこらへん上手く住み分け出来てると思った。
演算器を効率良く使えてウマー。
2006/06/12(月) 18:36:58
依存性が減るって表現はしっくりこないな
67デフォルトの名無しさん
2006/08/26(土) 14:58:22 VS2005のC++でOpenMPを使おうと思って、コードを書きましたが、
プログラムが開始する前にエラーが起こります。
/openmp をつけてコンパイルしたり、マニフェストファイルに
<file name="vcompd.dll" hash="XXXX" hashalg="XXX"/>と入れ
たりしましたが、まったくピクリとも動いてくれません。
皆さんは普通にVS2005でOpenMP使ってますか?
プログラムが開始する前にエラーが起こります。
/openmp をつけてコンパイルしたり、マニフェストファイルに
<file name="vcompd.dll" hash="XXXX" hashalg="XXX"/>と入れ
たりしましたが、まったくピクリとも動いてくれません。
皆さんは普通にVS2005でOpenMP使ってますか?
2006/08/27(日) 10:05:19
インストーラ用のマージモジュールがあったので、適当なプログラムでインストーラーを作って入れた。
\Program Files\Common Files\Merge Modules
Microsoft_VC80_OpenMP_x86.msm
Microsoft_VC80_DebugOpenMP_x86.msm
リリース版だけならvcregist_x86.exeでも導入できる。
\Program Files\Common Files\Merge Modules
Microsoft_VC80_OpenMP_x86.msm
Microsoft_VC80_DebugOpenMP_x86.msm
リリース版だけならvcregist_x86.exeでも導入できる。
2006/08/27(日) 16:59:19
>>67
うん、普通に使える。
>プログラムが開始する前にエラーが起こります。
ってのがどういう意味かよく分からんし(コンパイル時か実行時か)、
とりあえずエラーメッセージとかソースとか晒してみたら。
うん、普通に使える。
>プログラムが開始する前にエラーが起こります。
ってのがどういう意味かよく分からんし(コンパイル時か実行時か)、
とりあえずエラーメッセージとかソースとか晒してみたら。
2006/08/28(月) 14:20:01
Pro以上なら普通に使えるが、実はStdやExpressでも使う方法がある。
足りないものはomp.h とvcomp(d).dllとインポートライブラリで、
これはPlatformSDK (for Win2003とかいう新しめの奴)を入れると付いてくる。
これをIDEの各検索パスに追加すればコンパイルは出来る。
ただし、WinSXSディレクトリにdllをインストールしないので実行時にDLLが無いためエラーになる。
この導入の仕方は>>68のとおり。
同じ方法でPGOもできないかと思ったがこれは無理でした。
ただ単純な/GL /LTCG オプションでのコンパイルは出来るからこれで我慢。
足りないものはomp.h とvcomp(d).dllとインポートライブラリで、
これはPlatformSDK (for Win2003とかいう新しめの奴)を入れると付いてくる。
これをIDEの各検索パスに追加すればコンパイルは出来る。
ただし、WinSXSディレクトリにdllをインストールしないので実行時にDLLが無いためエラーになる。
この導入の仕方は>>68のとおり。
同じ方法でPGOもできないかと思ったがこれは無理でした。
ただ単純な/GL /LTCG オプションでのコンパイルは出来るからこれで我慢。
7167
2006/08/29(火) 10:28:44 ありがとうございます。インポートライブラリを入れるとうまく動きました。
ためしに
for( i=1; i<=10000000; i++ ) {
double t1 = sin( i*3.14/10000000.0 );
double t2 = cos( i*3.14/10000000.0 );
s = s+t1*t1+t2*t2;
}
を計算すると、デバッグ版ではOpenMPの方が5倍くらい時間がかかるが、
リリース版では1割くらい早くなった。
ちなみに、ハイパースレッドのデュアル
ためしに
for( i=1; i<=10000000; i++ ) {
double t1 = sin( i*3.14/10000000.0 );
double t2 = cos( i*3.14/10000000.0 );
s = s+t1*t1+t2*t2;
}
を計算すると、デバッグ版ではOpenMPの方が5倍くらい時間がかかるが、
リリース版では1割くらい早くなった。
ちなみに、ハイパースレッドのデュアル
2006/08/29(火) 13:38:55
#pragma omp parallel for reduction(+:s)
for ( ...
そのプログラムだとこうですか?うちの環境だとHTの1CPUだからかずぶずぶの結果です。
for ( ...
そのプログラムだとこうですか?うちの環境だとHTの1CPUだからかずぶずぶの結果です。
73デフォルトの名無しさん
2006/10/03(火) 02:54:4374デフォルトの名無しさん
2006/10/26(木) 16:01:43 その次のステップの入門書がほしい
75デフォルトの名無しさん
2006/10/29(日) 00:07:31 72>> その意味で ずぶずぶ とはどこの方言?
2006/10/29(日) 08:21:18
>>75
東京
東京
2006/11/06(月) 03:38:12
g++では利用できないのでしょうか?
2006/11/06(月) 21:45:14
2006/11/18(土) 02:07:03
Openマンコぽこちんか
2006/11/20(月) 03:17:24
OpenマンPのG☆SPOTに決まってるだろバカか
81デフォルトの名無しさん
2006/12/03(日) 17:52:0282デフォルトの名無しさん
2006/12/24(日) 23:44:00 Sun SorilisとVC++(std)の組み合わせで、OpenMPできますか??
2007/02/25(日) 14:20:45
>>82
できない
できない
84デフォルトの名無しさん
2007/02/28(水) 07:03:32 OpenMPでスレッド数を取得するには
#pragma omp parallel
{
cout<<omp_get_num_threads()<<endl;
}
でよいのでしょうか?もっと何かスマートな方法はないでしょうか?
#pragma omp parallel
{
cout<<omp_get_num_threads()<<endl;
}
でよいのでしょうか?もっと何かスマートな方法はないでしょうか?
85デフォルトの名無しさん
2007/03/06(火) 08:50:24 #pragma omp sectionsでfor構文でのdynamicスケジュールの様な動作をさせたいのですが、
どのように書けばよいのでしょうか?
どのように書けばよいのでしょうか?
86デフォルトの名無しさん
2007/03/09(金) 12:49:12 しらね
2007/03/09(金) 13:28:27
>>72-73
OpenMPによる並列プログラミングと数値計算法
http://www.amazon.co.jp/gp/product/4621077171
とかどーでしょ。
>>84
パラレルリージョンの中でなくてもよいはず。
#ifdef _OPENMP
cout<<omp_get_num_threads()<<endl;
#endif
などとすればよいかと。
OpenMPによる並列プログラミングと数値計算法
http://www.amazon.co.jp/gp/product/4621077171
とかどーでしょ。
>>84
パラレルリージョンの中でなくてもよいはず。
#ifdef _OPENMP
cout<<omp_get_num_threads()<<endl;
#endif
などとすればよいかと。
2007/03/10(土) 02:10:13
omp_get_num_threads() はその時点でスレッドチームを構成しているスレッドの数を返すから
逐次実行部分で呼ぶと 1 を返す。
逐次実行部分で呼ぶと 1 を返す。
89デフォルトの名無しさん
2007/03/10(土) 16:00:16 #pragma omp parallel
{
#pragma omp single
cout<<omp_get_num_threads()<<endl;
}
{
#pragma omp single
cout<<omp_get_num_threads()<<endl;
}
90デフォルトの名無しさん
2007/03/25(日) 22:33:15 program main
!$ use omp_lib
implicit none
character(len=4),parameter :: str(0:2) = ["hage","hoge","huge"]
print *, "Hello, World!"
!$omp parallel num_threads(3)
!$ print *, trim(str(omp_get_thread_num()))
!$omp end parallel
end program main
!$ use omp_lib
implicit none
character(len=4),parameter :: str(0:2) = ["hage","hoge","huge"]
print *, "Hello, World!"
!$omp parallel num_threads(3)
!$ print *, trim(str(omp_get_thread_num()))
!$omp end parallel
end program main
91デフォルトの名無しさん
2007/04/02(月) 18:31:00 レベルの低い人向けの商売ってあるじゃないですか
たとえば、カレーライス。子供の食い物ね。マクドナルド。通はモスバーガーでしょ?
野球だと、巨人。クルマだと、トヨタ。音楽だと、ミスチル。政治だと、自民党。
ビートルズだと、ポールの曲。音楽分かってる人はジョンですよね。
マンガだと、手塚治虫や藤子不二雄。今更読む必要もないw
小説だと、古本屋に山積されてる赤川次郎。小説マニアは読みませんねw
長嶋茂雄・新庄剛志・三浦カズ・ゴン。名前だけでむかつきますね。
DELLってつまりそういうレベルの低い人向けの商品ですよね。
歴史を作るのは我々マニアですから、記憶からはいつか消え去るんですよDELLはw
たとえば、カレーライス。子供の食い物ね。マクドナルド。通はモスバーガーでしょ?
野球だと、巨人。クルマだと、トヨタ。音楽だと、ミスチル。政治だと、自民党。
ビートルズだと、ポールの曲。音楽分かってる人はジョンですよね。
マンガだと、手塚治虫や藤子不二雄。今更読む必要もないw
小説だと、古本屋に山積されてる赤川次郎。小説マニアは読みませんねw
長嶋茂雄・新庄剛志・三浦カズ・ゴン。名前だけでむかつきますね。
DELLってつまりそういうレベルの低い人向けの商品ですよね。
歴史を作るのは我々マニアですから、記憶からはいつか消え去るんですよDELLはw
92デフォルトの名無しさん
2007/04/07(土) 02:30:59 C++のクラスでstaticな変数を使いたいのですが、OpenMPの中で更新した場合、安全に更新されるのでしょうか?
2007/04/07(土) 07:36:57
されると思う?localな変数でも、ちゃんと明示しないと無理だし、
データ並列になっていないのでは意味無いと思わない?
データ並列になっていないのでは意味無いと思わない?
94デフォルトの名無しさん
2007/04/10(火) 11:50:17 ,ィ __
,. / |´ ̄`ヽー- 、 ト、 , -‐、/./.- 、 書き込みのはやきこと風の如く
/ | | ヽ l l ( 火◇風 ノ
/o ̄`ハ._.ゝ===┴=く.ノ- 、 ノ ◇ ◇ ( 他人と会話せざること林の如く
/o O / l´ ⌒ ⌒ lo ',ヽ ( 山◇ 林 }
\___/. ト、(●) (●) ハ ∧ `⌒/7へ‐´ ネットで煽ること火の如く
/ ,イ レ::::⌒(__人__)⌒l~T--‐彡 /./
/ ̄ ̄l. 彡、 |r┬-| ノ'l l::::::::::彡ー7⌒つ、 部屋から動かざること山の如し
彡:::::::::::l ト、__ `ー' /| l::::::::::::ミ {,_.イニノ
彡ソ/ノハ ト、 \ / ,イ 川ハ ヾー‐'^┴
,. / |´ ̄`ヽー- 、 ト、 , -‐、/./.- 、 書き込みのはやきこと風の如く
/ | | ヽ l l ( 火◇風 ノ
/o ̄`ハ._.ゝ===┴=く.ノ- 、 ノ ◇ ◇ ( 他人と会話せざること林の如く
/o O / l´ ⌒ ⌒ lo ',ヽ ( 山◇ 林 }
\___/. ト、(●) (●) ハ ∧ `⌒/7へ‐´ ネットで煽ること火の如く
/ ,イ レ::::⌒(__人__)⌒l~T--‐彡 /./
/ ̄ ̄l. 彡、 |r┬-| ノ'l l::::::::::彡ー7⌒つ、 部屋から動かざること山の如し
彡:::::::::::l ト、__ `ー' /| l::::::::::::ミ {,_.イニノ
彡ソ/ノハ ト、 \ / ,イ 川ハ ヾー‐'^┴
2007/04/12(木) 09:18:04
96デフォルトの名無しさん
2007/04/12(木) 10:50:30 祗園精舎の鐘の声
諸行無常の響きあり
娑羅双樹の花の色
盛者必衰の理をあらはす
おごれる人も久しからず
唯春の夜の夢のごとし
たけき者も遂にはほろびぬ
偏に風の前の塵に同じ
諸行無常の響きあり
娑羅双樹の花の色
盛者必衰の理をあらはす
おごれる人も久しからず
唯春の夜の夢のごとし
たけき者も遂にはほろびぬ
偏に風の前の塵に同じ
97デフォルトの名無しさん
2007/06/02(土) 15:05:34 一般論として、MPIよりもOpenMPの方が性能が低下する(遅くなる)ということはありえますか?
MPIのプログラムをOpenMPを使って書き換えたのですが、3割近く遅くなってしまいました。
MPIのプログラムをOpenMPを使って書き換えたのですが、3割近く遅くなってしまいました。
98デフォルトの名無しさん
2007/06/02(土) 15:29:34 一般論では遅くなります
2007/06/02(土) 15:37:48
きちんとチューニングされていれば、MPIの方が速い。
あとはpthreadを使って自分で書くという手もある。
あとはpthreadを使って自分で書くという手もある。
100デフォルトの名無しさん
2007/06/02(土) 15:42:04 OpenMPはお手軽。だからそれに伴って犠牲になっている部分もある。それが性能。
101デフォルトの名無しさん
2007/06/02(土) 17:50:17 MPIで並列効果出せるほどの大きな粒度ならOpenMPにする必要はない。
OpenMPの利点は小さな粒度の並列処理が簡単に書けることとシングルソースで
非OpenMP環境でもビルドしてテストできること。
それから既存のソースにディレクティブ挿入するだけで並列化できるところかな。
OpenMPの利点は小さな粒度の並列処理が簡単に書けることとシングルソースで
非OpenMP環境でもビルドしてテストできること。
それから既存のソースにディレクティブ挿入するだけで並列化できるところかな。
102デフォルトの名無しさん
2007/06/03(日) 06:10:20 >>101
同じ粒度でも、OpenMPの方が遅くなってしまいます。
OpenMPはスレッドレベルでの切り替えなので、プロセスレベルのMPIよりも、効率が良いと思っていたので
何が問題なのか、測りかねています。
同じ粒度でも、OpenMPの方が遅くなってしまいます。
OpenMPはスレッドレベルでの切り替えなので、プロセスレベルのMPIよりも、効率が良いと思っていたので
何が問題なのか、測りかねています。
103デフォルトの名無しさん
2007/06/03(日) 08:40:24 競合してるんじゃない?
104デフォルトの名無しさん
2007/06/03(日) 10:07:50 キャッシュのヒット率の差だと思う
もし、pragma omp forでやっているのなら、for文を二つに分けて
pragma omp parallelで二つに並列してみたら?
もし、pragma omp forでやっているのなら、for文を二つに分けて
pragma omp parallelで二つに並列してみたら?
105デフォルトの名無しさん
2007/06/03(日) 10:15:44 windows はaffinty maskを使えないの?
106デフォルトの名無しさん
2007/06/03(日) 11:14:45107デフォルトの名無しさん
2007/06/03(日) 12:26:25 環境は、Fedora5にデュアルコアOpteronx2の計4cpuをインテルコンパイラを使って、コンパイルしています。
系を大きくしても(すなわち、スレッド生成頻度をかなり下げても)300%程度で飽和してしまいます。
以前、Redhat+Xeon+インテルコンパイラの時は,2CPUで200%(4CPUではないのであまりよい比較ではありませんが)
計算速度も倍になっていたので、コンパイラの問題なのか、opteronの問題なのか、そのあたりもう少し調べてみたいと思います。
系を大きくしても(すなわち、スレッド生成頻度をかなり下げても)300%程度で飽和してしまいます。
以前、Redhat+Xeon+インテルコンパイラの時は,2CPUで200%(4CPUではないのであまりよい比較ではありませんが)
計算速度も倍になっていたので、コンパイラの問題なのか、opteronの問題なのか、そのあたりもう少し調べてみたいと思います。
108デフォルトの名無しさん
2007/06/03(日) 12:32:32 1CPU から 2CPU にスケールするのと、4CPU にスケールするのとじゃ
全然話が違うからね。
全然話が違うからね。
109デフォルトの名無しさん
2007/06/03(日) 12:57:34 4cpuならうまく組めば1割も落ちないよ
スレッドチェッカーで確認してみな
スレッドチェッカーで確認してみな
110デフォルトの名無しさん
2007/06/03(日) 14:58:41 >>107
OpteronってことはNUMA構成で使ってるってことはないかな?
OpenMPはSMP用だからNUMAだと効率ががた落ちになることがあるよ。
あと趣味でやってるのでなければCPU使用率よりも計算までの終了時間で考えた方がいいと思う。
メモリ競合起こすとCPU100%でも計算速度半分なんてざらだから。
OpteronってことはNUMA構成で使ってるってことはないかな?
OpenMPはSMP用だからNUMAだと効率ががた落ちになることがあるよ。
あと趣味でやってるのでなければCPU使用率よりも計算までの終了時間で考えた方がいいと思う。
メモリ競合起こすとCPU100%でも計算速度半分なんてざらだから。
111デフォルトの名無しさん
2007/06/03(日) 15:24:23 カーネルがスレッドのスケジューリングとメモリページの割当を上手く管理していれば
Dual Core x 2 Socket くらい何とかならないの?
Dual Core x 2 Socket くらい何とかならないの?
112デフォルトの名無しさん
2007/06/03(日) 15:30:27 CPUとSIMDで行列計算をうまく分散してくれるコンパイラはないものか
113デフォルトの名無しさん
2007/06/03(日) 15:42:04 lapackのSIMD化でダメなの?
そんなのはいくらでもあるが
そんなのはいくらでもあるが
114デフォルトの名無しさん
2007/06/04(月) 06:27:01 OpenMP節を入れ子にすると、並列化されなくなってしまいます。
入れ子のOpenMP節を並列化する方法はないものでしょうか?
入れ子のOpenMP節を並列化する方法はないものでしょうか?
115デフォルトの名無しさん
2007/06/04(月) 09:06:41 >>114
OpenMP + nested loopで検索すればたくさんでてくるよ
OpenMP + nested loopで検索すればたくさんでてくるよ
116デフォルトの名無しさん
2007/06/24(日) 15:29:55 インテルのスレッディング・ビルディング・ブロックとOpenMPの違いって何?
117デフォルトの名無しさん
2007/06/24(日) 18:08:38 OpwnMP:
共有メモリ型並列計算機におけるマルチスレッド並列プログラミングのためのAPI
インテル スレッディング・ビルディング・ブロック:
C++用ランタイム・ライブラリー
共有メモリ型並列計算機におけるマルチスレッド並列プログラミングのためのAPI
インテル スレッディング・ビルディング・ブロック:
C++用ランタイム・ライブラリー
118デフォルトの名無しさん
2007/08/20(月) 02:26:56 Windows ServerR 2003 R2 Platform SDK
にopenmpのファイルが入ってるのかと思ったら入って無かった。
Microsoft Windows Software Development Kit for Windows Vista
にopenmpのファイルが入ってた。
ファイルの場所が
Microsoft SDKs\Windows\v6.0\VC\
以下のincludeとlibだから少し戸惑ってしまった。
で、さっそく簡単なプログラムを作って実行してみたらSpybotが反応したんだが。
vcompd.dllにスパイウェアが入ってるのか?
にopenmpのファイルが入ってるのかと思ったら入って無かった。
Microsoft Windows Software Development Kit for Windows Vista
にopenmpのファイルが入ってた。
ファイルの場所が
Microsoft SDKs\Windows\v6.0\VC\
以下のincludeとlibだから少し戸惑ってしまった。
で、さっそく簡単なプログラムを作って実行してみたらSpybotが反応したんだが。
vcompd.dllにスパイウェアが入ってるのか?
119デフォルトの名無しさん
2007/09/06(木) 01:13:00 Microsoft Windows Software Development Kit for Windows Vista
vcredist_x86.exe
この2つでVC2005Expressでも使えた。
vcredist_x86.exe
この2つでVC2005Expressでも使えた。
120デフォルトの名無しさん
2007/09/19(水) 22:49:32 他人の書いた数値解析のプログラムをOpenMP対応にしている度素人です。
まずテストに単にパラレルリージョンを指定しただけのプログラムを走らせたら
パフォーマンスが半分くらいにまで落ち込んで困っています(スレッド数はCPU数以下です)。
しかもパラレルリージョンの範囲が広ければ広いほどパフォーマンスが悪化するのですが
これは当然なのでしょうか?
ちなみにパラレルリージョン内を並列化しても1CPUのときより10%くらい悪いです。
環境はOSはRHEL、インテルのfortranコンパイラです。
まずテストに単にパラレルリージョンを指定しただけのプログラムを走らせたら
パフォーマンスが半分くらいにまで落ち込んで困っています(スレッド数はCPU数以下です)。
しかもパラレルリージョンの範囲が広ければ広いほどパフォーマンスが悪化するのですが
これは当然なのでしょうか?
ちなみにパラレルリージョン内を並列化しても1CPUのときより10%くらい悪いです。
環境はOSはRHEL、インテルのfortranコンパイラです。
121デフォルトの名無しさん
2007/09/19(水) 23:54:02 的外れだが同じ作業をしていた素人として。
スレッド生成・消滅のオーバーヘッドは思いのほか大きい
$omp parallel 〜 $omp end parallel
が極めて複数回呼ばれる場合にパフォーマンスは非常に落ちる
ネストループ内部、100万回呼ばれるルーチン内など
シングルの作業内容をマルチ対応にするのは面倒ですね。
gprof等でタイムクリティカルな部分を探し、手を入れてみましょう
スレッド生成・消滅のオーバーヘッドは思いのほか大きい
$omp parallel 〜 $omp end parallel
が極めて複数回呼ばれる場合にパフォーマンスは非常に落ちる
ネストループ内部、100万回呼ばれるルーチン内など
シングルの作業内容をマルチ対応にするのは面倒ですね。
gprof等でタイムクリティカルな部分を探し、手を入れてみましょう
122デフォルトの名無しさん
2007/09/20(木) 08:22:47 パラレルリージョンは例えば並列計算と逐次計算を交互にやるときに
逐次計算のたびにパラレルリージョンから出入りするオーバーヘッドを避けるために
使ったりするのが普通だと思う。
単にパラレルリージョンを指定しただけでは並列化による時間短縮はまったく起こらない。
並列化のオーバーヘッドがかかるだけ。
ループを並列化するとか、パラレルリージョンの中でデータ並列なりタスク並列の計算をするとかしないと。
一番大事なことはアルゴリズム中の並列性を見出すことかと。
並列性のない逐次アルゴリズムだとどうあがいてもパフォーマンスは出ない。
逐次計算のたびにパラレルリージョンから出入りするオーバーヘッドを避けるために
使ったりするのが普通だと思う。
単にパラレルリージョンを指定しただけでは並列化による時間短縮はまったく起こらない。
並列化のオーバーヘッドがかかるだけ。
ループを並列化するとか、パラレルリージョンの中でデータ並列なりタスク並列の計算をするとかしないと。
一番大事なことはアルゴリズム中の並列性を見出すことかと。
並列性のない逐次アルゴリズムだとどうあがいてもパフォーマンスは出ない。
123120
2007/09/21(金) 00:15:35 今日いろいろ簡単なテストプログラムを組んでいたのですが
かなり大きな配列を含む範囲を
単にパラレルリージョンに指定しただけのプログラムは
1CPUのときの1/3程度まで低下すると言う現象がありました。
(並列化を指定すると4CPUで3.8倍程度にちゃんとなりました)
同じ動作をするスレッドが複数あってメモリが競合してるんですかね?
あしたスレッドチェッカーの体験版でも落として調べてみます。
>>121
今日試してみたところうちの環境では
100000回ループするプログラムの内と外に
$omp parallel 〜 $omp end parallel
をおいたプログラムをそれぞれ比較したのですがほとんど差はありませんでした。
リージョン内は簡単な内容だったのですが、
リージョン内のプログラムの内容によってもスレッド生成・消滅のオーバーヘッドは変わってくるんですかね?
>>122
並列化の指定をする前にまず並列化予定の範囲をパラレルリージョン指定して
ちゃんと動くのかを確認したかったのです。
長文失礼
かなり大きな配列を含む範囲を
単にパラレルリージョンに指定しただけのプログラムは
1CPUのときの1/3程度まで低下すると言う現象がありました。
(並列化を指定すると4CPUで3.8倍程度にちゃんとなりました)
同じ動作をするスレッドが複数あってメモリが競合してるんですかね?
あしたスレッドチェッカーの体験版でも落として調べてみます。
>>121
今日試してみたところうちの環境では
100000回ループするプログラムの内と外に
$omp parallel 〜 $omp end parallel
をおいたプログラムをそれぞれ比較したのですがほとんど差はありませんでした。
リージョン内は簡単な内容だったのですが、
リージョン内のプログラムの内容によってもスレッド生成・消滅のオーバーヘッドは変わってくるんですかね?
>>122
並列化の指定をする前にまず並列化予定の範囲をパラレルリージョン指定して
ちゃんと動くのかを確認したかったのです。
長文失礼
124デフォルトの名無しさん
2007/10/10(水) 15:20:28 sections分割でsection分けを行った時に、
自分でどのスレッドに割り当てる的な事は
できないのでしょうか?
自分でどのスレッドに割り当てる的な事は
できないのでしょうか?
125120
2007/10/25(木) 21:51:43 いまさらながら経過報告
元となったプログラムが古いものだったので、配列をallocateするのではなく
メインの宣言でかなり大きくとっていたのですが、
それを必要量にしたところかなり早くなりました。
ただ強い最適化(fastオプションとか)つけると
OpenMPはそんなにスピードが上がらずシングルスレッドに追いつかれてしまうんですけどね。
元となったプログラムが古いものだったので、配列をallocateするのではなく
メインの宣言でかなり大きくとっていたのですが、
それを必要量にしたところかなり早くなりました。
ただ強い最適化(fastオプションとか)つけると
OpenMPはそんなにスピードが上がらずシングルスレッドに追いつかれてしまうんですけどね。
126デフォルトの名無しさん
2007/11/30(金) 04:25:29 サーセーン。素人の恥ずかしい質問です。
OpenMPは従来の(OSなどに付属した)スレッドのライブラリの
置き換えとしては使用すべきではないのでしょうか?
(どこかで逐次プログラムの並列化がOpenMPの利用の前提であるとか見たのですが、)
並列で動くことが前提であるプログラム(例:HTTPデーモンなど)を
OpenMPを使って書こうと思っているのですが、止めたほうがいいのでしょうか・・・。
OpenMPは従来の(OSなどに付属した)スレッドのライブラリの
置き換えとしては使用すべきではないのでしょうか?
(どこかで逐次プログラムの並列化がOpenMPの利用の前提であるとか見たのですが、)
並列で動くことが前提であるプログラム(例:HTTPデーモンなど)を
OpenMPを使って書こうと思っているのですが、止めたほうがいいのでしょうか・・・。
127126
2007/11/30(金) 04:26:29 うわぁ、このスレ伸びてないんだなあ。悪いけどage
128デフォルトの名無しさん
2007/12/01(土) 01:58:56 OpenMP はひとまとまりの大きなデータ(行列とか画像とか)に対する計算を
複数のスレッドで並列化するのに向いている希ガス。つまりデータ並列向き。
データ並列性のある for 文で書かれたアルゴリズム(行列ベクトル積とか
画像のしきい値処理とか)は parallel for ディレクティブでいとも簡単に並列化できる。
そこが OpenMP のおいしいところ。
タスク並列の並列プログラム、つまり各スレッドが独立に違う処理をする
(例えばそれぞれ別のクライアントからの要求を処理する)並列プログラムも
OpenMP で書けるけど、あまりうまみがないと思われ。
逐次プログラムを並列化するのが前提というのは違う気がする。
ただ、例えば parallel for ディレクティブしか使ってない並列プログラムは
コンパイラの OpenMP 機能をオフにすれば逐次プログラムとしてコンパイルできる。
そこが他の並列化手法(POSIXスレッドとかMPIとか)と違うところ。
でも、OpenMP機能をオフにするとコンパイル不能になる並列プログラムも書けるし、
parallel sections を使ったプログラムは逐次プログラムとしてコンパイルはできても
意味が変わってしまう(各セクションが順番に逐次実行される)。
つまり、この手のプログラムは並列で動くことが前提で書くわけだ。
結局のところ、OpenMP を使うのが妥当かどうかは126さんがやりたいことに依る。
並列性の高いデータ並列の計算をやりたいなら使う価値がある。
複数のスレッドで並列化するのに向いている希ガス。つまりデータ並列向き。
データ並列性のある for 文で書かれたアルゴリズム(行列ベクトル積とか
画像のしきい値処理とか)は parallel for ディレクティブでいとも簡単に並列化できる。
そこが OpenMP のおいしいところ。
タスク並列の並列プログラム、つまり各スレッドが独立に違う処理をする
(例えばそれぞれ別のクライアントからの要求を処理する)並列プログラムも
OpenMP で書けるけど、あまりうまみがないと思われ。
逐次プログラムを並列化するのが前提というのは違う気がする。
ただ、例えば parallel for ディレクティブしか使ってない並列プログラムは
コンパイラの OpenMP 機能をオフにすれば逐次プログラムとしてコンパイルできる。
そこが他の並列化手法(POSIXスレッドとかMPIとか)と違うところ。
でも、OpenMP機能をオフにするとコンパイル不能になる並列プログラムも書けるし、
parallel sections を使ったプログラムは逐次プログラムとしてコンパイルはできても
意味が変わってしまう(各セクションが順番に逐次実行される)。
つまり、この手のプログラムは並列で動くことが前提で書くわけだ。
結局のところ、OpenMP を使うのが妥当かどうかは126さんがやりたいことに依る。
並列性の高いデータ並列の計算をやりたいなら使う価値がある。
129デフォルトの名無しさん
2007/12/01(土) 02:04:37 追加。OpenMPでHTTPデーモンを書いた、という報告を見たことがあったのを思い出した。
http://www.nic.uoregon.edu/iwomp2005/Papers/f35.pdf
俺は詳しく読んでないので内容についてはノーコメント。参考までに。
http://www.nic.uoregon.edu/iwomp2005/Papers/f35.pdf
俺は詳しく読んでないので内容についてはノーコメント。参考までに。
130デフォルトの名無しさん
2007/12/01(土) 13:39:21 並列化した部分じゃbreakやreturn使えないし、難しかっただろうなぁ。
普通のWindowsプログラムでCreateThreadをOpenMPで置き換えろって言われたら・・・
メッセージポンプ使ってなんとかなるんだろうか
普通のWindowsプログラムでCreateThreadをOpenMPで置き換えろって言われたら・・・
メッセージポンプ使ってなんとかなるんだろうか
131デフォルトの名無しさん
2007/12/01(土) 23:44:51 >並列化した部分じゃbreakやreturn使えない
kwsk
kwsk
132126
2007/12/03(月) 05:18:50 スレッドを横断したbreakやreturnが出来ないということでは?
字句上は単なるスコープにしか見えないので、出来そう・・・しかし出来ないもどかしさ(何)。
>>128
ご返答ありがとうございます。
128氏から頂いた意見も考慮に入れつつ、色々と検討してみた結果、
今回やりたいことにはOpenMPは適していない、という判断に至りました。
しかし実験的にHTTPサーバらしきものをOpenMPを使って書いてみたところ、
簡単なものならかなり簡潔に書けることも分かり、、全てでなくとも部分的にOpenMPを使うのもありかと思えました。
字句上は単なるスコープにしか見えないので、出来そう・・・しかし出来ないもどかしさ(何)。
>>128
ご返答ありがとうございます。
128氏から頂いた意見も考慮に入れつつ、色々と検討してみた結果、
今回やりたいことにはOpenMPは適していない、という判断に至りました。
しかし実験的にHTTPサーバらしきものをOpenMPを使って書いてみたところ、
簡単なものならかなり簡潔に書けることも分かり、、全てでなくとも部分的にOpenMPを使うのもありかと思えました。
133デフォルトの名無しさん
2007/12/05(水) 05:51:33 >>119の方法で
VC2005ExpressEditionで使えるようになったはいいんだけど
forループの所に
#pragma omp parallel for
ってやっても
error C3005: ';' : OpenMP 'parallel' ディレクティブでは予期しないトークンです
とかいうエラーが発生して使えないんだけど何故なの??
#pragma omp parallel sections
とか他のは通るけど,forループのだけどうしても使えん・・・
#pragma omp parallel
{
#pragma omp for
・・・
}
にすると
error C3001: 'if' : OpenMP ディレクティブ名が必要です
って言われる
VC2005ExpressEditionで使えるようになったはいいんだけど
forループの所に
#pragma omp parallel for
ってやっても
error C3005: ';' : OpenMP 'parallel' ディレクティブでは予期しないトークンです
とかいうエラーが発生して使えないんだけど何故なの??
#pragma omp parallel sections
とか他のは通るけど,forループのだけどうしても使えん・・・
#pragma omp parallel
{
#pragma omp for
・・・
}
にすると
error C3001: 'if' : OpenMP ディレクティブ名が必要です
って言われる
134デフォルトの名無しさん
2007/12/17(月) 18:47:08 >133
#pragma .. の行末に ';' がついてるとかいうオチだったら素っ裸で町内1周してこい
#pragma .. の行末に ';' がついてるとかいうオチだったら素っ裸で町内1周してこい
135デフォルトの名無しさん
2008/01/04(金) 15:12:19 すでにあるプログラムをOpenMP化しようと思うのですが、以下のような場合にfuncがスレッドセーフで再入可能であれば問題ないですか?
#pragma omp for
for(int i=0;i<100000;i++)
{
func(i);
}
#pragma omp for
for(int i=0;i<100000;i++)
{
func(i);
}
136デフォルトの名無しさん
2008/01/04(金) 15:53:58 問題ないです
func()の定義が別ファイルでもおk
func()の定義が別ファイルでもおk
137デフォルトの名無しさん
2008/01/04(金) 16:38:48138sage
2008/02/06(水) 21:13:32 IntelFortran10.0で数値解析やってるんですけど
サブルーチン内で並列化領域をつくるのと
サブルーチンごとメインに展開して並列化領域つくるのとで
並列化時の速度が異なったり(逐次だとほぼ一緒)
逐次計算部分にある並列化と関係ないサブルーチンを
コメントアウトするかしないかで並列化時の速度向上が変わります。
並列スレッドのスタックサイズとかの問題なんでしょうかね。
サブルーチン内で並列化領域をつくるのと
サブルーチンごとメインに展開して並列化領域つくるのとで
並列化時の速度が異なったり(逐次だとほぼ一緒)
逐次計算部分にある並列化と関係ないサブルーチンを
コメントアウトするかしないかで並列化時の速度向上が変わります。
並列スレッドのスタックサイズとかの問題なんでしょうかね。
139デフォルトの名無しさん
2008/02/06(水) 22:02:55 速度や速度向上が具体的にどう違うの?
140デフォルトの名無しさん
2008/02/07(木) 00:50:56 まず、各CPUに処理が効率よく割り振られているか、CPUの負荷率を見てみたらいいんじゃないか?
141デフォルトの名無しさん
2008/02/13(水) 15:49:52 VC++2008でコンパイルするとVCOMPD.libが無いというエラーが出ます。
VCOMPD.libはどこで手に入りますか?
VCOMPD.libはどこで手に入りますか?
142デフォルトの名無しさん
2008/02/13(水) 16:40:58 >>141
VS2005だとPro版以上でサポート。VS2008も同じだと思う。
VS2005だとPro版以上でサポート。VS2008も同じだと思う。
143デフォルトの名無しさん
2008/02/13(水) 20:12:04 >141
vcompd.libはProfessional版以外手に入れる方法はない。
ただしリリースビルド版のライブラリであるvcomp.libは
Windows Server 2008 SDKをインストールするとゲットできる。
デバッグビルドでもリリースビルドのライブラリ(vcomp.lib)を
リンクする設定にするとExpressでもOpenMPが自由に使用可能。
vcompd.libはProfessional版以外手に入れる方法はない。
ただしリリースビルド版のライブラリであるvcomp.libは
Windows Server 2008 SDKをインストールするとゲットできる。
デバッグビルドでもリリースビルドのライブラリ(vcomp.lib)を
リンクする設定にするとExpressでもOpenMPが自由に使用可能。
144デフォルトの名無しさん
2008/02/15(金) 14:05:13 たとえば、ソケットのread/writeのwait待ちをやっているslect(poll)のようなもので
while(1)
#pragma omp parallel sections
{
#pragma omp section
read後その処理
#pragma omp section
write後その処理
}
で、ここで、暗黙のwaitがかかると思われるが、select的な使い方って、出来る?
sectionの跡にnowaitをいれといたらよいだけ?
while(1)
#pragma omp parallel sections
{
#pragma omp section
read後その処理
#pragma omp section
write後その処理
}
で、ここで、暗黙のwaitがかかると思われるが、select的な使い方って、出来る?
sectionの跡にnowaitをいれといたらよいだけ?
145デフォルトの名無しさん
2008/02/15(金) 14:26:50 nowaitを入れた場合、どのスレッドが生き残るのでしょうか?
それとも、並列実行するところはすべて子スレッドで、実行中のスレッド数が最大より1少なくなった時点で
メインスレッドが継続されるのでしょうか?
それとも、並列実行するところはすべて子スレッドで、実行中のスレッド数が最大より1少なくなった時点で
メインスレッドが継続されるのでしょうか?
146デフォルトの名無しさん
2008/02/15(金) 16:42:54 read/writeのtimeoutを入れておけば、なんとかなりますか。
しかし、openmp(のsections)では、スレッドは、死にますか?
一応、処理が終われば、lockが外れるだけでしょう(gccの実装ではそのようです)
しかし、openmp(のsections)では、スレッドは、死にますか?
一応、処理が終われば、lockが外れるだけでしょう(gccの実装ではそのようです)
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 東京の自販機そばに金塊4200万円分、何者かに持ち去られる…札幌の50代が8000万円振り込んだ後に上京して被害 [どどん★]
- 山田邦子 ひょうきん族時代の年収は12億円「ただ税金が80%」 [muffin★]
- 中国・ロシア両軍の爆撃機が東京方面へ向かう「異例のルート」を共同飛行…核も搭載可能、連携して威嚇か ★7 [ぐれ★]
- 【東京】「家族で話題にして」 “世田谷一家殺害から25年 警視庁が呼びかけ [煮卵★]
- 【沖縄】開業4ヵ月でこれは…“国民の税金”投入の『ジャングリア沖縄』で見た衝撃的な光景と、モチベーションが低い一部スタッフの現状 [ぐれ★]
- 【鹿児島】容疑者は大学生。国道3号を横断中の母娘を車ではねる――「太陽がまぶしくて見えなかった」。20歳女を現行犯逮捕 日置署 [ぐれ★]
- 小野田紀美、同党議員の熱愛報道に「不潔...」と嫌悪感を漏らす... [856698234]
- 高市早苗「定数削減とかすると思ってたの???笑」漢一匹吉村「ざっけんな」反旗を翻す [245325974]
- ソーラー発電所の地下に大量の産廃、事業者「工事会社に任せているので、わからない」…この国はこんなのばっかや [668970678]
- ルーナイト第1条!誰よりルーナ(・o・🍬)が好きな人~🙋🏡
- とんかつ作りたいけどめんどくさい
- 高市「たまたま私が支部長だった。高市早苗に対する献金ではない」→自分の公式サイトで、ガッツリ寄付を呼びかけていた事が判明 [594040874]
