マルチスレッドプログラミング相談室その9

**デフォルトの名無しさん** · 2014/02/28(金) 06:26:56.06

まずグリーンプロセスとグリーンスレッドの違いを説明してほしい。

**デフォルトの名無しさん** · 2014/02/28(金) 22:47:18.43

グリーンスライムよりは手強そうなイメージ

**デフォルトの名無しさん** · 2014/03/01(土) 06:43:57.25

グリーンプロセス()

**デフォルトの名無しさん** · 2014/03/01(土) 13:24:07.27

このスレはカーネルレベルでの実装オンリーのスレになりました、ってことでFAね。
あるいは「カーネル型」のw

**デフォルトの名無しさん** · 2014/03/01(土) 13:27:09.68

まだいるのかグリーンスレッド君

**デフォルトの名無しさん** · 2014/03/01(土) 14:11:27.38

まだいるのかカーネル至上主義者君

**デフォルトの名無しさん** · 2014/03/01(土) 14:14:20.18

v-sync割り込みでマルチタスクだお～
DOS至上主義者が通りますよ～

**デフォルトの名無しさん** · 2014/03/01(土) 19:50:36.19

[要出典]

**デフォルトの名無しさん** · 2014/03/01(土) 21:16:37.40

>>255
マウス用割り込みの方が良い。

**デフォルトの名無しさん** · 2014/03/02(日) 21:38:31.73

マウスの付いてるパソコンはカッコ悪い

**デフォルトの名無しさん** · 2014/03/02(日) 21:41:29.98

わーるかったな

**デフォルトの名無しさん** · 2014/03/06(木) 00:31:59.51

マルチスレッドって使えるところが限られてる

**デフォルトの名無しさん** · 2014/03/08(土) 13:27:50.88

これからマルチスレッドの勉強をしようと思うんだけど、
参考になるサイトとかコードとかを教えて欲しい。

特にワーカスレッドを複数立て、たくさんのデータブロックを順に渡して処理させるようなサンプルとか。
ネットを検索しても、スレッドが延々と動きつづけるか、処理が終われば使い捨てるものばかりで、
処理の終わったワーカスレッドに次のデータを渡して連続して処理させるものが見つからない。
また、可変長の演算結果を親スレッドに返す方法についても、どうすればいいのやら。
１個の結果データは固定長だけど出てくる個数が可変なので、固定長の電文を複数投げるようなイメージでも可。

動作環境はWin7-x64で、VC++を使いマルチコアCPUのコア数分ワーカスレッドを立てようと思う。
うちのは６コアなので、単純計算で６倍弱には高速化できると思う。

処理内容の原理試作としてシングルスレッドのDOSアプリとして組んで、鍵値に５を与えて動かしてみた結果、
データブロック数は３２０万個余り、データブロック１個あたりの演算結果はゼロ～100KBと幅があるw
そして総処理時間の見込みは60～150時間（まだ終わってない）。
鍵値を６にするとブロック数も処理時間も莫大に跳ね上がるから、
たぶん１台のPC内で完結させようとしても終わらない。

◆0uxK91AxII · 2014/03/08(土) 15:25:57.27

使い捨てと使い回しで、クロックにして1k~2kくらいの差が有るかどうかだから、使い捨てでＯＫ。

**デフォルトの名無しさん** · 2014/03/08(土) 15:49:40.12

HotspotVMは？
と無茶振りしてみる

**デフォルトの名無しさん** · 2014/03/08(土) 15:57:35.44

VCならOpenCLかC++AMP使えば良いんじゃね
CPUとGPUで切り替えも出来るし
CPUだけならPPLでも

**デフォルトの名無しさん** · 2014/03/08(土) 16:20:54.15

VS2013か2012で、C++11のstd::threadとblockingできるqueueとstd::futureあたりを使えばいいんじゃないかな。

**デフォルトの名無しさん** · 2014/03/09(日) 12:57:11.91

>262-265
ﾄﾝ

スレッドの使いまわしについて、ちょっと説明が言葉足らずだったかな。
やりたいのは最初にｎ個を起動するのまでは同じなんだけど、
データブロックを１個処理し終わったら次のデータブロックを処理させることで
全てのデータブロックを処理し終わるまでｎ個を実行している状態を維持したい。
（実際にスレッドをループさせるか破棄／生成を繰り返すかは重要ではない。）
ググって見つけたサンプルは、ｎ個のスレッドを最初に起動して、
ｎ個全てが終わるのを待って次の処理（結果表示とか）に進むような使い方のばっかりで、
起動したうちの１個でも終わったら次の処理をやってまた１個終わるのを待つ、みたいなのが見つからない。

開発環境については、実は結構古いのしか持ってない……
ので、これからVS2013の評価版をDLして試してみようと思う。

現状のx86コード、シングルスレッドでどうやら鍵値５の処理を70時間以内で終われそうな予感。
処理結果のファイルを分割し過ぎて恐ろしい数のファイルを生成しちゃってるので、
マルチスレッド化の際にはもっと纏めてしまわないとなぁ。
鍵値６は複数台のPCへの分散処理とかGPU処理とかを真面目に考えないと無理そうだけど。

**デフォルトの名無しさん** · 2014/03/09(日) 17:54:14.90

そこまで仕様が決まってるならさっさと書けよって話だが。

**デフォルトの名無しさん** · 2014/03/09(日) 19:14:48.84

自慢

**デフォルトの名無しさん** · 2014/03/09(日) 19:44:21.54

なんの？ｗ

**デフォルトの名無しさん** · 2014/03/09(日) 21:24:29.64

典型的なコード書けない君だったか。

**デフォルトの名無しさん** · 2014/03/09(日) 21:29:22.95

>>261
OpenMPのparallel forで分割するだけでおｋ

**265** · 2014/03/10(月) 02:53:54.21

>>271
もしも、それで済む用件だったら、一番楽だね。
VS2012と2013なら、無料版でもOpenMP使えるし。
手元のコードでOpenMPでforループ2048周をi7-3760Xで6倍速度くらい。
CUDAで780Tiで2048*2048cudaスレッドでさらに18倍くらいだった。

**デフォルトの名無しさん** · 2014/03/10(月) 06:30:44.63

266の処理は、OpenMPのparallel for schedule (dynamic)でできる

**デフォルトの名無しさん** · 2014/03/10(月) 12:00:01.04

ここはおまえの日記じゃねーぞ。

**デフォルトの名無しさん** · 2014/03/10(月) 17:32:15.14

スレッドの数って
CPUのコア数より多くしても意味ないよね？

**デフォルトの名無しさん** · 2014/03/10(月) 17:42:02.40

>>275
スレッド内の処理でI/O待ちとかしてる場合は意味あるんじゃないの？

**デフォルトの名無しさん** · 2014/03/10(月) 18:28:34.27

ひたすら計算し続けるなら意味はない。
計算メインというだけならコア数の倍ぐらいまでは
スループットが上がることはある。

**デフォルトの名無しさん** · 2014/03/10(月) 19:11:36.58

書きたいアルゴリズムを自然に書けるという理由で
マルチスレッドに意味があることはある
GUIなんかそうだろうね

**デフォルトの名無しさん** · 2014/03/10(月) 19:22:36.70

そんなGUIの実装は見たこと無いです。

**デフォルトの名無しさん** · 2014/03/10(月) 19:40:06.12

GUI スレッドと別に好きなスレッドを立ててうまくやっていけるってことだろうに‥‥
win16 の泣きそうな世界を知らないのか？

**デフォルトの名無しさん** · 2014/03/10(月) 19:46:18.78

それはCUIでも同じだろう。

**デフォルトの名無しさん** · 2014/03/10(月) 21:47:19.99

処理内容・数によるけど大量のパラ処理はCPUのマルチコアやNvidiaのGPGPUからAMDのGPGPUでopenCLが定番になってきたからな
そして、今後はAMDのHSAも定番になるって感じになっているし。

**デフォルトの名無しさん** · 2014/03/11(火) 17:20:13.24

いつGPGPUが定番になってきたんだ。
むしろまじ使えないってスルーされてる感が半端ない。

**デフォルトの名無しさん** · 2014/03/11(火) 20:17:22.02

それは nvidia/cuda

**デフォルトの名無しさん** · 2014/03/13(木) 20:09:50.61

インテルのやたらコア数が多い奴にビットコイン掘らせたらよさげよね

**デフォルトの名無しさん** · 2014/03/13(木) 20:31:14.10

GPGPUは特定の局面に限って言えば使えるんだが、一般の用途では
その特定の局面が存在しないというかわいそうな技術。

**デフォルトの名無しさん** · 2014/03/13(木) 20:32:14.41

ちなみにbit coinのマイナーはGPGPUから専用設計のASICに
主戦場が移った。消費電力が段違いなんだとさ。
GPUでやったら電気代で赤字になりそうだ。

**デフォルトの名無しさん** · 2014/03/13(木) 20:49:30.32

>>287
特定用途のみならICにしたほうが良いだろうな。

確かbitcoinでよく使われていたVGAはAMDだったはず。
ゲーム用VGAのGPGPU性能はいまはAMDのほうが良いのかな

**デフォルトの名無しさん** · 2014/03/13(木) 21:06:24.71

FPGA経由でASICな。

しかも最近じゃあ、専用マシン（アクセラレータ？）を手に入れても、掘るより転売するほうが儲かるとかw

**デフォルトの名無しさん** · 2014/03/13(木) 22:02:39.26

で、自販機の下に落ちてる100円玉を地道に拾うぐらいなら
ショベルカーでATMごと盗んじゃえってのがマウントゴックス。

**デフォルトの名無しさん** · 2014/03/13(木) 22:18:30.00

>>290
ﾜﾗﾀ、でもまさにソレ
MtGoxってMTGのカード売りだったと知った時の苦笑いときたら

**デフォルトの名無しさん** · 2014/03/14(金) 16:35:28.14

2年ほど前にbitcoin採掘をしていたが
お前らの想像の千倍くらい時間のかかる処理だったし
今もっと難しくなってるから既に個人で掘るのは無理なんじゃね

**デフォルトの名無しさん** · 2014/03/14(金) 16:57:23.89

で、結局どのくらい掘れた？

**デフォルトの名無しさん** · 2014/03/14(金) 17:00:16.55

千倍台で分散する

**デフォルトの名無しさん** · 2014/03/14(金) 17:37:55.81

>bitcoin採掘
どういうこと？

**デフォルトの名無しさん** · 2014/03/14(金) 17:57:18.99

>>295
むちゃくちゃ簡単に言うとBitCoinの正規のビットパターンは計算で求まる、でこれの正しい組み合わせを計算する事を採掘(マイニング)って言うだけの話

**デフォルトの名無しさん** · 2014/03/14(金) 17:59:12.49

>>296
ありがとん

**デフォルトの名無しさん** · 2014/03/15(土) 00:32:35.88

ちょいと相談。

データ処理とファイルI/Oを別スレッドに分けてstackを介してやり取りしてるんだけど、
気がつくとやたらメモリを食ってることがある。
調子のいいときは数ＭＢしか食わないのに、最悪は2GB食って落ちることもある。

ファイルの生成の様子なんかを観察してる限りで、２つの原因を想像。
A）処理済みデータをstackに積むのに比べてファイルに書き出す処理が追いついていない
B）stackがバカスカとメモリを確保している

ファイル書き出しのスレッドの内部処理は、共用stackからローカルstackにコピーして、
コピーが終わった時点で共用stack占有状態を開放、ローカルstackを順次書き出すようにしている。

Aは大量にデータを溜めることの無いようにファイル書き出しの頻度を上げる方法について、
Bはメモリを無駄に食わない方法について、アドバイスを聞きたい。

stackを使ったのはqueueに比べて頭が固定な分だけメモリの利用効率が高そうだったことと、
データの順番には意味がないから逆順になっても問題がないことによるものなので、
別のコンテナを使ったほうがいいなら、それでも構わない。

**デフォルトの名無しさん** · 2014/03/15(土) 00:45:28.81

>>298
そもそも一旦メモリに載せる必要があるのか？非同期IOじゃだめ？
どうしても載せなきゃいけないとして、Aはあまり意味がない。
よほど頭の悪い実装をしてなければ、現状メモリを喰ってるってことは
inputよりoutputの方が遅いってことだ。頻度で解決する問題じゃない。
Bの方は、conditon variableでスタックのサイズが一定より大きくなったら
inputを待たす方法が一番簡単じゃないか。

◆0uxK91AxII · 2014/03/15(土) 01:15:15.11

＞調子のいいときは数ＭＢしか食わないのに、最悪は2GB食って落ちることもある。
常識的に考えてバグ持ち。

＞コピーが終わった時点で共用stack占有状態を開放、
ふつーstack<void *>。

**デフォルトの名無しさん** · 2014/03/15(土) 08:03:00.01

バッファに制限を設けて
書き込みが詰ったら待てばいいだけでは

**デフォルトの名無しさん** · 2014/03/15(土) 08:17:50.21

リングバッファ、そして新しいバグ

**デフォルトの名無しさん** · 2014/03/15(土) 08:31:05.02

リングバッファてメモリが一杯になったらファイルに書き出すように実装するのが普通？

**デフォルトの名無しさん** · 2014/03/15(土) 12:26:30.58

普通じゃない

**デフォルトの名無しさん** · 2014/03/15(土) 13:36:30.86

どうすんの？あふれたら捨てるの？

**デフォルトの名無しさん** · 2014/03/15(土) 13:43:41.30

環境によっては勝手にswapしてくれるかもしれない

**デフォルトの名無しさん** · 2014/03/15(土) 14:07:58.75

>>305
ふつうは>>301の言うように空くまで書き込みを待たせるか捨てる。
待てないような要件ならサイズ固定のリングバッファじゃなく可変のキューを使うなりする。

**デフォルトの名無しさん** · 2014/03/15(土) 14:16:36.02

書き出すデータのフォーマットを工夫してサイズを小さくするとか、
書き込み先をSSDにしたりとか、動作環境のスペックを見直すという手も。

**デフォルトの名無しさん** · 2014/03/15(土) 14:17:30.95

>>307
ありがとう、バッファーの構造を別にして最大容量は設定しないといけないということですね

>>306
後出しになるけど、リアルタイムシステムのデータ収集のようなもの考えていたので

**デフォルトの名無しさん** · 2014/03/15(土) 16:35:55.25

いるんだよなー、そもそも不可能なことを引き受けちゃう奴って

**デフォルトの名無しさん** · 2014/03/15(土) 20:31:13.52

てへ、昔の話がねた

**デフォルトの名無しさん** · 2014/03/15(土) 22:04:58.47

金あるならFusion-ioを使えばいい
圧縮で減るようなデータならsnappyで圧縮する

**デフォルトの名無しさん** · 2014/03/15(土) 23:24:57.03

普通のリアルタイムではありえん

**313** · 2014/03/15(土) 23:26:35.57

訂正　以上です

**デフォルトの名無しさん** · 2014/03/16(日) 01:00:35.01

リアルタイムシステムというのがRTOSを使っているという意味なら
送信側か他のタスクがwait入れてなくて書き込みタスクが動いていないとかってバグじゃないかな
>>313
時代は変わりCPUを使って圧縮したほうがIOが減って低レイテンシにできる

**デフォルトの名無しさん** · 2014/03/16(日) 01:13:20.61

リアルタイムっていうのは入力があってから何ms以内に応答を
返せなければならないみたいなシステムのことでしょ。
コンピュータ制御の工作機械で応答が遅くて削りすぎましたとか
許されないから。

**デフォルトの名無しさん** · 2014/03/16(日) 01:14:58.23

>261だけど、概ね期待通りの動作になってきた
速度面でも、現在使用中のPCでシングルスレッドだと70時間ほど掛かってたから、
マルチスレッド化で６コアに分散して細部の調整込みで10時間切れれば恩の字と思ってたのに、なんと４時間半を切れたw
最新のCPUを使えば２時間も夢じゃないかも

あとは演算処理orデータのやり取りのバグを潰せばほぼ完成
（結果の個数が少し足りない）

**デフォルトの名無しさん** · 2014/03/17(月) 12:29:47.16

シングルスレッドのまま細部の調整とやらだけでどこまで行くのやら

**デフォルトの名無しさん** · 2014/03/17(月) 15:11:57.25

どんだけ時間がかかってるのやら。

**デフォルトの名無しさん** · 2014/06/13(金) 00:28:43.87

共有/排他ができるロックと条件変数があるとき、これらを使って
共有から排他にエスカレーションできるロックを構成することってできる？

**デフォルトの名無しさん** · 2014/06/13(金) 01:34:28.10

ロックとか条件変数って排他するものだよね。共有できるロックって何？
RCUのこと？

**デフォルトの名無しさん** · 2014/06/13(金) 08:49:59.19

ええと、いわゆるread-writeロックのこと。

**デフォルトの名無しさん** · 2014/11/06(木) 22:37:47.07

マルチスレッドは馬鹿には無理
馬鹿は使ったほうがいいところでマルチスレッドを使わずに
使わないほうがいいところっ使ってややこしくしたりする

**デフォルトの名無しさん** · 2014/11/06(木) 23:24:42.11

負荷分散とか難易度高なのにね

**デフォルトの名無しさん** · 2014/11/09(日) 01:27:34.76

スレッディング・ビルディング・ブロックについて勉強し始めた所なんだけど、どうなの？
理解して使うと安全で早くなりそうだとは思ったが、メモリ処理の効率とかどうなるんかな？
とか思ってる所なんだけど・・・

**デフォルトの名無しさん** · 2014/11/09(日) 07:37:34.59

安全にするには、ある程度やった人しか...

**デフォルトの名無しさん** · 2014/11/09(日) 22:48:01.80

メモリ処理の効率って具体的にどういう点？
mallocとかのメモリ管理の効率？それともキャッシュヒット率のような意味？

**デフォルトの名無しさん** · 2014/11/10(月) 09:36:09.81

オライリーのTBBの本買ったけど途中まで読んで放置してたｗ
ラムダ式を使えばoperator()使わなくていいなら改めて勉強しなおそうかな

>>325
コンカレントコンテナとかは並列にメモリ割り当てしたり、キャッシュラインの競合を考慮した
アロケータを持ってるみたいだから、自前でやるのと変わらないぐらいにはなってるんじゃない？
TBBの本も中古ならかなり安いから買ってみるといいよ

**デフォルトの名無しさん** · 2014/11/12(水) 14:11:39.04

基礎的な質問で申し訳ないのですが
同じ変数に複数のスレッドがアクセスしてはいけないのはわかりますが
同じコードに複数のスレッドがアクセスするのはいいのでしょうか？
例えば何の変数にもアクセスしない関数を複数のスレッドが同時実行するのはいいのでしょうか？

**デフォルトの名無しさん** · 2014/11/12(水) 14:21:32.89

ダメな理由でも探してるの？

**デフォルトの名無しさん** · 2014/11/12(水) 14:31:27.32

>>330
今書いているプログラムで
C#の関数の中でシグナルを使っているのですが
他のスレッドからその関数を呼ぼうとするとエラーが起こるのです・・・
もしかしたら関数自体にシグナルをかけなければいけないのかなぁと思って

**デフォルトの名無しさん** · 2014/11/12(水) 14:35:31.55

C#のシグナルってよーしらんけど
エラーが出るってことは、質問の内容と違うことやってるんじゃないの

**デフォルトの名無しさん** · 2014/11/12(水) 15:18:29.39

同期オブジェクトを保持している変数を上書きしていそうな気がするんだが

**デフォルトの名無しさん** · 2014/11/12(水) 16:32:42.96

いろいろ分かってないだけだろう

**デフォルトの名無しさん** · 2014/11/13(木) 06:29:27.90

ライブラリがマルチスレッドに対応してないだけかと

**デフォルトの名無しさん** · 2014/11/13(木) 06:35:25.00

/MT

**デフォルトの名無しさん** · 2014/11/13(木) 13:44:55.73

C#ならエラーメッセージやスタックトレースが出てるだろ

**デフォルトの名無しさん** · 2014/11/15(土) 11:02:51.29

>>329
同じ関数は実行するのは、スレッドが違えばコンテキストスイッチが起きて、レジスタとかスタックが入れ替わるから大丈夫
メンバ変数とstatic変数さえ使わなければ何個起動しても排他も何も考えなくてよいぞ

**デフォルトの名無しさん** · 2014/11/16(日) 00:17:15.94

同じ変数に複数のスレッドがアクセスするならクリティカルセクションが楽だ

**デフォルトの名無しさん** · 2014/11/16(日) 19:55:00.63

linuxですがスレッドで同じファイルに書き込む場合、競合することってありますかね？

**デフォルトの名無しさん** · 2014/11/16(日) 20:11:07.08

勿論。

**デフォルトの名無しさん** · 2014/11/16(日) 21:20:39.95

論外

**デフォルトの名無しさん** · 2014/11/16(日) 21:40:57.77

>>339
もう win32 のクリティカルセクションとイベントオブジェクトでおなかいっぱい、というかこれだけでたいがいうまくいくのでは？

**デフォルトの名無しさん** · 2014/11/30(日) 17:47:06.48

複数のスレッドがひとつのミューテックスのアンロックを待っていた場合、
つぎにどのスレッドがミューテックスを取得するかはランダムですか

**デフォルトの名無しさん** · 2014/11/30(日) 18:09:41.22

はい
待っていなかった別のスレッドがちょうどいいところに来てミューテックスを取得していくこともあります

**デフォルトの名無しさん** · 2014/12/01(月) 00:39:51.39

いいえ
待っていなかった別のスレッドがちょうどいいところに来てミューテックスを取得していくこともあります

**デフォルトの名無しさん** · 2014/12/08(月) 19:13:20.61

スレッドとミューテックスだけ覚えたけど
なにを作ったらいいのかわからんたい

**デフォルトの名無しさん** · 2014/12/08(月) 22:37:39.16

チャット作ることにしました

**デフォルトの名無しさん** · 2014/12/08(月) 22:57:10.96

consumerとproducerみたいのがいいんじゃないのかなと思ったけど、
チャット作ることにしたのね
がんばってください

**デフォルトの名無しさん** · 2014/12/08(月) 23:08:56.71

>>349
チャットで詰まったら気分変えてConsumer-Producerにも挑戦してみます
あざす

**350** · 2014/12/09(火) 00:23:00.21

>>349
いや、ありがとうございます

**デフォルトの名無しさん** · 2015/05/29(金) 22:45:34.32

Win8.1 Cygwin64bit g++のpthreadなんですが、マルチコアCPUなのに性能改善しません。
なにか特別なコンパイルオプションがあるとか
特別なライブラリをリンクしなければいけないとかあるのでしょうか。
-lpthreadはつけてます。

**デフォルトの名無しさん** · 2015/05/30(土) 20:09:50.25

エスパー能力はありません

**デフォルトの名無しさん** · 2015/05/30(土) 20:21:35.33

そこをなんとかスーパーエスパーでお願いします

**デフォルトの名無しさん** · 2015/05/30(土) 21:18:52.04

誠意を見せてください

**デフォルトの名無しさん** · 2015/06/15(月) 23:17:16.10

DISKへのアクセスって並列にしたって意味ないですか？

・・・
FileA読み込み(::ReadFile)　１０秒
FileB読み込み(::ReadFile)　２０秒
・・・

で３０秒以上掛かりますが、
之をスレッドを起こしても意味無い？

**デフォルトの名無しさん** · 2015/06/16(火) 00:49:42.46

よくわかってないけどDISKの特性によるのかなぁとかいってみる。

**デフォルトの名無しさん** · 2015/06/16(火) 01:06:01.70

どういった特性ならどうなるのですか？

**デフォルトの名無しさん** · 2015/06/16(火) 01:31:46.58

読み込みながら処理をしてみたいにな状態でない限りスレッド分けてファイル読むと遅くなるよ(デバイスが別であればまた違うのだが)
純粋にバイナリデータとしてファイルをメモリに丸ごと読み込むのであればスレッド分ける意味ない(CPUとメモリの方がディスクよりも遙かに速い)

**デフォルトの名無しさん** · 2015/06/16(火) 01:39:58.55

遅くなる理由はなんですか？

**デフォルトの名無しさん** · 2015/06/16(火) 09:26:39.31

俺様の質問に答えろとさ

**デフォルトの名無しさん** · 2015/06/16(火) 22:30:15.77

まともに答えるとまた暴れだすだろ

**デフォルトの名無しさん** · 2015/06/20(土) 17:07:37.08

>>360
FileAとFileBが同一のディスクに存在するとして、FileAがFileBが以下の
内容である場合、論理的に近いデータ(青森県と岩手県)は論理的に遠いデータ
(宮城県と長崎県)よりも物理的にディスクの近い位置に存在する可能性が
高いので、02→03→…→07→40→41→…→46という順番で読み込むほうが
02→40→03→41→…07→46という順番で読み込むよりも速く完了する可能性が
あります。

[FileA]
02青森県
03岩手県
04宮城県
05秋田県
06山形県
07福島県

[FileB]
40福岡県
41佐賀県
42長崎県
43熊本県
44大分県
45宮崎県
46鹿児島県

**デフォルトの名無しさん** · 2015/08/25(火) 15:16:47.83

いまどきのディスクはインターリーブなんか考慮しても意味無いぞ

**デフォルトの名無しさん** · 2015/08/25(火) 23:23:52.89

>>364
インターリーブってCPUが遅い時代の話だろ？
セクタリードの後でCPUが処理している間に次に読むべきディスク上の物理セクタが通り過ぎてしまうからシーケンシャルなセクタ処理でなくインターリーブした順序付けのセクタ使うって奴

**デフォルトの名無しさん** · 2015/10/10(土) 23:10:25.42

趣味プログラムでInterlockedCompareExchange
で値が交換できた時だけそのスレッドが処理を進められるような感じで
作りこんでいるんだけど、何かこれだと問題ある？
一般的にはクリティカルセクションを使った方がいい的な話を聞くんだけど
sizeof(CRITICAL_SECTION)がチョット大きすぎるので使うのをためらってしまう

**デフォルトの名無しさん** · 2015/10/11(日) 01:12:22.19

>>366
レースする可能性があるくらいじゃね？
まあ、ほとんど問題ないと思うけど。

**デフォルトの名無しさん** · 2015/10/11(日) 01:16:20.15

>>367
間違えた。
レースじゃなくてスタベーションだった。

**デフォルトの名無しさん** · 2015/10/11(日) 10:38:15.80

マ

**デフォルトの名無しさん** · 2016/02/06(土) 07:43:27.68

int iで++iにミューテックスが必要ってことはiを同時に２つのスレッドが足しても２増えるだけで必要ないと思うんですけど？１しか増えないってこともあるんですか？

**デフォルトの名無しさん** · 2016/02/06(土) 08:26:40.76

ＣＰＵによってアトムが違うから必要ってことですねわかりました。

**デフォルトの名無しさん** · 2016/02/06(土) 08:57:53.38

御茶ノ水の博士の設計

**デフォルトの名無しさん** · 2016/03/07(月) 00:30:59.08

>>370
Aスレッド:iから1を読み込んで++して2を代入
Bスレッド:iから1を読み込んで++して2を代入
答えは1増える

**デフォルトの名無しさん** · 2016/03/08(火) 01:40:29.32

レース状態のことやね

**デフォルトの名無しさん** · 2016/03/20(日) 12:54:59.05

同じcondition_variableでブロックしているスレッドが複数ある場合に、
notify_oneをしたら、どのスレッドが起床するのだろうか。

**デフォルトの名無しさん** · 2016/03/29(火) 08:51:54.17

サッカーブッシュ日本代表日程ぷあたん（しゅっちょうまいくろ教育長交代）春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ２４チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン（販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費おじや50代資産ガリバズフィード40代エリート

**デフォルトの名無しさん** · 2016/05/20(金) 22:39:11.46

>>375
リファレンス読め

**デフォルトの名無しさん** · 2016/05/23(月) 02:01:11.63

CAS命令でロックしている部分を
_xbegin _xend やら xxx_HLEAcquireで代用すればCAS命令分のWaitをチャラにできるかと思ったんだけど
結果微妙に遅くなっただけだった
使い方間違っているのかなTSX

**デフォルトの名無しさん** · 2016/12/09(金) 07:26:48.14

マルチスレッドにおける変数の排他処理についてなんだけど、
排他制御していない状態で複数のスレッドが同じ変数に同時にアクセスすることそのものは問題ないよね？
読み取り最中に書き換えたり、書き換え最中に読み取った場合にデータが破壊されるというだけの話だよね？

例えば2byteの変数があって、スレッドAが1byte目を読み込んだ時点でスレッドBが2byte目を書き換え、
そこでスレッドAが2byte目を読み取った場合に、
データが上位1byteと下位1byteで別のデータを読み取ったことになっておかしくなるってことだよね？

ということは何らかのフラグで下位1bitのみを利用するような変数であれば、
上記のような状況は起きないから排他処理しなくても大丈夫って認識でOK？

**デフォルトの名無しさん** · 2016/12/09(金) 09:38:28.68

馬鹿乙

**デフォルトの名無しさん** · 2016/12/09(金) 13:52:04.09

>>379
>>マルチスレッドにおける変数の排他処理についてなんだけど、
>>排他制御していない状態で複数のスレッドが同じ変数に同時にアクセスすることそのものは問題ないよね？

変数というだけでは分からない。
構造体とかC++の変数とかはそちらから見ても明らかに問題のはず。

>>ということは何らかのフラグで下位1bitのみを利用するような変数であれば、
>>上記のような状況は起きないから排他処理しなくても大丈夫って認識でOK？

1bit（あるいは1バイト、1ワード)がアトミックにアクセスできる
ことはシステムによって保証されていることが多い。

だから、その1bitの読み書きは出来る。
しかし大丈夫とか問題ないかということは、何を問題とするかを
書かないと答えようがない。

1bitはこれ以上分割できないので1ビットの半分だけ違う値になる、
ということはありえない。そういう心配をしてるなら大丈夫

**デフォルトの名無しさん** · 2016/12/09(金) 16:50:23.32

ありがとう！
大丈夫かどうかというのは、
排他制御が行われていない変数へのアクセスそのものが原因となってソフトウェアがクラッシュしたり、
OSやハードウェアレベルの問題は起きたりしないよね？って意味

C言語で下位1bitしか使わない排他処理が行われてない変数があり、その1bitをif文で判定して処理を2通りに分ける場合、
必ずその2通りのどちらかになることは保証されるよね？
できるだけ高速化したいから、できるだけ排他処理はしたくない。

**デフォルトの名無しさん** · 2016/12/09(金) 18:10:37.82

やっぱりアホか

**デフォルトの名無しさん** · 2016/12/09(金) 18:37:52.31

>>382
馬鹿が書くと機械的に壊れることもあります
ソレノイドが焼損とか日常茶飯事

**デフォルトの名無しさん** · 2016/12/09(金) 21:27:34.75

>>384
どのパーツのソレノイド？
説明してくれ。
パソコンは自作やら修理やらよく頼まれ続けてきてるから専門的な話OKだ。

**デフォルトの名無しさん** · 2016/12/10(土) 23:59:30.12

すいません質問します。
Matlobで、
例えば５０００×５０００の行列をAとして
その１０×１０の区分行列をBとします。
Aの対角線上にあるBだけを取り出して他が０行列の行列を作るにはどうすればいいですか？
また、各Bの対角要素だけ取り出すにはどうすればいいですか？

**デフォルトの名無しさん** · 2016/12/11(日) 00:44:10.55

・とりあえず全てのパラメータから0を１つずつ取り除く
・Aは500×500の行列
・Bはたった1つの要素で、インデックスは i = j
　それが500個ある
・つまり、「i==jであれば取り出す」それ以外は0にする。
・では、それを10倍したら？「 i ÷ 10 == j ÷ 10 」であれば、
　取り出す（但し余りは全て切り捨てる）それ以外は全て 0
・但し i jの上限はインデックスが0からとして、4999までとする。
・俺はMatlabは使ったことが無いので具体的な実装は知らない。

・その次
・i と jの上限は 4999
・対角の部分行列は簡単、「i == jならば」取り出す。
・その右は、「i == j + 10 」も該当
・同様に、「i == j + 20, 30 ... 10*n ... 10*499」も該当
・同様に、「 i + 10 == 」も該当
・「i + 20, 30 ... 10*n ... 10*499 == j 」も該当
・「該当しなかったもの」はその都度0を代入する

**デフォルトの名無しさん** · 2016/12/11(日) 09:12:59.03

アホ

**デフォルトの名無しさん** · 2016/12/11(日) 10:53:35.53

>>387
ありがとうございます。やってみます。

**デフォルトの名無しさん** · 2016/12/17(土) 10:53:31.14

>>381
ウソ乙

**デフォルトの名無しさん** · 2017/03/29(水) 21:36:43.88

【ＯＳ】OSX 10.8.5、Core i5
【言語】 C, C++
【実行環境】 XCode5.1, pthread

pthread を使って for ループを分割して実行するプログラムを書いたのですが、直列処理の方が速いです。
tbbやOpenMP でもやってみたのですが、直列の方が速いです。

上記の環境ではマルチスレッドで効率化を図るには、何か設定が必要なのでしょうか。
ざっくりした質問ですがヒントになるようなことでも教えて下さい。

**デフォルトの名無しさん** · 2017/03/29(水) 22:31:24.61

マカーか

**デフォルトの名無しさん** · 2017/03/29(水) 23:09:26.86

>>391
プログラムを見ないと分からない。
マカーじゃないから見ても分からないかもしれないけど。

大前提として、マルチスレッド化して速くなるようなジョブなんだよね？
スレッドを作るのもjoinするのもスイッチするのも時間が掛かるので、
それらがペイしないと意味がない。

ちゃんと作っていて遅いのなら、キャッシュの競合の可能性があるかも

**デフォルトの名無しさん** · 2017/04/02(日) 18:18:24.01

tbbのくっそ初心者です。
下記のコードを試したのですが、直列実行した方が速かったです。
これってそもそも並列化しても速くならない類の処理なのでしょうか？

int main( int argc, const char * argv[] ) {
tbb::task_scheduler_init init( 4 ); //　物理２スレ、論理4スレ core i5
PrimeCounter counter;
tbb::parallel_reduce( tbb::blocked_range< int >( 0, count__, count__ / 4 ), counter, tbb::simple_partitioner() );
}

他所のヘッダにて、

bool isPrime( int n ) { // この処理がアホみたいなのはわざとです
if ( n < 2 ) return false;
if ( n == 2 ) return true;
for ( int j = 3; j < n; ++j ) { if ( n % j == 0 ) { return false; } }
return true;
}

class PrimeCounter {
public:
int count;
PrimeCounter() : count( 0 ) {}
PrimeCounter( const PrimeCounter& instance, tbb::split ) : count( 0 ) {}
void operator() ( const tbb::blocked_range< int >& range ) {
for ( int i = range.begin(), end = range.end(); i < end; ++I ) {
if ( isPrime( i ) ) { ++count; } }
}
void join( const PrimeCounter& pc ) { count += pc.count; }
};

**デフォルトの名無しさん** · 2017/04/02(日) 18:29:20.77

書き忘れ >>391 のマカーです。

**デフォルトの名無しさん** · 2017/04/02(日) 18:45:45.15

度々すみません、タイポありました。（多分本筋と関係ないですが）
関数 bool isPrime( int n ) のループ。
　誤　for ( int j = 3; j < n; ++j )
　正　for ( int j = 2; j < n; ++j )

**デフォルトの名無しさん** · 2017/05/03(水) 16:23:24.52

RelativisticProgrammingを日本語で解説してるとこ、ないかな？

**デフォルトの名無しさん** · 2017/05/04(木) 03:11:44.69

++j

**デフォルトの名無しさん** · 2017/09/17(日) 19:09:14.78

#include <stddef.h>
offsetof(type, member-designator);

**デフォルトの名無しさん** · 2018/05/23(水) 21:43:17.32

僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

4DXJZ

**デフォルトの名無しさん** · 2018/07/05(木) 00:17:03.60

Z1B

**デフォルトの名無しさん** · 2018/10/28(日) 23:21:28.63

>>394
超亀レスだしﾃｷﾄｰだけど、counterがシングルトンなら
countのインクリメントでシリアライズされるんじゃね？

**デフォルトの名無しさん** · 2019/01/13(日) 12:43:26.12

Intelのハイパースレッドでスケールするか否かのアルゴやデータ構造のパターンとか、評価基準をまとめた本なりサイトなり御存じでしたら教えてください。

**デフォルトの名無しさん** · 2019/01/26(土) 17:42:01.46

400MBのデータを一括でコピーする処理を並列化してもノイマンボトルネックに掛かってスケールしないと思うんですが、boolの配列(newしたもの)でやるとある程度スケールします。
何でですか？

**デフォルトの名無しさん** · 2019/01/26(土) 18:19:40.68

>>404
bool の配列が、例えば、8個の bool 値をまとめて 1バイトとして格納している場合で、
for ( i =0; i < 100000; i++ ) {
dst[i] = src[i];
}
のように書いて、かつ、コンパイラがこのループを「そこまでの」最適化はしなかった場合、
32BIT 環境の場合なら、32回のループで 1 DWORD 分の実メモリやキャッシュ・メモリへの
転送が生じるだけになるかも知れない。その他のメモリアクセスは、基本、code の
fetch だけになり、全てCPU内部のキャッシュ・メモリに乗ってしまう。

だから、マルチスレッドでこのループを分割して行えば、32スレッドまでなら、
高速化が起きる気がする。

そういう問題でなくて？

**デフォルトの名無しさん** · 2019/01/26(土) 18:25:13.78

>>404
あ、あと
>400MBのデータを一括でコピーする処理を並列化してもノイマンボトルネックに
>掛かってスケールしないと思う

これだけど、以外に高速化されたりするかもしれない。
実際の CPUはそんなに賢くないので。

色々複雑。

**デフォルトの名無しさん** · 2019/01/27(日) 00:13:20.29

チップセットや DDR DRAM、バス・アービタなどの事はそんなに詳しくは無いけど、
「ブロック転送命令」みたいなのがあるかも知れない。そして、
CPU で、rep movsd などが実行されるとき、CPU は、自分で転送せずに
チップセットと連携してバス・アービタにその命令を発行し、すぐに次の命令
から実行を再開したりするかも知れない。昔で言う「バスマスタ転送」や「DMA転送」
に似たようなやり方。

なんでそう思うかというと、主記憶(外部メモリ)はCPUのクロック速度にはついていけない
はずなのに、以外に CPU のブロック転送が速い気がするから。

確認は取ってない。

**デフォルトの名無しさん** · 2019/01/27(日) 19:38:20.44

返信ありがとう。
DMA転送できるものをコンパイラが探知できるか疑問に思ってました。CPU機能としてのブロック転送は関係ありそうですね。
ワード単位処理は確かにやってそうです。

マルチコアでスケールできる処理って割りと限られてますね(汗。

**デフォルトの名無しさん** · 2019/01/27(日) 19:45:29.93

バイナリ見れば済む話だよね^^

**デフォルトの名無しさん** · 2019/01/27(日) 19:45:46.51

>>408
[追加]

DMAでなくとも、CPU自身が命令実行の処理とは独立して主記憶の間で
転送をする仕組みは当然あるので、ブロック転送の予約みたいな事で、
実際の転送処理が終わってなくても次の命令に進んだりするようなことは
あるかも知れないと想像してみる。

無いかもしれないけど。

**デフォルトの名無しさん** · 2019/01/27(日) 19:48:31.17

>>409
いや。例えば、バイナリだと、
rep movsd
の1命令がそこにあるだけで、命令表を見ればブロック転送をする命令とあって、
擬似命令レベルでの処理までは書かれているが、バス転送レベルでそれをCPUが
どう処理してるかまでは分からない。

**デフォルトの名無しさん** · 2019/01/28(月) 03:22:00.62

double 1GＢをコピー元のデータを加工してからコピーする場合は、どうやってもスケールしないんですかね、この話の感じからして。
書き込みタイミングが結果論でずらせるので、並列化で多少は見込みアルのかな。ーー自分で実験した方が良いですね。

**デフォルトの名無しさん** · 2019/01/28(月) 11:26:24.99

>>412
1. 「加工」が単純に N 個に分割して処理できるものなら、N core の CPU の場合は、
　　大体 N 倍高速化できる可能性がある。

2. 加工の処理を大体同じ時間がかかる N 回のステージに分割できる場合、1つずつの
　ステージを別々のCore で処理すれば、上手くすれば、大体 N 倍高速化できる。
　ステージ 1 の出力をステージ2の入力にして、ステージ2の出力をステージ3の
　入力にして・・・、という具合にするが、N が十分大きければ、高速化できる。
　 CPU 内部のスーパー・パイプラインも同じ考え方で、1つの命令をなるべく
　たくさんのステージに分割することで、1つずつのステージの処理自体は軽く
　されている。処理が軽ければロジックの入力から出力結果が出るまでの時間が
　短く出来るのでクロック数を上げることができる。これと同じことが、ソフトウェア
　の世界でも成り立つ。。

3. コピーの処理が完全に終わるのを待つ必要が無いなら、コピーを Sub Core で行えば、
　 Main Core は、待ち時間 0 で次の命令の実行に移れる。コピー後のデータを読み取る
　必要が出てきた場所で初めて、同期オブジェクトの WaitForSingleObject()、
　 SetEvent() などで Main Core が Sub Core の処理が終わるまで待機すれば良い。

**デフォルトの名無しさん** · 2019/01/31(木) 02:15:04.55

キャッシュにデータを書き込むけどメモリに書き込まない、とか
キャッシュのデータをメモリに書き込む動作をC++など言語で実装できないでしょうか。
勘でやる他ないのでしょうか。

**デフォルトの名無しさん** · 2019/01/31(木) 13:32:39.64

>>414
自分で inline アセンブラか、単体のアセンブラを使えば出来る。
ただし、VC++ の inline アセンブラを使う場合は、結局、どんなコード
になるか分からない部分があるので、アセンブリ・ソース出力オプションか、
または、IDE の逆アセンブラでコードを確認する必要があると思うが。

ただ、個人的には、それ以上に、IA32のキャッシュ制御命令は、大量の
文書を読んで理解するのが大変に思うけれど。

**デフォルトの名無しさん** · 2019/04/02(火) 09:07:07.70

>>414
intelの大体i5以上の新しい石だと
_xbegin _xend 等の1次キャッシュから下位のメモリへの
ストアタイミングをコントロールできるTSX命令群がそれっぽいかと思う

**デフォルトの名無しさん** · 2019/04/02(火) 12:22:49.68

確か、もっと古いCPUでも、
mfence や、movxxxxx 系の命令でも色々出来たと思う。

物凄い複雑なので、ちゃんと理解してないけど。

**デフォルトの名無しさん** · 2019/04/02(火) 12:29:24.16

以下のようなものも関係している。複雑すぎて理解してない。

https://xem.github.io/minix86/manual/intel-x86-and-64-manual-vol3/o_fe12b1e2a880e0ce-429.html

・WBINVD, PREFETCHh, CLFLUSH, CLFLUSHOPT,
・非一時的な移動命令(MOVNTI, MOVNTQ, MOVNTDQ, MOVNTPS,
　MOVNTPD, INVD)
・第3レベルのキャッシュ無効化フラグ（IA32_MISC_ENABLE MSRのビット6)

**デフォルトの名無しさん** · 2019/07/19(金) 00:38:16.38

質問：
ある資源を生成破棄するメーカースレッドがひとつと、その資源を使うユーザースレッドが複数ある。
メーカースレッドとユーザースレッドは排他的に資源にアクセスするが、ユーザースレッド同士は排他的でない。
どのように排他処理を実装すればよいか。

**デフォルトの名無しさん** · 2019/07/19(金) 02:31:14.72

>>419
Producer-Consumerパターンか
間にChannel挟めばちゃんと動くよ

**デフォルトの名無しさん** · 2019/07/19(金) 03:55:47.52

課題

**デフォルトの名無しさん** · 2019/07/19(金) 20:31:45.43

2コア4スレッドってCPUだと
4スレッド同時に動くの？

**デフォルトの名無しさん** · 2019/07/19(金) 21:19:16.26

動くよ
ただしハードウェアリソース的に余裕がある部分(SSEとか)位しかあまり効果がないな
マルチスレッドではやや分がある
というのはコンテキストスイッチの負荷が純粋に1/2になる
レジスタの内容をメモリに退避する回数が1/2になればそりゃ軽くなるよね
整数演算ではあまり期待しない方がいい

**デフォルトの名無しさん** · 2019/07/19(金) 22:46:03.30

同時に動いてないなら排他制御しなくていいみたいな勘違いしてそうな質問だ。

**デフォルトの名無しさん** · 2019/07/19(金) 23:08:15.01

そこまで深くは考えてなかったんだけど。
CPUコアひとつなのにどうやって2スレッド同時に動くのか不思議だったから。

**デフォルトの名無しさん** · 2019/07/20(土) 10:22:32.66

実際に鯖用CPUではHT切ってあるもんな
かえってパフォーマンスが低下するとかで
最近の例の脆弱性との絡みもある
その代わり最初からコアいっぱい積んでいる

**デフォルトの名無しさん** · 2019/07/20(土) 10:23:03.60

×切ってある
◯BIOSで自分で切っている

**デフォルトの名無しさん** · 2019/07/20(土) 12:15:42.11

on/offをアプリ側で指定できないし、
性能が線形に上がらない時点でHTを考慮した設計は面倒すぎる。

**デフォルトの名無しさん** · 2019/07/20(土) 13:01:11.01

マルチスレッド・デザインパターンの本にあった例だけど
ワーカースレッド(スレッドプール)を実装せよ
なお言語は自由とする

**デフォルトの名無しさん** · 2019/07/20(土) 22:48:42.36

マルチスレッドの解説本はいくつもあるけど
マルチプロセッサのプログラミングって参考書ないのかね。

**デフォルトの名無しさん** · 2019/07/21(日) 00:29:38.70

マルチスレッドの解説本でカバー出来ないくらいのマルチプロセッサのプログラミングだと
かなりマニアックというかプロセッサ固有の問題の割合が大きくなると思うので
そういう方面で探すしかないのではないか
それだけに特化した専門書は無いかもね

**デフォルトの名無しさん** · 2019/07/21(日) 00:46:58.94

行列演算を並列処理とかそういう粒度の細かな並列化の話ばっかりで。
せっかく10コアとかあるんだから、各コアに別々のプログラムを走らせておいて
同期しながら処理とかしたいんだけどどうするのがいいかよく分からない。
fork させてメッセージやりとりすれば良さそうなんだけど。
やりたいことがちょっと特殊かもね。

**デフォルトの名無しさん** · 2019/07/21(日) 01:03:16.42

質問の低レベル化が甚だしい。アセンブラを勉強して基礎固めを。

**デフォルトの名無しさん** · 2019/07/21(日) 01:24:11.69

OpenMPみたいなのを手動でやるって話かな
マルチコアだとメモリ帯域がボトルネックになりやすいから
巨大な行列計算は少し粒度を荒くしたMPIの方が強いよね

**デフォルトの名無しさん** · 2019/07/21(日) 01:57:36.05

10コアとかいってるからマルチプロセッサというよりメニーコア活用術？

**デフォルトの名無しさん** · 2019/07/21(日) 08:19:29.20

>>433
むしろアセンブラのほうが分かりやすいんだけど。

各コアにPCセットして起動すればいいの？
プロセッサの仕様書読んでみるわ。

**デフォルトの名無しさん** · 2019/07/21(日) 08:23:47.17

並列処理じゃなくて並行処理で探せば

**デフォルトの名無しさん** · 2019/12/05(木) 19:00:58.65

マルチスレッドの排他処理で詰まってスレ検索して来てみたけどこのスレは高尚過ぎるなｗ
初心者スレにでも行こう

**デフォルトの名無しさん** · 2021/03/04(木) 23:27:05.69

_beginthreadex() を使ったマルチスレッドプログラムについて質問です。
この関数の説明を見ると、「_beginthreadex() のコールに成功すると、スレッドのために
タイムスライスが割り当てられたか否かによらず、スレッドはアクティブ(non-signal)になる」
とあったのですが、_beginthread() がスレッドハンドルを返すよりも前にスレッド関数内の
処理が実行される（完了する）ことはありえますか？

**デフォルトの名無しさん** · 2021/03/05(金) 15:45:04.28

>成功した場合、これらの各関数は、新しく作成されたスレッドへのハンドルを返します。ただし、新しく作成されたスレッドが短時間で終了した場合、 _beginthread は有効なハンドルを返さない可能性があります。 (「解説」の説明を参照してください)。

>_Beginthread よりも _beginthreadex を使用する方が安全です。 _Beginthread によって生成されるスレッドが短時間で終了した場合は、 _beginthread の呼び出し元に返されるハンドルが無効であるか、別のスレッドを指している可能性があります。ただし、 _beginthreadex によって返されるハンドルは _beginthreadex の呼び出し元によって閉じられる必要があるため、 _beginthreadex がエラーを返さなかった場合は、有効なハンドルであることが保証されます。

ハンドルが有効であることは保証されているけど
実行順についての言及はないし、
そもそも別スレッドなら、どちらが先に行われるかについては何の保証もないと考えるべきじゃないのかな
「APIから戻る」のだって実行権がなければ後回しにされる可能性はあるんだから

**sage** · 2021/03/06(土) 05:17:04.33

>>440
ご返信ありがとうございます。概ね理解できました。
勉強不足で、マルチスレッドの仕組みについて誤解していたようです。

**デフォルトの名無しさん** · 2021/03/06(土) 11:08:41.13

ちなみにCentOSはスレッドのコアが指定できるよ。

**デフォルトの名無しさん** · 2021/03/06(土) 11:30:24.47

macOSだとコア指定できない。

**デフォルトの名無しさん** · 2021/03/06(土) 13:08:47.51

あわしろ氏によると、Macは既にオワコンなので、WSLを使うと良いらしい。

**デフォルトの名無しさん** · 2021/03/25(木) 15:15:49.52

針に糸を通す( thread a needle
糸をつむぐ( spin thread [yarn]
糸が切れた( The thread broke.
琴の糸を締める( tighten a string of a koto
糸をかき鳴らす( strum the strings

**デフォルトの名無しさん** · 2021/04/03(土) 09:59:34.29

このスレ来年で10年か
スレ推奨図書とかないの？

**デフォルトの名無しさん** · 2022/04/14(木) 16:49:21.50

マルチスレッド処理の花形といえばハードなリアルタイムスレッドとバックグラウンドスレッドの間のデータのやり取りだと思ってるんだが
スレの過疎っぷりを見るに、殆どの人にとって必要のないものだったんだな

**デフォルトの名無しさん** · 2022/05/26(木) 01:42:01.15

>>447
MS-DOS のデバイスドライバにでも痕跡が残っていたような‥
どうするつもりだったんだろう？

マルチスレッドプログラミング相談室 その9

マルチスレッドプログラミング相談室その9