C++相談室 part149

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2020/02/18(火) 06:19:41.54ID:xvjipUWj
C++に関する質問やら話題やらはこちらへどうぞ。
ただし質問の前にはFAQに一通り目を通してください。
IDE (VC++など)などの使い方の質問はその開発環境のスレにお願いします。

前スレ
C++相談室 part148
https://mevius.5ch.net/test/read.cgi/tech/1580471646/
このスレもよろしくね。
【初心者歓迎】C/C++室 Ver.105【環境依存OK】
http://mevius.5ch.net/test/read.cgi/tech/1556142878/

■長いソースを貼るときはここへ。■
 http://codepad.org/
 https://ideone.com/

[C++ FAQ]
https://isocpp.org/wiki/faq/
http://www.bohyoh.com/CandCPP/FAQ/ (日本語)
2020/03/02(月) 16:44:13.99ID:LGtCkZFK
>>419
自称天才さんですらUBであることは認めてんのにお前ときたらw
まぁ後は好きにどうぞ
422デフォルトの名無しさん
垢版 |
2020/03/02(月) 16:57:58.17ID:N0Zwryo+
コンピュータはチューリングマシンではない!!!

理由 ---- timeGetTime();

マザボの時計は計算不可能的だ、時計を計算できる「アルゴリズム」は存在しない

理由2 multi-thread チューリングマシンはシングルスレッド的だ
理由3 multi-process シングルスレッドで並列計算を真似る
―― つまり、チューリングマシンなる理論自体はそもそも間違っている!
なぜなら単一のチューリングマシンは並列計算を真似ることができる
つまり、チューリングマシン自体は矛盾している!
(たとえば p->Update(); q->Update(); これはシングルスレッドのコードだ、
つまり、単一のチューリングマシンだ、しかし実行時の効果は並列的だ!)
2020/03/02(月) 17:05:20.01ID:x4CDu4GY
char配列とunionにしてバイトアクセスなんて
みんな自己責任でやってるに決まってるだろうが

そこへ、その案件の関係者でない者が頼まれもしないのにしゃしゃり出て
「UBだ」とキリるのが格好いいと思っているのはそいつ自身だけだ
2020/03/02(月) 17:40:48.54ID:/apuYuUB
>>423
分かってる奴が自己責任でやってるだけなら誰も止めないよ。
今回の場合、初心者の質問(>>389)に対し自称上級者がunionを使う方法(>>396)を提示したから、それはUBだと突っ込まれたんだろ。
別にUBを指摘することがカッコ良い訳ではないけど、指摘されて真っ赤になることはカッコ悪いぞw
2020/03/02(月) 17:44:58.26ID:x4CDu4GY
ああ、=にしたいわけね
いいよ別に
こっちも証明できねえし

ただ、おまえさんのアドバイスは俺の胸には全く響いていない
その事実が変わらん限り痛くも痒くもない
2020/03/02(月) 17:45:42.25ID:AN3bmLPv
>>420
しかし、メンバのアラインの問題さえクリアしていれば、union中の2つのメンバの
offset address は 共に0になる。
そして、以下の通りなので、メモリ中の同じアドレスから読み書きすることになるので、C++の仕様に明示されていなくても、m_b[k] の動作は単純に、m_u64のメモリ中のイメージをそのまま先頭から読み書きすることになる。
なので、問題が起きるとすれば m_u64 と m_b のアラインの問題のみだ。
もし、アラインが合わなかった場合には、m_b[k] が k == 0 でも、m_u64 の途中のアドレスから読み出すことになったりする事になる。
しかし、この様な場合に m_u64 と m_b のアラインが合わない処理系は多分、珍しい。

union UUU {
  uint64_t m_u64;
  BYTE   m_b[8];
};
UUU xx;

xx.m_u64 // もうこの段階で、コンパイラ内部では m_u64 が元々 union のメンバであったという情報は消えることになることが C/C++ の仕様では保障されている。。
xx.m_b[k] // もうこの段階で、コンパイラ内部では m_b が元々 union のメンバであったという情報は消えることになることが C/C++ の仕様では保障されている。。
2020/03/02(月) 17:47:34.63ID:LGtCkZFK
>>423
自己責任とかじゃねーっての
cでは合法的なtype punning
お前strict aliasing理解してるか?
2020/03/02(月) 17:53:08.73ID:vdXXyaaZ
やっぱりUBの怖さ全然わかってない子か
おっしゃる通りオフセットのアドレスはたまたま一緒かもしれないし、規格を読み解けば論理的にそうなるべきであることは導けるのかもしれない
だけどそれが何だというのか?
そのオフセット値から読み取ってくれることや、そもそも読み取り動作をしてくれるとどうして言い切れる?
未定義動作ではコンパイラが何をするのも何をしないのも完全に自由だということをお忘れなく
2020/03/02(月) 17:53:41.95ID:AN3bmLPv
https://stackoverflow.com/questions/25664848/unions-and-type-punning

4. THE SAFE CASE: unsigned char

The only safe manner of using type punning is with unsigned char or well unsigned char arrays (because we know that members of array objects are strictly contiguous and there is not any padding bytes when their size is computed with sizeof()).

 union {
   TYPE data;
   unsigned char type_punning[sizeof(TYPE)];
 } xx; 
Since we know that unsigned char is represented in strict binary form, without padding bits, the type punning can be used here to take a look to the binary represention of the member data.
This tool can be used to analyze how values of a given type are represented, in a particular implementation.

I am not able to see another safe and useful application of type punning under the standard specifications.
2020/03/02(月) 17:55:17.52ID:x4CDu4GY
>>427
いーや自己責任だ
おまえさんが知らないだけ

どの案件の関係者でもなさそうだな
2020/03/02(月) 17:56:57.42ID:vdXXyaaZ
>>429
その回答の下に「Cだけだろ」ってツッコミ入ってるだろ
このあわてんぼうさんめ
2020/03/02(月) 18:18:40.49ID:LGtCkZFK
>>430
何を根拠もなく断言しとんねんこの老害
cppreferenceはっとく
これ基本的に規格に書かれてる文と同じだ
かつこれはcにしか書かれてない
c++のは下にリンクあるから読んどけ

ttps://ja.cppreference.com/w/c/language/union
共用体の内容をアクセスするために使用されるメンバが、値を格納するために最後に使用されたメンバと同じでない場合は、格納された値のオブジェクト表現が新しい型のオブジェクト表現として再解釈されます (型のパンニングと言います)。
2020/03/02(月) 18:26:04.80ID:4ZdkwDZZ
>>426
メモリのレイアウトの話だけならそれ以外の選択肢は実質的にないだろってのはわかるよ。
そりゃそうだ。
実質的にそうだってのは今さら言わなくても知ってる。

いまどきの C++ コンパイラは未定義の挙動はどうなってもいいことを前提にした最適化をすることがあるんだよ……。
去年には LLVM が const 変数への代入を削除するってのでニュースになっただろ。
https://developers.srad.jp/story/19/09/27/1626210/
const 変数は変更されない。 それが前提なんだから変更されても知らんってわけ。

今まで緩く対応してたのが厳しくなることだってある。
共用体が使われる場面ってのはメモリのレイアウトを利用したい場合ってのは多いから
現実には急に挙動を変えるなんてことはないと思うけど、
未定義を警戒するのは最適化に対する警戒なんだよ。
2020/03/02(月) 18:29:44.89ID:EH9ZG6fb
このスレみててなんとなく餃子くいたくなったからスーパーいったけど
売りきれてたわ
2020/03/02(月) 18:33:24.10ID:AN3bmLPv
>>432
次も非常に重要:
「共用体へのポインタは、そのいずれのメンバへのポインタにもキャストできます (共用体がビットフィールドを持つ場合は、共用体へのポインタはそのビットフィールドのベースとなる型へのポインタにキャストできます)。
同様に、共用体のいずれのメンバへのポインタも、囲っている共用体へのポインタにキャストできます。」

これは、union においては、全てのメンバの先頭アドレスが、すべてoffset 0から始まることが保障されていることを意味する。

なので、>>426のアラインの心配はない事になる。
2020/03/02(月) 18:34:36.46ID:AN3bmLPv
>>435
もとい。良く考えてみるとそうでもなかった。
unionへ、または、unionから cast する際にコンパイラが何らかの offset 値を足したり引いたりする可能性があるため。
2020/03/02(月) 18:52:26.82ID:x4CDu4GY
>>432
もう一度言う
どの案件の関係者でもなさそうだな
2020/03/02(月) 19:05:25.24ID:4ZdkwDZZ
>>437
おっ。 立場を持ち出すのか?
理屈では反論する余地がないという意味?
2020/03/02(月) 19:19:56.44ID:x4CDu4GY
お? =ってことでいいのか?
ID変えるとか超しょーもねーねらーだなw
2020/03/02(月) 19:29:50.21ID:4ZdkwDZZ
>>439
俺は煽ってるだけだよ。
2020/03/02(月) 19:31:34.34ID:AN3bmLPv
>>433
「const 変数を cast してから代入する」というのはそもそも元々禁止事項だから、今回の話とはかなり違う。
2020/03/02(月) 19:35:17.26ID:4ZdkwDZZ
>>441
禁止と未定義の間に差があるという誤解?
2020/03/02(月) 19:39:18.04ID:ael5BwwH
>>407, >>438
こいつらすごい嬉しそう
こういうのでしか偉そうに出来ないんだろうなぁ
2020/03/02(月) 19:39:59.11ID:AN3bmLPv
>>445
>>442 には、以下の用になっている:
// at this point, reading from n or c is UB but most compilers define it
  std::cout << "s.c is now " << +s.c << '\n' // 11 or 00, depending on platform
       << "s.n is now " << s.n << '\n'; // 12340011 or 00115678

「 11 or 00, depending on platform」
「12340011 or 00115678」

数学的に
A or B
ということは、A または Bに限られると言うことで、それ以外の可能性がないことである。
2020/03/02(月) 19:53:14.29ID:ael5BwwH
いや、さすがにそれは「大抵のコンパイラはどちらかに定義する」だから
そうじゃないのも有り得る

ただそんな変な環境まで想定するのも非現実的だし
それを言うなら1byte=8bitsとも限らないんで、そんな環境だとuint8_tもおそらく定義されておらず
はちみつがドヤ顔で自称汎用的だと挙げた>>398も使えないわけだが
2020/03/02(月) 19:58:23.59ID:4ZdkwDZZ
>>444
それだったら UB という語を使うのがおかしいよ。
C++ (の仕様) 的には UB ってのは正しいプログラムには存在してはいけないものだ。
どちらになるのか不定という意味では普通は使わない。

11 or 00 は most compilers define it に対応してるとも解釈するのが自然だと思うよ。

>>445
せやな。
そこを言うと汎用的とは言えないな。
unsigned char で定義した方が確実だったか……。
2020/03/02(月) 20:14:13.91ID:4ZdkwDZZ
C++20 では負数は2の補数形式で定義されることになったみたい。
C++ の最新規格に追従しているコンパイラは全部 2 の補数を前提にしてたからもう 1 の補数はええやろみたいな話を聞いた。

そこまで決めるのになんで1バイトの大きさは明記しないんだろ。
1 バイトが 8 ビットじゃないアーキテクチャ (で主要 C++ コンパイラがサポートしている環境) が有るんかね?
2020/03/02(月) 20:17:54.52ID:4ZdkwDZZ
>>445
十分に汎用的とは言えないけど使えないときはコンパイルエラーになるだろうから比較的マシということで勘弁。
2020/03/02(月) 20:24:42.94ID:x4CDu4GY
>>440
超しょーもねーねらー認めやがったw
2020/03/02(月) 20:26:39.31ID:LGtCkZFK
>>447
signedのwrap aroundは定義された?
2020/03/02(月) 20:37:53.23ID:4ZdkwDZZ
>>449
ID 変えとかはしてないからね。
いまどき匿名プロキシとかあんまりないし。
俺がトリップを付けないのはつまらない質問するときだけ!
(つまらないこと聞くの恥ずかしいじゃん……///)
2020/03/02(月) 20:40:00.58ID:x4CDu4GY
>>451
人のことを=っといて虫のいいことを言うな
人間としてどうなのか疑っちまうぜ
2020/03/02(月) 20:41:39.08ID:LGtCkZFK
敗走したのにもどってくんなよ
2020/03/02(月) 20:45:07.72ID:4ZdkwDZZ
>>450
されてない。 それは従来通り。
何故なのか……。
2020/03/02(月) 21:47:32.89ID:j/GXcJfE
【ソフト名】リソーエディタ
【URL】https://github.com/katahiromz/RisohEditor
【説明】リソースデータを編集できるソフト。

これ、VS2012でビルドしたら、バイナリサイズが10MB超えてるだけど、なんとか6MB以内に縮小できないだろうか?

インラインとか関係ある?
2020/03/02(月) 22:01:25.31ID:4ZdkwDZZ
>>455
デバッグ情報は取り除いてそのサイズ?
サイズだけが重要なら UPX とか使えばいいんでね。
2020/03/02(月) 22:10:19.07ID:JxKPpJ6p
>>456
うん。zip圧縮したサイズがだいたい10MB。UPXも試したけど圧縮後のサイズには効果が薄いみたい。インライン関数がデカいのがまずいのかな?
2020/03/02(月) 22:31:49.40ID:TcdIMkwU
>>457
サイズ優先の最適化オプション試してみたら
2020/03/02(月) 23:45:22.71ID:4PGofnEL
そもそも >>398 って、割り算と剰余まで使っていて、実用的なコードとは
言いがたい。
せめて、x >>=8 と x & 255 ならまだましだが、そもそも >>395
で十分なのに、敢えて複雑にして、逆にバグが入る可能性も高い。
それと、厳密に言えば、誰かも指摘したように unsigned char が 8bit かどうか
も C や C++ の仕様としては決まってないようだし。
2020/03/02(月) 23:53:18.90ID:4PGofnEL
>>398
それはバイトの概念を直接扱えないような言語でも使えると言えば使えるかもしれないが、敢えてそんなコードを書く必要はない。
「高級アセンブラ」の名が無く。

自分が知らない処理系に誰かがコンパイルすることを想定していて不安が残る場合には、どこかに
テストコードを書いておけばいい。例えば、次のようにする:
uint32_t a = 0x11223344;
uint8_t *ptr = (uint8_t *)&a;
if ( ptr[0] == 0x44 && ptr[1] == 0x33 && ptr[2] == 0x22 && ptr[3] == 0x11 ) {
 // リトルエンディアン
}
else if ( ptr[0] == 0x11 && ptr[1] == 0x22 && ptr[2] == 0x33 && ptr[3] == 0x44 ) {
  // ビッグエンディアン
}
else {
 // エラー
}
2020/03/03(火) 00:10:54.51ID:alJFGTdC
ちなみにC++20からエンディアンも標準に入る

https://cpprefjp.github.io/reference/bit/endian.html

使えるかは知らない...
2020/03/03(火) 01:43:26.11ID:vE1VkH8+
CではOK、C++ではUB
C/C++コンパイラではたまたま動く場合が多いかもしれないけど、UBはUBなんだし回避方法もあるんだからやめとこう
ただこれだけの話なんだけど

何が気に食わないのか「わかりやすいんだ!汎用的なんだ!Cらしいんだ!俺のコンパイラでは動くんだ!この程度のテクニックも知らんのか!」
ってノリでナイーブにUB書きたがる奴が絶えないのはなんでだろうね
一度でもそういうのが引き起こす地獄みたいなバグに付き合わされたら二度とそんなことしないしさせないって思うもんなんだけどね
幸運にも遭遇したことがないのか、全部他人に解決してもらってるいい身分の人なのか
2020/03/03(火) 02:22:47.77ID:V4J60F8x
> やめとこう

何の権利で指図するんだよ
2020/03/03(火) 02:40:53.66ID:vE1VkH8+
「そんなにお酒飲み過ぎると健康に悪いよ、やめとこう?」
「一生酒を飲むなと命令するのか!何の権利で指図するんだ!」

おおめんどくさい
ただのアドバイスを命令や強要や脅迫に感じるのは鬱の初期症状だから気を付けなよ
2020/03/03(火) 03:15:03.15ID:V4J60F8x
お節介なやつは人からそう見られてるんだよ
2020/03/03(火) 03:39:42.34ID:vE1VkH8+
お節介じゃないよ
俺の関係者がここを見てここのバカに勇気付けられてUB書き散らかすようになると俺が困るから言ってるんだよ
俺のためだ
2020/03/03(火) 03:54:38.06ID:V4J60F8x
逆もしかりだ
チームに入ったばかりの新入りが「UBだ! UBだ!」と喚きだし
「おまえならどうする?」に答えられないゴミには諦めてもらうしかない
どうせunion使わないためにポインタのキャストとかだろくっだらねえ
2020/03/03(火) 04:29:39.93ID:vE1VkH8+
新入りに危険な書き方を指摘されたら「くっだらねえ」と逆ギレした上に
チームで規格を当たって検討もせずに新入りに解決策を丸投げするのか
最低だなお前
2020/03/03(火) 05:43:51.35ID:WsWEE8rZ
>>459-460
まともなコンパイラはビット演算に置き換える最適化が入ることが期待できるんだから、
割り算が実用的でないなんてことはないよ。
エンディアンの影響を避けるには良い選択のひとつだ。
2020/03/03(火) 06:03:20.43ID:WsWEE8rZ
ガチで組み込み環境のシビアなやつだとバイナリのテストの方に時間をかけたりするから
逆に言語に無頓着になる場合があるというのは聞いたことは有る。

1998 年頃の自動車制御とか携帯電話とかの話なんで、
コンパイラの規格準拠具合もそれほどあてにできなかった時代の話だけど。
2020/03/03(火) 06:14:57.83ID:jgFG2YH5
数年前に触ったdspは1byte32bitだったなー
2020/03/03(火) 06:36:20.05ID:WsWEE8rZ
>>455
実行ファイル本体はさほど大きくないじゃん。
一番大きいのは cc1.exe か……。
これって必要?
2020/03/03(火) 06:43:09.65ID:0/2hhSYY
>>468
例えばmemcpyの各プラットフォームごとに向けた最適化(の元のソース)はお前がここで言うようなUBだらけだろうし
boostなんかも各プラットフォーム向けに分けて書かれてる部分が多い
そこまでUBを避けてどんなプラットフォームでも動くように、なんてのもYAGNIの一種だと思うけどね
2020/03/03(火) 06:46:29.83ID:AJx5UoX4
>>470
ガチな組込みって言うか普通の企業なら開発環境も決め打ちで作ってテストする
2020/03/03(火) 06:53:54.29ID:AJx5UoX4
>>445 > それを言うなら1byte=8bitsとも限らないんで
>>447 > 1 バイトが 8 ビットじゃないアーキテクチャ (で主要 C++ コンパイラがサポートしている環境) が有るんかね?
>>471 > 数年前に触ったdspは1byte32bitだったなー

1byteは8bitと決まってるんですけど…
2020/03/03(火) 07:14:47.35ID:WkxUfZWu
え?
2020/03/03(火) 07:16:59.86ID:KvGr1Z90
なぜuint8_tを使わないの??、、
2020/03/03(火) 07:19:47.74ID:uPsaHRM9
>>475
え?
2020/03/03(火) 07:30:20.60ID:0/2hhSYY
2008年に一応はっきり決まったらしいね
ただしC++ではそうと決めてはいないので一応UB
2020/03/03(火) 07:33:02.45ID:2njekV5l
>>473
たぶん根本的なところで他人の発言が理解できてない
言いたいことはわかるけど、もはや議論になってないから黙ってろ
2020/03/03(火) 07:36:41.10ID:WsWEE8rZ
>>473
各プラットフォームに「対応」できてるなら別にいいんじゃね。
union の未定義がどうこう言ってるのは >>365 程度のことに
あえて各プラットフォームの事情を持ち込むのは割に合わない (そのくらい UB の厄介さには重みがある)
って話題だと俺は理解してる。

ターゲットが完全に固定されてたとしてもコンパイラが吐くコードを把握する自信は俺はないし
たぶん >>468 もないし、 >>473 だって出来れば避けて通りたくない?
その上でどうしてもいじらないといけないくらい速度に厳しい場面とかだったら嫌々やるかもしれないけど、
最初からはやらないって程度の話。 早すぎる最適化は諸悪の根源っていうし。
2020/03/03(火) 07:38:19.27ID:WsWEE8rZ
>>475
少なくとも C/C++ では決まってない。

>>477
対応する大きさの型の別名として定義される。
その大きさの型が存在しない場合は定義されるべきではないことになっている。
無ければコンパイルエラーになるだけなんで本当に 8bit キッカリであることが大切なら
uint8_t を使うべきだけれど、「1 バイト」という意味で uint8_t を使っちゃうと C++ の仕様に厳密な意味では
十分に汎用的であるとは言い難い。

ま、そんな環境はあんまりないんだけど組み込み環境だとたまにあるっぽい。

>>479
UB ではなく処理系定義というべき
2020/03/03(火) 07:45:28.78ID:0/2hhSYY
>>480-481
あのさ、一応UBってことはすぐ指摘されて本人もわかってんだよ、質問者もとっくに見てるはず
>>407辺りから意味無くマウント取るような言い方する奴(はちみつ含む)が出たから荒れてんだろ
そこまで言うなら今現在存在する環境でunionによるtype punningが出来ない環境を挙げてみろ
おそらくどこかにはあるんだろうが、1byte=8bitでない環境はすでに挙げられてるのにunionの方は全く例が出て来ない
>>480
理解出来てないのはお前だ
2020/03/03(火) 07:47:02.82ID:AJx5UoX4
>>482
> 少なくとも C/C++ では決まってない。
決まっていないという根拠よろしく
2020/03/03(火) 07:50:44.52ID:0/2hhSYY
>>484
自分で調べろ
2020/03/03(火) 08:03:53.36ID:NOkKAnZ5
>>483
UBだってことは分かってる、ぼくは>>407でカチンときて怒ってるだけだ、ってことだろ。もうただの口喧嘩でこれ以上何も議論することは無いんだからさっさと終わりにしなよ。
2020/03/03(火) 08:07:38.96ID:0/2hhSYY
お前もたいがい煽ってると思うが

>終わりにしなよ
俺に言うなよ
2020/03/03(火) 08:22:51.66ID:AJx5UoX4
>>485
傍から低能丸出しのレスかよ…
何を馬鹿にしてるのかもわかってないだろw
2020/03/03(火) 08:23:01.86ID:Pp/8GnxB
>>483
> そこまで言うなら今現在存在する環境でunionによるtype punningが出来ない環境を挙げてみろ

↓こういう例は把握してるの? >>405 みたいな理解だとこんなコードもエイリアス有効という話になっちゃいそうで危ないと思う。
https://wandbox.org/permlink/qrUVwDZbNPRnOQyN

#include <stdio.h>
#include <stdint.h>
int f(uint16_t* u16, uint32_t* u32) { *u16 = 0x1111; *u32 = 0x22222222; return *u16 + *u32; }
union U { uint16_t u16; uint32_t u32; };
int main() { union U u; printf("%08x\n", f(&u.u16, &u.u32)); }

出力 (gcc 9.2.0 -O2):
22223333
2020/03/03(火) 08:31:00.08ID:WsWEE8rZ
>>483
実際に有るか無いかなんて知らんよ。
俺は検証するのが割に合わんから可能なら避けるし、 >>365 程度のことに「あえて」使いたいという気持ちはわからんと言ってる。

俺は何がなんでも UB は絶対にダメなんてことは書いてないし、十分に検証できてるものにまで文句は付けんよ。
2020/03/03(火) 08:45:51.11ID:WsWEE8rZ
>>484
- std::uint8_t は cstdint にある。 (C++17 の 21.4.1)
- cstdint は C 標準ライブラリヘッダの stdint.h と同じように全ての型とマクロを定義する (同上)
- C++17 が参照する C の規格とは C11 (ISO/IEC 9899:2011) である (C++17 の 2)
- uintN_t はオプショナルだが 8, 16, 32, 64 については対応する型が存在するなら提供しなければならない (C11 の 7.20.1.1)
- char が 8bit ならば C++ には uint8_t は必ず存在するはずだがオプショナルであると言ってるから 8bit の型がない (char が 8bit ではない) ことは想定内なんだろう

というのが根拠。
2020/03/03(火) 08:49:11.40ID:87wKGSsV
いわゆる「悪魔の証明」ですか。
2020/03/03(火) 08:50:30.01ID:0/2hhSYY
>>489
strict aliasing rulesに対する違反にまで話広げてるんだろうけど
さすがにそこまで擁護する気は無いし自己責任じゃないの
そこまで悪質なコードになると話違ってくる

>>490
いやいや、一般的な環境で>>396みたいなのは検証するまでもないから
だいたい昔は未定義だったのが最近の仕様で変わったのもあるだろ
2020/03/03(火) 09:13:15.69ID:WsWEE8rZ
>>493
検証するまでもないという確信を持てる程度に (その現場か個人の経験として) 実績があるってことでしょ。
本当に何もないところで確信を持ってるんだったらそれはそれで駄目だと思う。
2020/03/03(火) 10:05:21.19ID:dPHWJmki
>>467
> どうせunion使わないためにポインタのキャストとかだろくっだらねえ

アウト
なぜunion使うかの前提すら理解してない
2020/03/03(火) 10:41:55.49ID:Zi2Vm8jS
>>472
必要ないファイルを削ったら3MBになった。ありがとう。
2020/03/03(火) 10:43:38.18ID:0/2hhSYY
ちなみに>>489の例はunionじゃなくて同じ変数を指すポインタ渡しても同じことになるからね
2020/03/03(火) 11:04:57.92ID:4ZFJ43jO
>>483
> そこまで言うなら今現在存在する環境でunionによるtype punningが出来ない環境を挙げてみろ

今時点では知らないしないだろうな
でも今後もそうなのかはわからない

1byteの定義なんかは処理系がターゲットcpuごとに決めるもの
エンディアンとかも
これは問題視されない

unionに関しては、そういう類いではないだろう
理由は把握してないけど、非podの場合を含めて意味論が決められない、
あるいはaliasingに関係して明確に使うなということなのかもしれない

あえてcと非互換にしているわけで、グレーであることは知っておくべき

ちなみに20からpodという文言が消えると聞いた
さらにcとの乖離が進むのかもしれない
2020/03/03(火) 12:22:06.47ID:AJx5UoX4
>>491
で、そのどこにバイトの話があるんだ?
2020/03/03(火) 12:36:13.65ID:4ZFJ43jO
CHAR_BITS の定義でしょ
自分で確認しろ
2020/03/03(火) 12:40:22.22ID:ctFzSosi
POD=trivial&&standard-layout
ってC++11の時に整理済みでしょ
概念は消えないよ
2020/03/03(火) 12:52:22.33ID:GzyUVdF6
>>489
それはgccのバグに思える。
2020/03/03(火) 12:59:47.46ID:0/2hhSYY
バグじゃないぞ
これがバグだったら最適化にかなりの制限がかかってしまう
strict aliasing ruleでググれ
2020/03/03(火) 13:01:57.30ID:GzyUVdF6
>>503
最適化しない場合とした場合とで結果が変わってくるのは駄目な最適化。
2020/03/03(火) 13:04:15.59ID:0/2hhSYY
だからググれって
鬼の首を取ったかのように叩く奴が出てくる前に教えてやってんのにw
2020/03/03(火) 13:05:53.55ID:WsWEE8rZ
>>499
肝心なことが漏れてた。 すまぬ。

C++17 だと 4.4 の脚注に

> The number of bits in a byte is reported by the macro CHAR_BIT in the header <climits>

とあって、バイトとは char の大きさのことだというのが C++ での考え方だと思っていい。

C11 だと 5.2.4.2.1 の CHAR_BIT の説明のところに

> Their implementation-defined values shall be equal or greater in agnitude
> (absolute value) to those shown, with the same sign.
>
> - number of bits for smallest object that is not a bit-field (byte)
> CHAR_BIT 8

という言い回しがあって、 CHAR_BIT は 8 以上であればいい (8 キッカリとは限らない) と解釈できる。
それと、ポインタを持てる単位がバイトだということが示唆されているとも言える。
2020/03/03(火) 13:08:55.41ID:GzyUVdF6
>>491
charのbit数は決まってないが、バイトはコンピュータ用語として8バイトと決まっているはず。
2020/03/03(火) 13:10:50.46ID:GzyUVdF6
>>506
多分、
「The number of bits in a byte is reported by the macro CHAR_BIT in the header <climits>」
は、書き間違いで、正しくは、
The number of bits in a char is reported by the macro CHAR_BIT in the header <climits>
だと思われる。
2020/03/03(火) 13:17:56.62ID:GzyUVdF6
>>507
そうか、歴史的には、byteが7bitだったこともあったんだね。
2020/03/03(火) 13:32:49.23ID:WsWEE8rZ
>>507
これな。
https://ja.wikipedia.org/wiki/IEC_80000-13
C++ が参照規格として示してないので採用してないんでしょ。

まあそんなこと言ったら英単語の意味だってどうとでもとりようがあったりするからアレだけど、
あらためて C++ の規格の中でバイトについて書いてある以上は C++ 世界では
「コンピュータ用語としてのバイト」を採用してないと解釈するのが自然。

将来的には変更されることもあるかもしれんけども。

>>508
C++20 のドラフトでもそのままなので本気で間違ってると思うなら指摘してあげればいいんじゃね?

>>509
9bit のマシンもあったらしいよ。
https://ja.wikipedia.org/wiki/ACOS-6
2020/03/03(火) 13:48:53.72ID:4ZFJ43jO
>>501
概念消えるとは言ってないけど
今回文言消す理由ってなんなの?
何も知らずに口挟むとは思えないから質問させてくれ
2020/03/03(火) 14:19:12.58ID:WsWEE8rZ
>>511
もう POD という区分が適切な場面はあんまりないから、という意味のことが書いてあるっぽい。
https://botondballo.wordpress.com/2017/11/20/trip-report-c-standards-meeting-in-albuquerque-november-2017/
2020/03/03(火) 14:41:53.95ID:ctFzSosi
trivialは生成解体の話で、standard-layoutはデータ配置の話だから
PODってのはレイヤーの違う性質が混ざってて規格に使う用語としては筋悪なんですわ
2020/03/03(火) 16:26:35.30ID:GzyUVdF6
>>510
>C++20 のドラフトでもそのままなので本気で間違ってると思うなら指摘してあげればいいんじゃね?
annotated C++ reference manual, 3.2.1c Integral Limits には、
CHAR_BIT   8  maximum bits in a byte
とあった。
2020/03/03(火) 16:39:36.38ID:GzyUVdF6
>>514
ANSI/ISO, Standard C プログラマーズ リファレンス
P.J. Plauger / Jim Brodie, 日本語訳, ASCII

第一部 第一章 基本整数型 には、
--------------------------------------------------------
表記,     最小範囲,  表現における制限
--------------------------------------------------------
char,     [0,128),  signed char か unsigned char のどちらかと等しい。
signed char, (-128,128), 少なくとも 8bit 精度の符号付整数
unsigned char, [0, 256), signed charと同じサイズ。負の数は無い。
--------------------------------------------------------

第二部 第二章 標準ヘッダ <limit.h> には、
--------------------------------------------------------
CHAR_BIT
#define CHAR_BIT <#if 式 ≧ 8>
このマクロは、char 型のデータオブジェクトを表現するのに使われているビット数の最大値と置き換わる。
--------------------------------------------------------
とある。

後半は >>514 とは異なり、byte ではなく、char となっている。
2020/03/03(火) 16:46:23.12ID:GzyUVdF6
type punning について、このスレで議論されていた union の場合は、「適合コード」の例とされている:

https://www.jpcert.or.jp/m/sc-rules/c-exp39-c.html

適合コード
以下のコード例では、オブジェクトの有効な型と互換性のある型を持つ union 型を使用している。

union {
short a[2];
int i;
} u;

u.a[0]=0x1111;
u.a[1]=0x1111;

u.i = 0x22222222;

printf("%x %x\n", u.a[0], u.a[1]);
このコード例では確実に "2222 2222" と出力される。
2020/03/03(火) 16:56:05.32ID:GzyUVdF6
union による type punning は、C99やC11では大丈夫になったのではないか。
最後に代入したメンバ以外のメンバからの読み出しは、合法になったようだが。
よく読んでないので分からん:

https://stackoverflow.com/questions/11639947/is-type-punning-through-a-union-unspecified-in-c99-and-has-it-become-specified
2020/03/03(火) 16:58:14.25ID:GzyUVdF6
>>517
Finally, one of the changes from C90 to C99 was to remove any restriction on accessing one member of a union when the last store was to a different one.
The rationale was that the behaviour would then depend on the representations of the values.
Since this point is often misunderstood, it might well be worth making it clear in the Standard.

[...]

To address the issue about "type punning", attach a new footnote 78a to the words "named member" in 6.5.2.3#3: 78a
If the member used to access the contents of a union object is not the same as the member last used to store a value in the object,
the appropriate part of the object representation of the value is reinterpreted as an object representation in the new type as described in 6.2.6 (a process sometimes called "type punning").
This might be a trap representation.
2020/03/03(火) 20:10:58.79ID:6u3PFyGZ
>>515
日本語訳が間違ってる可能性もあるな
2020/03/03(火) 21:25:40.77ID:s8qGwiQH
>>514
頑なに仕様書読まないのはなぜなのか
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。