!extend:checked:vvvvv:1000:512
(新スレ立ての際上記コマンドを2行書き込んでください)
C言語の話題のみ取り扱います C++の話題はC++スレへ
質問には最低限の情報(ソース/コンパイラ/OS)を付ける
数行で収まらないソースは以下を適当に使ってURLを晒す
https://paiza.io/
https://ideone.com/
http://codepad.org/
C17
http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2017/n4713.pdf
C11
http://www.open-std.org/jtc1/sc22/WG14/www/docs/n1570.pdf
C2x ドラフト
http://www.open-std.org/jtc1/sc22/wg14/www/docs/n2731.pdf
C99
http://www.open-std.org/jtc1/sc22/WG14/www/docs/n1256.pdf
http://kikakurui.com/x3/X3010-2003-01.html
C FAQ 日本語訳
http://www.kouno.jp/home/c_faq/
JPCERT C コーディングスタンダード
https://www.jpcert.or.jp/sc-rules/
※前スレ
C言語なら俺に聞け 158
https://mevius.5ch.net/test/read.cgi/tech/1640401906/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
探検
C言語なら俺に聞け 159
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (ワンミングク MMa2-RRwJ)
2022/08/04(木) 23:32:27.83ID:yWVViPyIM213デフォルトの名無しさん (アウアウエー Sadf-D5P0)
2022/09/18(日) 02:43:34.57ID:Z+lYrLLqa はじめてのC言語完全入門!【Hello World〜ポインタまで徹底解説】
91,121 回視聴
freeCodeチャンネル
91,121 回視聴
freeCodeチャンネル
214デフォルトの名無しさん (ワッチョイ 973e-E+l9)
2022/09/18(日) 03:28:52.56ID:OVhdQ/fk0 >>212
BOM はエンコード方式の識別に使われる場合もあると公式 (unicode consortium) の資料に書かれている。
BOM が BOM という名前である以上は本来の用途からの転用ではあるが、
バイトオーダーだけを根拠にして不要と断じるのはエンジニアリング的に良い姿勢ではないな。
BOM はエンコード方式の識別に使われる場合もあると公式 (unicode consortium) の資料に書かれている。
BOM が BOM という名前である以上は本来の用途からの転用ではあるが、
バイトオーダーだけを根拠にして不要と断じるのはエンジニアリング的に良い姿勢ではないな。
215デフォルトの名無しさん (ワッチョイ ff10-Zv9H)
2022/09/18(日) 04:26:41.31ID:GkyrVNWr0216デフォルトの名無しさん (スッププ Sdbf-UZdd)
2022/09/18(日) 05:15:19.35ID:fdsnSmbGd217デフォルトの名無しさん (スッププ Sdbf-UZdd)
2022/09/18(日) 05:26:48.38ID:fdsnSmbGd >>205
よく見るとそのページ内容がむちゃくちゃだなw
データが格納される順番はコンパイラ依存なのでそんなサンプルコードは作ってはいけない
「まず、arr のオブジェクトサイズは 24 バイトと表示されますが、」じゃねえよw
「内部の詳細を無視してしまうと恐ろしいエラーが発生する可能性があります。」もう起こっているw
以上
よく見るとそのページ内容がむちゃくちゃだなw
データが格納される順番はコンパイラ依存なのでそんなサンプルコードは作ってはいけない
「まず、arr のオブジェクトサイズは 24 バイトと表示されますが、」じゃねえよw
「内部の詳細を無視してしまうと恐ろしいエラーが発生する可能性があります。」もう起こっているw
以上
218デフォルトの名無しさん (ワッチョイ 9fad-52V3)
2022/09/18(日) 10:38:22.56ID:kY5VkQwD0219デフォルトの名無しさん (アウアウウー Sa5b-8eP5)
2022/09/18(日) 13:53:49.44ID:KpBP36NGa 文系は全称と単称の区別が出来ない
大抵の馬鹿はこれで判別出来る
大抵の馬鹿はこれで判別出来る
220デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/18(日) 14:04:23.72ID:CIgAfYZs0 そういう表現も、大体根拠が希薄
血液型占いと同程度
血液型占いと同程度
221デフォルトの名無しさん (アウアウウー Sa5b-PfD3)
2022/09/18(日) 14:12:29.01ID:Rev08jtKa222デフォルトの名無しさん (スッププ Sdbf-UZdd)
2022/09/18(日) 18:22:49.00ID:JcdidFMxd 機械翻訳まるだしだし
Pythonのおまけで載ってるだけだから
そんなページあてにするなとしか
Pythonのおまけで載ってるだけだから
そんなページあてにするなとしか
223デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/18(日) 18:23:22.20ID:rN2/Bhfe0224デフォルトの名無しさん (ワッチョイ 973e-E+l9)
2022/09/18(日) 19:08:21.37ID:OVhdQ/fk0 >>223
UTF-8 ではない形で保存されている可能性はいつでもあるわけだが……。
UTF-8 ではない形で保存されている可能性はいつでもあるわけだが……。
225デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/18(日) 19:35:00.75ID:CIgAfYZs0226デフォルトの名無しさん (スププ Sdbf-MXZj)
2022/09/18(日) 20:14:09.21ID:tcByEu8Hd wcharはutf8圧に負けて廃れるんかね
Cのようなロートル言語使ってると固定幅(但し幅は決まっていない)エンコの有り難みをひしひしと感じる
Cのようなロートル言語使ってると固定幅(但し幅は決まっていない)エンコの有り難みをひしひしと感じる
227デフォルトの名無しさん (ワッチョイ 9f01-bNpc)
2022/09/18(日) 21:11:58.46ID:/3elu/X80 ストレージはutf-8
メモリーはwchar_t
じゃね?
メモリーはwchar_t
じゃね?
228デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/18(日) 22:03:00.04ID:rN2/Bhfe0 >>225
それでBOM付き選んじゃうやつが居るんだろうな。選択肢無くして欲しいものだ。
それでBOM付き選んじゃうやつが居るんだろうな。選択肢無くして欲しいものだ。
229デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/18(日) 22:05:23.89ID:rN2/Bhfe0230デフォルトの名無しさん (ワッチョイ 1f02-MXZj)
2022/09/18(日) 22:23:37.69ID:zhWgY60z0 >>229
ふぇふふ…
ふぇふふ…
231デフォルトの名無しさん (ワッチョイ 9f2c-ret5)
2022/09/18(日) 22:58:27.34ID:JTgtpdd/0 メモ帳は、BOM 付きUTF-8 になるから、ダメ
BOM無しUTF-8は、VSCode, サクラエディタなどを使う。
TeraPad は、新し目の文字に対応していないので、ダメ
BOM無しUTF-8は、VSCode, サクラエディタなどを使う。
TeraPad は、新し目の文字に対応していないので、ダメ
232デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/18(日) 23:06:51.28ID:CIgAfYZs0 メモ帳、デフォルトでBOM無しで保存する
BOM付けるにはセレクトで一番下を選ぶ操作が必要
BOM付けるにはセレクトで一番下を選ぶ操作が必要
233デフォルトの名無しさん (テテンテンテン MM3f-2Jl6)
2022/09/18(日) 23:10:07.79ID:tcp3M/eWM UnicodeのBOMはUTF-{8, 16, 32}で並び順が違うから判別に使える
逆に無いと推測に頼るしかない
メモ帳はSJISのテキストを開かれることもあるから、BOM無しUTF-8の場合は推測している
BOMが有れば確実に判別出来る
なのでBOM付きUTF-8は悪くない
逆に無いと推測に頼るしかない
メモ帳はSJISのテキストを開かれることもあるから、BOM無しUTF-8の場合は推測している
BOMが有れば確実に判別出来る
なのでBOM付きUTF-8は悪くない
234デフォルトの名無しさん (ワッチョイ 5701-dv3E)
2022/09/18(日) 23:10:14.33ID:a87PubfG0 WindowsではBOM付きのほうが便利だけどね。
235デフォルトの名無しさん (ワッチョイ 5701-dv3E)
2022/09/18(日) 23:12:31.63ID:a87PubfG0 gccもBOMに対応したことですし。
236デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/18(日) 23:23:26.35ID:CUVLEdWC0 UTF-8にBOMが要らないと主張しているのは今の現実について言っているわけじゃなくて
「UTF-8しか存在しない美しい世界」を目指している活動家だからな。
説明したところで話が?み合わない。
「UTF-8しか存在しない美しい世界」を目指している活動家だからな。
説明したところで話が?み合わない。
238デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/19(月) 00:15:30.26ID:YVA4ZVOh0 自覚したなら今度からはバイトオーダーにかこつけたアホな主張はやめとけよ。
239ハノン ◆QZaw55cn4c (US 0H7f-G1yF)
2022/09/19(月) 00:18:28.74ID:hV59E8S+H 美しい世界(爆笑)のために、今後も活動を続けていきます!
240デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 02:37:34.04ID:Z9ZARiSG0 ユニコードの上位セットであるGB18030もあるんだけど。
241デフォルトの名無しさん (ワイーワ2 FFdf-8eP5)
2022/09/19(月) 11:10:12.09ID:NE4NRLG3F >>236
そんなあなたに Nim がおすすめ
そんなあなたに Nim がおすすめ
242デフォルトの名無しさん (ワイーワ2 FFdf-8eP5)
2022/09/19(月) 11:11:36.70ID:NE4NRLG3F >>233
ASCII (8bit以内) しかないテキストに BOM 付いてたらさすがにうざいと思う
ASCII (8bit以内) しかないテキストに BOM 付いてたらさすがにうざいと思う
243ハノン ◆QZaw55cn4c (US 0H7f-G1yF)
2022/09/19(月) 11:21:09.68ID:PpMrjNAJH >>242
ですよね!
コードは普通コメントも英語で書くし、なんで BOM がつかなきゃならないのか意味不明なんですよ、ましてや UTF-8 に BOM つけてもいい規約なんて後付けなんでしょう?
美しい世界(爆笑)のために今日もがんばります!
ですよね!
コードは普通コメントも英語で書くし、なんで BOM がつかなきゃならないのか意味不明なんですよ、ましてや UTF-8 に BOM つけてもいい規約なんて後付けなんでしょう?
美しい世界(爆笑)のために今日もがんばります!
244デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/19(月) 11:40:57.93ID:YVA4ZVOh0 >>241
まさに今、話が噛み合わないことを痛感した。
まさに今、話が噛み合わないことを痛感した。
245デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 11:41:54.30ID:zeLiCYh20 なくても使えるなら、ない方が良い
246はちみつ餃子 ◆8X2XSCHEME (ワッチョイ 973e-E+l9)
2022/09/19(月) 11:43:27.96ID:npVSxydm0 どれでもいいけど規格で決めないという対処には愚痴を言いたくもなる。
247デフォルトの名無しさん (テテンテンテン MM3f-2Jl6)
2022/09/19(月) 11:55:32.42ID:M3xsgC0JM248デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 12:00:13.75ID:zeLiCYh20 気付かなかったあなたはたぶん幸せ者です
249デフォルトの名無しさん (ワッチョイ 9f01-bNpc)
2022/09/19(月) 12:13:35.24ID:b1CdxAyP0 10年前ならともかく今時BOMの有無で困ることなんてほぼなくね?
250デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/19(月) 12:30:39.37ID:/08McGz80 BOMなしUTF-8のデータを読ませるとエラーになるプログラムを作ったやつがいる。
こういうやつをどうするべきか?
こういうやつをどうするべきか?
251デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 12:33:02.11ID:zeLiCYh20 市中引き回しのうえ、磔獄門で
252デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/19(月) 13:00:37.09ID:YVA4ZVOh0 仕様で読めることになっているのにエラーになるならバグだがそうでないなら読ませる方が悪い。
日本語Windows向けアプリの大半はそうだな。
日本語Windows向けアプリの大半はそうだな。
253デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/19(月) 13:09:05.53ID:/08McGz80 仕様ではUTF-8と書いてあるだけ。ならばBOMの有無に関係なく読めるようにするべき。
254デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 13:13:10.64ID:zeLiCYh20 仕様ではUTF-8と書いてあるなら、あったら読み飛ばせば良いだけだな
255デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/19(月) 13:29:40.55ID:/08McGz80 にも関わらずBOMがないとわざわざエラーを出して終わる
256デフォルトの名無しさん (ワッチョイ 9f01-bNpc)
2022/09/19(月) 13:40:15.70ID:b1CdxAyP0 単なるバグだろ、とっとと直させろよ
257デフォルトの名無しさん (ワッチョイ b79f-gM0g)
2022/09/19(月) 14:03:09.97ID:Y3ojWtlT0 > こういうやつ
BOMなしUTF-8のデータそのものを修正したいのか
BOMなしUTF-8のデータを読めるようにプログラムを修正したいのか
プログラムを作ったやつに復讐したいのか
どれだ
BOMなしUTF-8のデータそのものを修正したいのか
BOMなしUTF-8のデータを読めるようにプログラムを修正したいのか
プログラムを作ったやつに復讐したいのか
どれだ
258ハノン ◆QZaw55cn4c (US 0H7f-G1yF)
2022/09/19(月) 15:32:18.43ID:PpMrjNAJH BOM はもともと UTF-16 のためのものでしょう?
それを、UTF-8 に対しても無条件に BOM をつけてしまうウンコエディターを量産している奴等に問題があるんですよ…
また、正直にいって、規格で決めればいいとかいう思考停止にも我慢ならないんですよ
美しい世界(爆笑)のために今日もがんばります!
それを、UTF-8 に対しても無条件に BOM をつけてしまうウンコエディターを量産している奴等に問題があるんですよ…
また、正直にいって、規格で決めればいいとかいう思考停止にも我慢ならないんですよ
美しい世界(爆笑)のために今日もがんばります!
259デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 15:34:28.84ID:Z9ZARiSG0 HTMLもBOM推奨してなかったっけ。
260デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 15:56:49.87ID:zeLiCYh20 HTMLの場合、「BOM」付けると、PHP で謎の空白ができてしまう など動作や表示に不具合が出る可能性があるそうです。
261デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:04:04.51ID:Z9ZARiSG0 それは、BOM付けるのがPHPの仕事だからじゃないの?
262デフォルトの名無しさん (ワッチョイ 775f-3ts6)
2022/09/19(月) 16:20:33.07ID:x76VqF340 PHPは中途半端に歴史が古いから、Unicodeといえば、UTF-16なんだよな。
でもそのおかげでWindowsとの相性は悪くない。
でもそのおかげでWindowsとの相性は悪くない。
263デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:20:51.69ID:zeLiCYh20 そもそも UTF-8 には、エンディアンの違いがなく、BOM(バイトオーダーマーク)を付ける必要がないんだそうだ
264デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:22:57.02ID:zeLiCYh20 HTMLの場合はHEADに使っている文字コード情報が入っているのでそれを見れば良い事になる
265デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:25:44.76ID:Z9ZARiSG0 >>264
たしか規格でBOMを優先することになってなかったっけ?
たしか規格でBOMを優先することになってなかったっけ?
266デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:33:42.03ID:zeLiCYh20 文字列としてバイトオーダーが実際に問われるのは、
UTF-16やUTF-32のケースだけです
その場合は必要ですね
UTF-16やUTF-32のケースだけです
その場合は必要ですね
267デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:34:41.81ID:Z9ZARiSG0 確認したところ、なってたわ。
HTMLパーサー書いたことがあるから、おぼろげに覚えてた。
HTMLパーサー書いたことがあるから、おぼろげに覚えてた。
268デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:46:36.41ID:Z9ZARiSG0 ・BOMがある場合、BOMに従う。
・ない場合、500ms、あるいは1024バイト読み込むまで待機し、エンコーディング走査アルゴリズムを呼び出す。
エンコーディング走査アルゴリズム内で、ヘッダー内の情報が読み取られる場合もある。
(このアルゴリズムでも、他に優先される情報がある。)
やはり、HTMLにおいては、BOMをつけるべきだな。
読み込みが速くなるし、文字コードの違いを利用した攻撃を避けることが出来るし。
・ない場合、500ms、あるいは1024バイト読み込むまで待機し、エンコーディング走査アルゴリズムを呼び出す。
エンコーディング走査アルゴリズム内で、ヘッダー内の情報が読み取られる場合もある。
(このアルゴリズムでも、他に優先される情報がある。)
やはり、HTMLにおいては、BOMをつけるべきだな。
読み込みが速くなるし、文字コードの違いを利用した攻撃を避けることが出来るし。
269デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:47:54.37ID:zeLiCYh20 HTMLの場合は、HEADに使用するcharsetが記述されてますから心配ありません
270デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:48:57.21ID:Z9ZARiSG0 昔の外国映画で「ふにゃちん野郎が!」という悪口があったよね。
今後は「BOM無し野郎が!」と言うことを提案いたします。
今後は「BOM無し野郎が!」と言うことを提案いたします。
271デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:49:03.30ID:zeLiCYh20 それにUTF-8にはバイトオーダーがありません
272デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:50:38.05ID:Z9ZARiSG0273デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 16:52:03.62ID:Z9ZARiSG0 BOMをつけないとセキュリティ上の問題がある。
274デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 16:52:15.94ID:zeLiCYh20 付けたWebサイトをここで公開して下さい
楽しみにしています
楽しみにしています
275デフォルトの名無しさん (ブーイモ MMcf-xFG9)
2022/09/19(月) 17:25:06.78ID:UNULYZvbM すべてのUTF-8にBOMがついてたらSJISはもっと早く消えてくれたと思うんだよね
276デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 17:31:57.08ID:Z9ZARiSG0 この話題は、BOMをつけましょうということで、良いのでは?
277ハノン ◆QZaw55cn4c (US 0H7f-G1yF)
2022/09/19(月) 18:02:53.27ID:PpMrjNAJH278デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 18:05:47.85ID:Z9ZARiSG0 BOMを付けていない人を見かけたら、注意して差し上げましょう。
ということで、良いのでは?
ということで、良いのでは?
279デフォルトの名無しさん (スプッッ Sd3f-EKt7)
2022/09/19(月) 18:12:09.41ID:iQkZER0Ad テキストファイルを開いたとき最初の三文字がゴミかどうかいちいち判断するの?
2つのテキストファイルを結合するときゴミをひとつにまとめる処理するの?
BOMという考えが誤りなんだよ
2つのテキストファイルを結合するときゴミをひとつにまとめる処理するの?
BOMという考えが誤りなんだよ
280デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 18:14:42.87ID:Z9ZARiSG0 法令でBOMを義務付けるべきでは?
BOMが無かったら通報するみたいな。
BOMが無かったら通報するみたいな。
281デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 18:15:00.74ID:zeLiCYh20 Windowsの一部アプリでBOMがないと動作不具合起こすんだよ
Officeとか、Officeとか、その辺
この辺への思いやりが必要な時は付けてあげると良い
Officeとか、Officeとか、その辺
この辺への思いやりが必要な時は付けてあげると良い
282デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 18:19:47.40ID:BENNO3a0H >>278
それに加えて BOM を無駄につけている人を見かけたら、注意して差し上げましょう、も追加してください。
それに加えて BOM を無駄につけている人を見かけたら、注意して差し上げましょう、も追加してください。
283デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 18:20:53.56ID:BENNO3a0H284はちみつ餃子 ◆8X2XSCHEME (ワッチョイ 973e-E+l9)
2022/09/19(月) 18:22:38.11ID:npVSxydm0285デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 18:23:22.11ID:BENNO3a0H >>281
たしかに office とか office とか office とか office とかに思いやりを示す寛大な処置ということであれば、付けて差し上げることにやぶさかではないのですけれどもね
たしかに office とか office とか office とか office とかに思いやりを示す寛大な処置ということであれば、付けて差し上げることにやぶさかではないのですけれどもね
286デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/19(月) 18:27:12.50ID:YVA4ZVOh0 >>277
後半に関して言えば、そのテキストがどのエンコードを用いているかが他の手段で示されているなら
BOMは用いるべきではないとされているからそれに従えばいい話だね。
「俺が扱うテキストは全部UTF-8に決まってるんだからBOMは要らない」という自己中心的な主張と
混同してくれなければいい。
後半に関して言えば、そのテキストがどのエンコードを用いているかが他の手段で示されているなら
BOMは用いるべきではないとされているからそれに従えばいい話だね。
「俺が扱うテキストは全部UTF-8に決まってるんだからBOMは要らない」という自己中心的な主張と
混同してくれなければいい。
287デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 18:28:42.31ID:Z9ZARiSG0 まあ私はどちらでも良いんですけれども。
(レイヤード・ストリームをつこてますので)
gccがBOMに対応したのだから、BOM付ける陣営の勝利では?
(レイヤード・ストリームをつこてますので)
gccがBOMに対応したのだから、BOM付ける陣営の勝利では?
288デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 18:33:34.93ID:Z9ZARiSG0 ところで明日は地下鉄が止まるかもしれないので、調べておいた方が良いですよ。
289デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 18:35:51.09ID:Z9ZARiSG0 わたくし思うのですが、BOMに対応しないソフトウェアを企画してしまう技術者って、もはや技術者で無いのでは?
ユーザーが必要としてるわけですからね。
ユーザーが必要としてるわけですからね。
290デフォルトの名無しさん (ワッチョイ 775f-3ts6)
2022/09/19(月) 19:59:29.61ID:x76VqF340 WindowsはBOMがあった方が判別しやすいが、LinuxやUNIXはBOMがあると余計なものが付いているという感じになる。
マルチバイト圏への配慮が足らなかったマイクロソフトが一番悪い。
だいたい2バイトで漢字がすべて収まると思ったアメリカ人に対して、早く日本人が漢字は何万字もあると教えなかったのが失敗だった。
マルチバイト圏への配慮が足らなかったマイクロソフトが一番悪い。
だいたい2バイトで漢字がすべて収まると思ったアメリカ人に対して、早く日本人が漢字は何万字もあると教えなかったのが失敗だった。
291デフォルトの名無しさん (スッププ Sdbf-UZdd)
2022/09/19(月) 20:35:04.98ID:EmjBwTYRd BOMキチガイども
292デフォルトの名無しさん (ワントンキン MM7f-bNpc)
2022/09/19(月) 20:42:51.60ID:F9okSTEiM MS-DOSの頃は、これで十分って思ってたからな。
293デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 21:05:32.45ID:BENNO3a0H294デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/19(月) 22:08:36.69ID:YVA4ZVOh0 「俺が扱うテキストは全部UTF-8に決まってるんだからBOMは要らない」というのが自己中心的な主張だと言ったんだが?
こんな単純な日本語の文章すらまともに読解できない奴に間違ってるとか言われても困惑するわ。
こんな単純な日本語の文章すらまともに読解できない奴に間違ってるとか言われても困惑するわ。
295デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 22:24:33.90ID:BENNO3a0H >>294
同じことを繰り返しますが、
①過去、エンコードの違うテキストを各種取り扱っていたからといって、「テキストの内部に恣意的にエンコードを示すマークを入れる」などという自己中心的なことをした歴史はなかったのです。
特にそういうことをしたいときは、ソースコードにその言語のコメントでエンコードを示す、くらいの配慮をしていたものです
②UTF-8 でエンコードされている限り、そのコンテンツがアスキーコードのみで構成されているのならば、特にバイトオーダーコードは不要で、as is で使えるように、欧米諸国に配慮した設計です
特に②が重要で、バイトオーダーコードを要れずとも、C のソースコードは UTF-8 であれば普通にコンパイルできる、はず、なのに、なぜわざわざバイトオーダーコードを付加して既存の処理系がそのままでは使えなくなってしまったのか?
コンパイラは MS-VC だけではなく、gcc も clang も lsi-c (w)もあるというのに、既存のコンパイラの動作を妨害してまで、バイトオーダーコードを付加するエディター側の方が自己中心的といえるのではないでしょうか?
そしてエンコードを示すマークなどではないバイトオーダーマークをエンコード種を示すマークに乱用するしている二重の矛盾も指摘しなければなりますまい
私の言っていることがわかりますか?
同じことを繰り返しますが、
①過去、エンコードの違うテキストを各種取り扱っていたからといって、「テキストの内部に恣意的にエンコードを示すマークを入れる」などという自己中心的なことをした歴史はなかったのです。
特にそういうことをしたいときは、ソースコードにその言語のコメントでエンコードを示す、くらいの配慮をしていたものです
②UTF-8 でエンコードされている限り、そのコンテンツがアスキーコードのみで構成されているのならば、特にバイトオーダーコードは不要で、as is で使えるように、欧米諸国に配慮した設計です
特に②が重要で、バイトオーダーコードを要れずとも、C のソースコードは UTF-8 であれば普通にコンパイルできる、はず、なのに、なぜわざわざバイトオーダーコードを付加して既存の処理系がそのままでは使えなくなってしまったのか?
コンパイラは MS-VC だけではなく、gcc も clang も lsi-c (w)もあるというのに、既存のコンパイラの動作を妨害してまで、バイトオーダーコードを付加するエディター側の方が自己中心的といえるのではないでしょうか?
そしてエンコードを示すマークなどではないバイトオーダーマークをエンコード種を示すマークに乱用するしている二重の矛盾も指摘しなければなりますまい
私の言っていることがわかりますか?
296デフォルトの名無しさん (ワッチョイ 9fad-dwAj)
2022/09/19(月) 23:05:07.14ID:/08McGz80297はちみつ餃子 ◆8X2XSCHEME (ワッチョイ 973e-E+l9)
2022/09/19(月) 23:10:53.08ID:npVSxydm0 >>290
エンコード切り替えの規格は ISO/IEC 2022 がある。
PC-9801 時代あたりにはマニュアルで KI/KO コードという名前で説明されていた。
ヨーロッパ言語も ISO/IEC 8859 として十種類以上の文字セットが定義されているんだ。
日本での事情以上に混在は深刻な問題であって、対処する規格は当然ある。
エンコード切り替えの規格は ISO/IEC 2022 がある。
PC-9801 時代あたりにはマニュアルで KI/KO コードという名前で説明されていた。
ヨーロッパ言語も ISO/IEC 8859 として十種類以上の文字セットが定義されているんだ。
日本での事情以上に混在は深刻な問題であって、対処する規格は当然ある。
298デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:18:33.90ID:a+e8LTLZH >>296
おっしゃるとおり、そこまでは、ただのアスキー7bit で記述するんですよ
大概は第一行目にエンコード種をアスキーで書くものでしたけれどもね
厳密っていうけれども、あなたのおっしゃる厳密の意味がよくわかりませんね
おっしゃるとおり、そこまでは、ただのアスキー7bit で記述するんですよ
大概は第一行目にエンコード種をアスキーで書くものでしたけれどもね
厳密っていうけれども、あなたのおっしゃる厳密の意味がよくわかりませんね
299デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:19:31.82ID:a+e8LTLZH >>297
英語が一番簡単で、ウムラウトとか苦労していたと思いますよ、ウムラウトは確か 7 ビット領域に侵食していたような気が
英語が一番簡単で、ウムラウトとか苦労していたと思いますよ、ウムラウトは確か 7 ビット領域に侵食していたような気が
300デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:23:44.77ID:a+e8LTLZH >>297
おっと、私のいっていたことが少し不正確でしたね、たしかに KI/KO は生 JIS にありましたね
おっと、私のいっていたことが少し不正確でしたね、たしかに KI/KO は生 JIS にありましたね
301はちみつ餃子 ◆8X2XSCHEME (ワッチョイ 973e-E+l9)
2022/09/19(月) 23:40:42.70ID:npVSxydm0 自然言語なんて数千年単位の歴史的経緯の塊だ。 その文字も。
綺麗に整理しようとしたって元がグダグダなんだからどこかしらでグダグダになる。
そんでそのグダグダをひとつに寄せ集めたのが Unicode なんだぞ。
そりゃグダグダで当たり前だし、そういうもんだと思うしかしょうがないだろ。
そんでもって Unicode がかなり広まったといっても従来の文字コードが消滅したわけでもない。
https://xkcd.com/927/
綺麗に整理しようとしたって元がグダグダなんだからどこかしらでグダグダになる。
そんでそのグダグダをひとつに寄せ集めたのが Unicode なんだぞ。
そりゃグダグダで当たり前だし、そういうもんだと思うしかしょうがないだろ。
そんでもって Unicode がかなり広まったといっても従来の文字コードが消滅したわけでもない。
https://xkcd.com/927/
302デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:43:18.98ID:a+e8LTLZH >>240
チャイナ規格ですか‥‥(差別意識満々)
調べてみましたが基本的に4ビット固定長であり、UTF-8 を包含してはいないようですね、UTF-8 の上位規格というのはどういう根拠でそういっているのですか?
どっちかというと 現行中国漢字エンコード規格の上位規格でしょう
私の理解
・7 ビット圏は 1 バイト
・拡張部分は可変長ではなく 4 バイト固定
・現行の中国の漢字エンコード規格 GBK(シフトJIS と同じ仕組み)を包含するように第二・第四バイトの範囲を GBK と被らない範囲に制限している。
チャイナ規格ですか‥‥(差別意識満々)
調べてみましたが基本的に4ビット固定長であり、UTF-8 を包含してはいないようですね、UTF-8 の上位規格というのはどういう根拠でそういっているのですか?
どっちかというと 現行中国漢字エンコード規格の上位規格でしょう
私の理解
・7 ビット圏は 1 バイト
・拡張部分は可変長ではなく 4 バイト固定
・現行の中国の漢字エンコード規格 GBK(シフトJIS と同じ仕組み)を包含するように第二・第四バイトの範囲を GBK と被らない範囲に制限している。
303デフォルトの名無しさん (ワッチョイ 5701-W3aP)
2022/09/19(月) 23:48:55.05ID:Z9ZARiSG0304デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:52:42.86ID:A/Pc+E3NH >>301
How standards have been overproducted とか易しい英語にしてほしいなあ
How standards have been overproducted とか易しい英語にしてほしいなあ
305デフォルトの名無しさん (US 0H7f-G1yF)
2022/09/19(月) 23:55:05.42ID:A/Pc+E3NH306デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/19(月) 23:55:54.72ID:zeLiCYh20 EBCDIC なんていうコード体系もあるんだよな
これはASCIIよりも古い
このコードで動いていたPCもあった(今もあるかは知らない)
これはASCIIよりも古い
このコードで動いていたPCもあった(今もあるかは知らない)
307デフォルトの名無しさん (ワッチョイ 17c2-okD4)
2022/09/20(火) 05:35:11.57ID:JyAf+et+0 N5200か
308デフォルトの名無しさん (ワッチョイ ff46-B8bZ)
2022/09/20(火) 05:38:15.50ID:AtHbCf2+0309デフォルトの名無しさん (ワッチョイ ffb0-okD4)
2022/09/20(火) 07:29:23.63ID:4R7D1dED0310デフォルトの名無しさん (アウアウウー Sa5b-8eP5)
2022/09/20(火) 09:59:52.88ID:2fXkGtCja >>270
PHP+SJIS全盛の頃にBOMの代わりに「美乳」が使われてた時代があったな
PHP+SJIS全盛の頃にBOMの代わりに「美乳」が使われてた時代があったな
311デフォルトの名無しさん (アウアウウー Sa5b-8eP5)
2022/09/20(火) 10:02:30.30ID:2fXkGtCja312デフォルトの名無しさん (ワッチョイ 9f63-E+l9)
2022/09/20(火) 10:04:55.52ID:Sk0Tcp2N0 MSならやりかねない
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- アメリカ、入国時に「日本人を含む外国人観光客の最大5年分のSNS履歴の提出」義務化へ 過去10年間に使用のメールアドレスや電話番号等も★2 [Hitzeschleier★]
- 【中国外務省】日本への渡航自粛を再度呼びかけ 今度は「地震発生」を理由に [ぐれ★]
- 立憲・小宮山議員、「牛乳=白い水」投稿を削除 批判殺到で「大変失礼申し上げました」 [少考さん★]
- 内閣支持、微減59.9% 5割超が補正予算評価 時事通信世論調査 [どどん★]
- 日本語が話せない「外国籍」の子が急増中、授業がストップ、教室から脱走も…先生にも大きな負担「日本語支援」追いつかず★3 [七波羅探題★]
- 【芸能】デパートで見つけたランドセルが衝撃価格! つまみ枝豆「どこかで規制しないと」に共感の声殺到 「全て同感」「高すぎます」★2 [冬月記者★]
- 「あっ、これってなくても困らないな…」って確信したもの 米以外でなんかある? [434776867]
- 高市「農水大臣が大好きなお米券」 鈴木農相「高市総理からも指示があったお米券」 [237216734]
- 日清オイリオ「オリーブオイルの高騰が落ち着いたのにお前らが買わない!」 [592058334]
- 【悲報】ガイナックス破産、思ったよりヤバそう…ジャップ文化を築いた原画やアニメ資料が海外に散逸へwwwwwwwwwwwwwwwwwwww [802034645]
- 【高市遺産】 ユネスコさん。日本の「匠の技」「屋台」「和紙」などを無形文化遺産に登録 🎉🎊 [485983549]
- (´・ω・`)ぬくぬくだお
