文字コード総合スレ Part11

**デフォルトの名無しさん** · 2018/01/22(月) 22:58:23.45

プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
　（スレ再利用）UnicodeとUTF-8の違いは？ http://pc12.2ch.net/test/read.cgi/tech/1177930957/
　（隔離スレ）UnicodeとUTF-8の違いは？　その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/

**デフォルトの名無しさん** · 2018/06/09(土) 09:13:51.52

>>371
回答ありがとう。
UnicodeのU+E000からU+E757あたりを使えばSJISにも対応できそう。

**デフォルトの名無しさん** · 2018/06/09(土) 19:05:32.10

curl 'http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt' | wc -l
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。

**デフォルトの名無しさん** · 2018/06/10(日) 06:07:59.44

何？結局16バイトに収まってたという話？

**デフォルトの名無しさん** · 2018/06/10(日) 06:08:19.99

ビットだ……恥ずかしい

**デフォルトの名無しさん** · 2018/06/10(日) 15:33:08.87

>>373
中身を見ればわかるけど漢字領域 (4e00 から 9efe) とかは
飛ばしてあるから全然違う。

**デフォルトの名無しさん** · 2018/06/10(日) 16:00:53.49

Android P Beta 2、グリーンサラダの絵文字からゆで卵が消える | スラドデベロッパー
https://developers.srad.jp/story/18/06/09/0621201/

ゆで卵を入れる多様性は許されないのか

**デフォルトの名無しさん** · 2018/06/11(月) 13:52:38.76

ジェンダーの方もなんか過剰だよね。政治的な活動家でもいるのかね

サラダの絵文字からGoogle、「卵」を排除　生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all

**デフォルトの名無しさん** · 2018/06/11(月) 16:02:07.37

なんか力抜けたわｗ

**373** · 2018/06/12(火) 21:57:09.59

>>376
収録されている全文字を取得するにはどうしたらいいかな…

**デフォルトの名無しさん** · 2018/06/13(水) 00:45:51.71

どうなってんのこれ🤔

🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕

**デフォルトの名無しさん** · 2018/06/13(水) 00:55:38.87

5ちゃんでemojiのAAは文字数制限が厳しいからどうしても小さくなりがちだな

**デフォルトの名無しさん** · 2018/06/13(水) 06:58:34.14

なにか問題でも？
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿

**デフォルトの名無しさん** · 2018/06/17(日) 09:04:29.91

ユニコードとUTF8は何が違うんでしょうか
どちらもユニコード？それとも別のコード？頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・

**デフォルトの名無しさん** · 2018/06/17(日) 09:50:58.25

アップル外字どうなの


**デフォルトの名無しさん** · 2018/06/17(日) 12:32:46.14

>>384
文字集合と文字符号の違いならわかる？

**デフォルトの名無しさん** · 2018/06/17(日) 12:38:22.96

>>384
まずはウィキってこい
その上で分からないことがあれば質問しろ

**デフォルトの名無しさん** · 2018/06/17(日) 12:51:10.01

Shift_JISだって文字集合違ったりベンダ固有拡張あったりで
全然丸く収まってないよ殴り合いだよ

**デフォルトの名無しさん** · 2018/06/17(日) 13:31:33.71

MSのgithub買収でVSからclone出来ないリポジトリが増えて
SJIS消えてくれたらいいのに
っていうかwindowsの標準localeでUTF-8選びたいんだが
chcp65001はもういやバグだらけ

**デフォルトの名無しさん** · 2018/06/17(日) 13:54:11.58

>>389
今のWindows10ではUTF-8選べるから人柱になってくれ

**デフォルトの名無しさん** · 2018/06/18(月) 01:32:33.22

linux つかってる俺はUTF8統一で隙はなかった。
そういえばGO言語ってソースコードはUTF8で書けって仕様で規定されてるんだな。(変な文字変数名に使えてビビった)

**デフォルトの名無しさん** · 2018/06/18(月) 15:52:30.27

sjisはまだ許せる。utf16てめーはダメだ
内部コードに留めてメモリから外に出てこないでくれ

**デフォルトの名無しさん** · 2018/06/18(月) 16:14:38.61

std::wstringがデフォルトでUTF-32になるLinux 64bit版のSTLにも同じこと言えんの？

**デフォルトの名無しさん** · 2018/06/18(月) 16:17:38.73

SJISは完全に廃用でおｋ

**デフォルトの名無しさん** · 2018/06/18(月) 16:32:51.52

ほんそれ

**デフォルトの名無しさん** · 2018/06/18(月) 17:04:46.60

char32_tのある今、wchar_tの存在価値なんて無いでしょ
環境依存する上にWindowsではUTF-16ということで1要素1文字の前提も崩れてるし

**デフォルトの名無しさん** · 2018/06/18(月) 20:41:12.57

誰に賛成して、誰に反対しているかわからん。安価つけろ。

**デフォルトの名無しさん** · 2018/06/19(火) 07:29:13.13

？

**デフォルトの名無しさん** · 2018/06/19(火) 23:25:00.68

A社やG社始めメジャーなクラウド系サービスは全部UTF-8だな

**デフォルトの名無しさん** · 2018/06/20(水) 01:39:40.00

でも客にはSJIS対応を求められる不思議

**デフォルトの名無しさん** · 2018/06/20(水) 01:55:53.31

意味がわからないよな
SJIS神話は何なのだろう
ジジイだけでなく中年や、中には学生にまであるよねww
学生なんて生まれたときからUTF-8の環境にいるはずで、
わざわざ使いにくい環境をどこで覚えてくるんだろうと怖くもあるww

**デフォルトの名無しさん** · 2018/06/20(水) 02:06:06.18

日本語が２バイトで済む安心感じゃないの？
あと、最近の根拠もなく他国をおとしめて喜んでいる類の人達には、
日本専用のコード体系かっけーさすが日本すげーとか思ってそう。

**デフォルトの名無しさん** · 2018/06/20(水) 06:24:00.33

>>402
日本のビジネスデータは全銀フォーマット等のような固定長が基本だから
文字のバイト数が可変のUTF8は向かないんだよね
うちのシステムでも、相手がUTF8で作ったテキストを送りつけてきて
大事故になったことがあった

**デフォルトの名無しさん** · 2018/06/20(水) 08:03:37.13

日本はまだマシで英語しか知らない欧米の連中だと「文字は1バイト」が常識だから
多言語化してても日本語を表示すると半分しか表示されないとかザラ。
最近はライブラリの整備や（通常全角幅の）絵文字の浸透のおかげで欧米の保守層にも文字コードの概念が伝わってるけどね。

**デフォルトの名無しさん** · 2018/06/20(水) 08:52:51.05

絵文字どころか10年以上前流行ったような古い日本の全角顔文字発掘してきて使ったりしてるよな最近

**デフォルトの名無しさん** · 2018/06/20(水) 15:17:43.40

>>401
ほんそれ

**デフォルトの名無しさん** · 2018/06/20(水) 15:19:01.43

>>403
なるほど
だとするとEBCDIC対応を求められても不思議じゃないな

**デフォルトの名無しさん** · 2018/06/20(水) 17:02:56.44

utf-8で何も考えずにソートしたら漢字の並びが非直感的になるから
しぶしぶsjis

**デフォルトの名無しさん** · 2018/06/20(水) 19:18:14.29

>>404
想像で言ってるだろ

**デフォルトの名無しさん** · 2018/06/20(水) 19:25:53.85

このスレは、Windowsを実務PCとして使ってない人が愚痴をこぼすスレですか。

**デフォルトの名無しさん** · 2018/06/20(水) 19:50:25.18

ほんそれ。
Windows使ってりゃSJIS要求するのは普通だし、そのWindowsはレガシーとしてSJISを捨てられないだけだし。
神話とか日本専用コードとかｗ

**デフォルトの名無しさん** · 2018/06/20(水) 20:58:05.50

Windowsの文字コード周りで唯一好きなのは改行コードが\r\nである点。
他の環境ではLFだけという実際に即していないコードだから嫌。
LFなら普通は「桁位置はそのままで次の行に」でしょ……
abc\n
　　de
↑こうなるべき。

**デフォルトの名無しさん** · 2018/06/20(水) 21:28:20.83

Windowsは互換性のためしょうがない部分はあるが、そういうのは\e[でやってろって感じだな。

**デフォルトの名無しさん** · 2018/06/21(木) 01:11:25.06

>>412
改行コードなんだから当たり前だろ。寝ぼけんな。
CR は改行コードじゃなくて復帰コードな。ラインプリンターに出してるわけじゃないので復帰コードが必要かどうかは仕様依存。

**デフォルトの名無しさん** · 2018/06/21(木) 01:29:39.14

ラインプリンター由来じゃなくてタイプライター由来じゃないの
キャリッジリターン
ラインフィード

**デフォルトの名無しさん** · 2018/06/21(木) 01:34:17.28

>>415
タイプライターに文字コードは必要ない。
正確にはテレタイプ端末とかテレプリンターとか呼ばれてた奴なんだが、要はラインプリンターだ。

**デフォルトの名無しさん** · 2018/06/21(木) 01:45:44.30

じゃあラインプリンターにもキャリッジあるの？
https://www.e-bridge.jp/eb/tcontents/yasasikunai-p/images/imageA001.jpg

**デフォルトの名無しさん** · 2018/06/21(木) 02:17:29.23

ラインまるごと打つからラインプリンターなんだよねｗ

**デフォルトの名無しさん** · 2018/06/21(木) 09:07:52.61

MACみたいにCRだけっていうのは病気だけど

CR+LFが来たら常にCR無視しておけばいいし
自分で出力するときはLFだけ出力しておけばいい
それだけ

**デフォルトの名無しさん** · 2018/06/21(木) 09:41:35.70

Why is the line terminator CR+LF?
https://blogs.msdn.microsoft.com/oldnewthing/20040318-00/?p=40193

If you go to the various internet protocol documents, such as RFC 0821 (SMTP), RFC 1939 (POP), RFC 2060 (IMAP), or RFC 2616 (HTTP),
you'll see that they all specify CR+LF as the line termination sequence.
So the the real question is not "Why do CP/M, MS-DOS, and Win32 use CR+LF as the line terminator?"
but rather "Why did other people choose to differ from these standards documents and use some other line terminator?"

**デフォルトの名無しさん** · 2018/06/22(金) 13:23:16.23

そのブログは CR + LF を正当化してるけど、テキストファイルの改行は
単に行のデリミタであって、カーソルの移動を意味してるわけじゃないと思うんだよね

**デフォルトの名無しさん** · 2018/06/22(金) 15:59:28.46

International Business Machines

**デフォルトの名無しさん** · 2018/06/22(金) 21:46:22.33

HAL 9000
"I'm sorry, Dave, I'm afraid I can't do that."

**デフォルトの名無しさん** · 2018/06/26(火) 16:07:00.46

>>421
だよな。テレタイプじゃないんだから10か13をLE(Line End)にすればいいんだ

**デフォルトの名無しさん** · 2018/06/26(火) 22:23:33.42

一方でEBCDICはCRやLFとは別にNLを定義した。

**デフォルトの名無しさん** · 2018/06/27(水) 00:01:18.11

ｺﾚが正解

https://i.stack.imgur.com/e4xm6.jpg
つまり
carriage returnは行頭に復帰
line feedは行送り

CRだけなら何度も同じ行が上書きされる（行送りされない）
LFだけなら例えば3行だとこうなる
XXXXXXXX
　　　　　　　XXXXXXXX
　　　　　　　　　　　　　　XXXXXXXX

**デフォルトの名無しさん** · 2018/06/27(水) 00:23:59.29

⮠じゃなくて⮦

**デフォルトの名無しさん** · 2018/06/27(水) 00:37:35.67

>>426
何自慢げに周回遅れなこと書いてんだ？
それ前提の議論だぞ？
>>417見ろや

**デフォルトの名無しさん** · 2018/06/27(水) 00:53:00.34

そんなこといいだしたら
ﾃﾞﾘﾐﾀなんかなんでもいいことになる
ただの文字ｺｰﾄﾞの羅列だからな
CRである必要もないしLFである必要もない

そもそもｷﾐﾗはｱﾎなこといってるﾜｹ
項目のﾃﾞﾘﾐﾀにｶﾝﾏつかったり水平ﾀﾌﾞ使ったりする
行のﾃﾞﾘﾐﾀだってなんでもいい

ﾊﾞｶはﾎﾝﾄ困るわぁ

**デフォルトの名無しさん** · 2018/06/27(水) 02:30:43.48

>>429
だから決めだけの問題だから何でもいい。
ASCIIという文字コードの規約の問題。

実際にEBCDICは CR でも LF でもない制御コードを別途改行コードとして用意した。
ASCII については規格の策定時から LF を押す国際派(ISO)と CR+LF を押す国内派(ANS)が対立していて一意に決まってない。

**デフォルトの名無しさん** · 2018/06/27(水) 09:37:29.05

もともとテレタイプ前提の文字コードだからなあ

**デフォルトの名無しさん** · 2018/06/27(水) 15:41:13.36

文字の話しろ

**デフォルトの名無しさん** · 2018/06/27(水) 15:48:44.41

いや文字コードの話するスレだろ

**デフォルトの名無しさん** · 2018/06/27(水) 18:10:34.52

CR/LFは文字じゃないのか……（驚愕）

**デフォルトの名無しさん** · 2018/06/27(水) 21:08:46.77

制御コードであって文字ではないな。
少なくともASCIIとUnicodeでは。

**デフォルトの名無しさん** · 2018/06/27(水) 22:13:49.89

制御文字のコードです

**デフォルトの名無しさん** · 2018/06/27(水) 22:58:53.48

>>420
その後に書いてある「I'm told that the ASCII committee changed the name of character 0x0A to "newline" around 1996, so the confusion level has been raised even higher.」
ってどういうことなんだろう？
ASCII委員会が1996年頃に0x0Aの名前をnewlineに変更して混乱が深まった？
ASCIIって1986年が最終改訂じゃないの？

**デフォルトの名無しさん** · 2018/06/28(木) 09:21:41.88

コンピュータの出力装置がゴルフボールの電動タイプライターだった時代、
例えば「アンダーライン入りの文字」を打つ時は、普通に文字を打って、
「ラインフィードの無いキャリッジリターン」をやって、
アンダーラインだけを打っていたのだと思う。

すると、キャリッジリターンには、ラインフィードが付く場合と付かない
場合があり、両者は明確に区別できなければならないはず。
ASCIIコードが制定された時代から考えると、改行コードが「ＣＲ／ＬＦ」
になったのは、そうゆう趣旨かな？と思う。

**デフォルトの名無しさん** · 2018/06/28(木) 09:47:22.60

>>438
キャリッジリターンは行頭に戻るだぞ
キャリッジリターンだと行頭の文字しかアンダーラインを打てないのでは？

バックスペースで1文字分戻ってアンダーラインを打ったり
文字を二度打ちして太字にしたりしてたと聞いたぞ

**デフォルトの名無しさん** · 2018/06/28(木) 11:06:58.11

BOMとかUTF-8Nってなんですか？

**デフォルトの名無しさん** · 2018/06/28(木) 12:37:34.87

>>439
なるほど。ありがとう。

**デフォルトの名無しさん** · 2018/06/28(木) 12:46:09.81

unicodeになって重ね打ち的な概念復活してきてね？

**デフォルトの名無しさん** · 2018/06/28(木) 15:12:27.72

>>439
重ね打ちをしたくないところはスペースを使えばいい
>コンピュータの出力装置がゴルフボールの電動タイプライターだった時代
スペースは何も印字せずに印字位置を一文字分進めるのであって
その位置の文字を空白で置き換えたり
その位置に空白を挿入するのではなかったのだから

昔読んだ本に、重ね打ちのためにバックスペースを使っている文書を
バックスペースを使えないプリンターでも重ね打ちできるように
変換するプログラムが載っていた
詳細は忘れたけど、CRとスペースを使うのだったと思う

>>438
それだと行頭に戻る機能だけをCRとして用意する理由にはなっても
行頭に戻る機能をLFに持たせない理由にはならないのではないか?

行頭に戻さずに行だけ変えることに当時は意味があったのかも知れないけど思いつかない

**デフォルトの名無しさん** · 2018/06/28(木) 16:20:32.60

escシーケンスでも改行せずに行頭に戻したり出来たからな

**デフォルトの名無しさん** · 2018/06/28(木) 16:21:52.50

>当時は意味があったのかも知れないけど

紙の排出に使われてたぞ

**デフォルトの名無しさん** · 2018/06/28(木) 18:55:39.46

>>443
コレクションタイプに全字画印字のキーってなかったっけ？
まさに"空白"を打てるやつ。

**デフォルトの名無しさん** · 2018/06/28(木) 23:48:15.68

UTF-8Nというのは
だれかがﾃｷﾄｰにつけたUnicodeのｴﾝｺｰﾄﾞの名前
先に結論をいうとUTF-8NはBOMついてないUTF-8ということらしいからな
さらいえばUTF-8にBOMつける意味はほとんどない

とりあえず概要だけ書いといてやろう

BOMというのは、符号単位のｵｸﾃｯﾄの並びが
ﾘﾄﾙｴﾃﾞｨｱﾝかﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝか識別するためにﾌｧｲﾙの先頭にﾏｰｸされる
ちなみにそれぞれのｴﾝｺｰﾄﾞの符号単位はこんな感じなる

　UTF-8：1つのｵｸﾃｯﾄ
　UTF-16：2つのｵｸﾃｯﾄ
　UTF-32：4つのｵｸﾃｯﾄ

つまり、UTF-8ではそんなﾏｰｸつけても意味がない
ｵｸﾃｯﾄが1つしかないからな、並びなんか関係ない
2つ以上の場合、ｵｸﾃｯﾄの順序がﾘﾄﾙｴﾃﾞｨｱﾝかﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝかで
数値の表現のされかたが変わる

CISC系のﾁｯﾌﾟだと数値の表現はﾘﾄﾙｴﾝﾃﾞｨｱﾝが多い
RISC系のﾁｯﾌﾟだと数値の表現はﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝが多い

つまり、CISC系のﾁｯﾌﾟでﾘﾄﾙｴﾃﾞｨｱﾝで保存されたﾌｧｲﾙなら
ｴﾝﾃﾞｨｱﾝを気にせずにﾌｧｲﾙに保存された数値をそのまま読むことができる
しかしﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝなら一旦ｵｸﾃｯﾄの並びを逆転させてから
数値を読みとる必要がある
RISC系のﾁｯﾌﾟならその逆になる

分かった？

**デフォルトの名無しさん** · 2018/06/29(金) 03:04:36.82

わかんない。
なんで他のシステムで読む可能性のあるファイルなのに
フォーマットを決めないの？

**デフォルトの名無しさん** · 2018/06/29(金) 09:04:53.35

>>443
> 行頭に戻さずに行だけ変えることに当時は意味があったのかも知れないけど思いつかない
例えば、ゴルフボールで次のようにタイプすることを考えてみる。（□はスペース）

□□□□□□□ＡＡ
□□□□□□□ＡＡ

□□□□□□□ＡＡ「ＣＲの無いＬＦ」「ＢＳ」「ＢＳ」ＡＡ
と打つと、行頭に戻すよりも速く打てると思うが。

**デフォルトの名無しさん** · 2018/06/29(金) 09:11:34.75

CISC RISC って今は無意味だしエンディアンとは関係ない
関係あると思うのは知ってるCPUが少ないだけかと

あと上で重ね打ちが昔の話みたいに言ってるけど
man使ったことないの？
端末によるけどたいていアンダーラインがつくよ

**デフォルトの名無しさん** · 2018/06/29(金) 09:17:15.33

>>443
CRとLFに分かれてるのは当時のハードウエアがそういう仕様だったから
画面制御のコンテキストで意味を求めてもしょうがない

**デフォルトの名無しさん** · 2018/06/29(金) 11:08:54.85

BOMの有無でCSVをexcelに読ませる際に文字化けするんだよね

**デフォルトの名無しさん** · 2018/06/29(金) 11:50:23.53

そういう仕様だったから、ってのは何の考察にもなってない。
人類が争いをやめないのはそういう仕様になってるから。

**デフォルトの名無しさん** · 2018/06/29(金) 15:14:45.43

>>450
>(manでは)端末によるけどたいていアンダーラインがつくよ

manでアンダーラインがつかないと言っている人はいないし、昔は
>バックスペースで1文字分戻ってアンダーラインを打ったり
>文字を二度打ちして太字にしたりしてた
というのとは別の話だろ

**デフォルトの名無しさん** · 2018/06/29(金) 15:35:26.60

>>453
そうなっていたのはなぜかという話をしているのに
「そうなっていたから」と返されてもな…

**デフォルトの名無しさん** · 2018/06/29(金) 16:16:27.86

>>449
速く打てるだろうけど、そういうことをやりたい状況ってどれぐらいあるんだろ
行頭へ戻すほうがずっと多いだろうし、その場合にCR LFと打つことに
なってもしかたないと思えるほど>>449の状況は多かったのだろうか

キーを一つ押せばCR LFと出るように設定できれば手間はかからずにすむけど
設定できたとしても改行に2文字使うのは変わらない

昔は記録用に紙テープを使っていたようで、行毎に1文字多く使うと
その分、紙テープの消費は多くなる
そうなってもしかたないと思えるほど>>449の状況は多かったのだろうか

**デフォルトの名無しさん** · 2018/06/29(金) 22:19:47.60

ちょっと関係ないがGoogle翻訳では改行は%0Aだね。
HTTP関連の改行コードはCRLFが多いと思うんだけど，珍しい。

**デフォルトの名無しさん** · 2018/06/29(金) 22:36:32.85

そこはhttp関係ないじゃん

**デフォルトの名無しさん** · 2018/06/29(金) 23:08:44.45

むしろﾌｫｰﾏｯﾄがきまってる
ﾘﾄﾙｴﾝﾃﾞｨｱﾝの形式でもいいし
ﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝの形式でもいいというﾌｫｰﾏｯﾄだからな

構成ｼｽﾃﾑがﾘﾄﾙｴﾝﾃﾞｨｱﾝの計算機が多い場合、ﾘﾄﾙｴﾝﾃﾞｨｱﾝで扱う方が有利
当然、構成ｼｽﾃﾑがﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝの計算機が多い場合、ﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝで扱う方が有利になる
後処理の計算機のﾘｿｰｽ消費量を減らすために先にいちいち毎回ｴﾝﾃﾞｨｱﾝ変換するのもﾑﾀﾞだしな

ちなみにﾈｯﾄﾜｰｸのﾌﾟﾛﾄｺﾙの標準では歴史的な事情があって
ほぼ暗黙でﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝになってる
ﾄﾞｷｭﾒﾝﾄにｴﾝﾃﾞｨｱﾝが記載されてなければ
ﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝとみなしてほぼ問題ない

**デフォルトの名無しさん** · 2018/06/29(金) 23:10:02.53

ちなみにｷﾐﾗみたいな貧乏人が使ってるPCは
ほとんどﾘﾄﾙｴﾝﾃﾞｨｱﾝになる

**デフォルトの名無しさん** · 2018/06/30(土) 00:16:14.33

やっぱり今時半角カタカナ使う人にはアレな人が多いのか

**デフォルトの名無しさん** · 2018/06/30(土) 01:04:57.77

>>459
どっちでもいい＝決まってないだろ
頭悪いと半角カタカナが大好きになるのはなんでだぜ？

**デフォルトの名無しさん** · 2018/06/30(土) 03:46:45.67

>>460
じゃあお前何使ってんだ？
貧乏人なのでスマフォ叩きながら質問。

**デフォルトの名無しさん** · 2018/06/30(土) 04:38:43.11

やっぱりユニコードが諸悪の根源
あれが入って来てからコンピュータが扱いづらくなった
日本はSJISに統一しよう

**デフォルトの名無しさん** · 2018/06/30(土) 06:04:05.89

Unicode程度でコンピューターを扱いずらくなる脳味噌って……同情するわ。

**デフォルトの名無しさん** · 2018/06/30(土) 13:06:02.67

エンディアン関係ないUTF-8が一番良いな

**デフォルトの名無しさん** · 2018/06/30(土) 13:32:27.92

UTF-8 はバイト列を見て文字がわかりにくいのが難点

**デフォルトの名無しさん** · 2018/06/30(土) 13:49:23.03

>>467
なんで？

◆QZaw55cn4c · 2018/06/30(土) 14:05:18.42

>>464
最初から 32 ビットにしなかったのが問題でしたね

**デフォルトの名無しさん** · 2018/06/30(土) 18:58:11.39

>>468
うーん、いやあ、あらためて考えると単に分かりづらいと思い込んでる
だけだったかも。JISX0208 の文字って３バイトになるでしょ。
あの 3バイトずつになるのがどうも慣れないだけだった。467 は撤回するよ

**デフォルトの名無しさん** · 2018/06/30(土) 20:27:41.69

BOMでｴﾝﾃﾞｨｱﾝが規定できるからな
そのようにﾌｫｰﾏｯﾄできまってる
数値の読みとりかたも一意に定まる

どっちでもいいというﾜｹではない
ﾊﾞｶはﾎﾝﾄ困るわぁ

つまり
ﾘﾄﾙｴﾝﾃﾞｨｱﾝで2つ以上のｵｸﾃｯﾄがあるのに
先頭にBOM入れないﾔﾂはｺﾞﾐｸｽﾞといえる

Javaのﾊﾞｲﾄｺｰﾄﾞに CAFE BABE が入ってないぐらいお話にならない

ﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝならBOMなくてもｵﾚはよいとしようと考える