プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5912デフォルトの名無しさん
2018/11/24(土) 23:36:50.36ID:nC23MCFq 20年前でもほぼ8bitが通る状況だったならMUAの側も
8bit文字をエンコードせずに送る設定を用意してもよさそうだが
それができるMUAはあるんだろうか
8bit文字をエンコードせずに送る設定を用意してもよさそうだが
それができるMUAはあるんだろうか
913デフォルトの名無しさん
2018/11/25(日) 00:05:18.90ID:KC5pxzP6914デフォルトの名無しさん
2018/11/25(日) 00:12:25.76ID:nGQiRV3b 税の申告書で屋号とか書く欄があったような無かったような
915デフォルトの名無しさん
2018/11/25(日) 01:10:56.47ID:Tmpw9nku916デフォルトの名無しさん
2018/11/25(日) 17:37:13.70ID:arFqKMW0917デフォルトの名無しさん
2018/11/26(月) 00:16:22.18ID:55zKdsET >>905
局部の隠し方が絶妙すぎて笑う
局部の隠し方が絶妙すぎて笑う
918デフォルトの名無しさん
2018/11/26(月) 11:27:31.30ID:SVaivieI >>914
昔はあった、今もあるかは知らん
昔はあった、今もあるかは知らん
919板の新参者ですが
2018/11/27(火) 07:32:04.24ID:bOfqa3Yp 5chでは、スレッドによってか板によってか知りませんが、
Unicode文字が数値文字参照に化けたりって、どういう場合
なのでしょうか?
スレの立て方で決められるのでしょうか?
⇒設定方法など、どなたか詳細をご存知でしたらご教示願います。
それとも板ごとに決まっているのでしょうか?
⇒設定一覧など、どなたか詳細をご存知でしたらご教示願います。
基本的なことようですが、自分では検索でうまくヒットできません。
Unicode文字が数値文字参照に化けたりって、どういう場合
なのでしょうか?
スレの立て方で決められるのでしょうか?
⇒設定方法など、どなたか詳細をご存知でしたらご教示願います。
それとも板ごとに決まっているのでしょうか?
⇒設定一覧など、どなたか詳細をご存知でしたらご教示願います。
基本的なことようですが、自分では検索でうまくヒットできません。
920デフォルトの名無しさん
2018/11/27(火) 08:48:35.30ID:vqp/19EL921デフォルトの名無しさん
2018/11/27(火) 10:50:58.56ID:zH6Yh8LQ BBS_UNICODE=passでも、今は数値文字参照(10進数)だけが使えるんだよな。
以前は数値文字参照(16進数)も文字実体参照も使えたんだけど。
js使った変換ツールで変換してるわ。
以前は数値文字参照(16進数)も文字実体参照も使えたんだけど。
js使った変換ツールで変換してるわ。
922デフォルトの名無しさん
2018/11/27(火) 14:22:21.18ID:pHjl6gJ9923デフォルトの名無しさん
2018/11/27(火) 16:22:46.53ID:zH6Yh8LQ とりあえず現状を試しておこう。
ハートの全角文字テスト
♥ → ♥
♥ → ♥
♥ → ♥
さて、どうかな?
ハートの全角文字テスト
♥ → ♥
♥ → ♥
♥ → ♥
さて、どうかな?
924デフォルトの名無しさん
2018/11/27(火) 19:32:26.19ID:t2TLQBob 📛 日本人には幼稚園児の名札に見える絵文字は、外国人には何なのかさっぱりわからず『燃えるトーフ』と呼ばれていた - Togetter
https://togetter.com/li/1292538
https://togetter.com/li/1292538
925デフォルトの名無しさん
2018/11/27(火) 19:57:48.88ID:gXLD+0BO 顔文字はこれ以上増やすよりZWJを使って目とか口とかを組み合わせて
自分で作れるようにした方がいいと思う
自分で作れるようにした方がいいと思う
926デフォルトの名無しさん
2018/11/27(火) 20:14:23.30ID:+uQVAXpU 全角とは
927デフォルトの名無しさん
2018/11/28(水) 02:59:23.88ID:BkKDQWNJ FULL WIDTH
928デフォルトの名無しさん
2018/11/28(水) 04:06:11.10ID:A2M+lx4Y929デフォルトの名無しさん
2018/11/28(水) 09:49:40.91ID:zomCLGU3 横方向に Full Width 全角
縦方向に Full Width 倍角
?
縦方向に Full Width 倍角
?
930デフォルトの名無しさん
2018/11/28(水) 12:51:43.14ID:b91COmuR ワープロ専用機時代、横倍角なんていう気持ち悪いのがあったな
931デフォルトの名無しさん
2018/11/28(水) 15:08:09.04ID:N7oZ3GQl 〴
〵
気持ち悪いってもこれよりはマシやろ
〵
気持ち悪いってもこれよりはマシやろ
932デフォルトの名無しさん
2018/11/29(木) 01:40:08.15ID:lIzTCHsu HALF WIDTH (^-^)
FULL WIDTH ( ^ _ ^ )
FULL WIDTH ( ^ _ ^ )
933デフォルトの名無しさん
2018/11/29(木) 14:33:52.79ID:Msn7clch iconvの文字集合オプションに「EUC-JISX0213」っていうのがあったんだけど
これシステムはEUC-jpと認識するけど中にはJIS X 0213で定められた新しい文字を
入れられるって意味……じゃないよね。
というのはSKK-JISYOで使いたい異字体があったのでこのエンコーディングをしてみたけど無理だったので。
これシステムはEUC-jpと認識するけど中にはJIS X 0213で定められた新しい文字を
入れられるって意味……じゃないよね。
というのはSKK-JISYOで使いたい異字体があったのでこのエンコーディングをしてみたけど無理だったので。
934デフォルトの名無しさん
2018/11/30(金) 13:11:19.56ID:FBzo8MwT >>933
少しぐらいは調べろよ……検索したら幾らでも情報が出てくるよ。
EUC-JPの一種だけど今は廃止されてる。
EUC-JIS-2004 - Wikipedia
https://ja.wikipedia.org/wiki/EUC-JIS-2004
EUC-JISX0213 ‐ 通信用語の基礎知識
https://www.wdic.org/w/WDIC/EUC-JISX0213
少しぐらいは調べろよ……検索したら幾らでも情報が出てくるよ。
EUC-JPの一種だけど今は廃止されてる。
EUC-JIS-2004 - Wikipedia
https://ja.wikipedia.org/wiki/EUC-JIS-2004
EUC-JISX0213 ‐ 通信用語の基礎知識
https://www.wdic.org/w/WDIC/EUC-JISX0213
935デフォルトの名無しさん
2018/11/30(金) 14:13:45.09ID:P5LXHiB7 廃止されたんか…
936デフォルトの名無しさん
2018/11/30(金) 14:42:42.21ID:XOMh22Gb 廃止されたんよ
937デフォルトの名無しさん
2018/11/30(金) 14:59:53.47ID:5jWhYr7h そうなんかい…
938デフォルトの名無しさん
2018/12/01(土) 01:50:51.78ID:V6WUEvLt EUCで0213したいときはどうすればいいんだ…
939デフォルトの名無しさん
2018/12/01(土) 02:27:14.32ID:O7l2nkqH 普通にEUC-JIS-2004を使え
940デフォルトの名無しさん
2018/12/01(土) 02:33:51.02ID:LH+8CiFR えぇ…
941デフォルトの名無しさん
2018/12/01(土) 04:17:45.98ID:r8gMvw+h なんで廃止するんだ…
942デフォルトの名無しさん
2018/12/01(土) 15:43:51.59ID:4cHgv8YS よう分からん。
EUC-JISX0213(JIS X 0213:2000ベース)は廃止されて、EUC-JIS-2004(JIS X 0213:2004ベース)になったってことでいいのか?
EUC-JISX0213(JIS X 0213:2000ベース)は廃止されて、EUC-JIS-2004(JIS X 0213:2004ベース)になったってことでいいのか?
943デフォルトの名無しさん
2018/12/01(土) 16:34:03.50ID:bl/45R/s 改訂のタイミングでX0213から-2004に名前が変わっただけってこと?
944デフォルトの名無しさん
2018/12/03(月) 16:03:32.93ID:FWFg2HSw >>942
そゆこと。
実際にはEUC-JIS-2004が上位互換だし、ウィキペディアからの引用だけど、
>なお、この符号化方式はJIS X 0213の初版 (2000年) ではEUC-JISX0213と命名されていた。
>2004年改正におけるUCS互換漢字10文字の有無だけが異なるが、大きな違いではないためEUC-JIS-2004と同一視されることもある。
とのことなので、ほぼ同じものと思ってよい。
そゆこと。
実際にはEUC-JIS-2004が上位互換だし、ウィキペディアからの引用だけど、
>なお、この符号化方式はJIS X 0213の初版 (2000年) ではEUC-JISX0213と命名されていた。
>2004年改正におけるUCS互換漢字10文字の有無だけが異なるが、大きな違いではないためEUC-JIS-2004と同一視されることもある。
とのことなので、ほぼ同じものと思ってよい。
945デフォルトの名無しさん
2018/12/04(火) 00:06:31.38ID:kEiJOL5a なあんだ
946デフォルトの名無しさん
2018/12/05(水) 23:26:18.07ID:0a3ULp4B JISの漢字コードってたまにそういうのあるよね
2文字増えただけのJIS0208-1990とか
2文字増えただけのJIS0208-1990とか
947デフォルトの名無しさん
2018/12/07(金) 11:12:03.49ID:baVD1zSv 日本マイクロソフトやAdobeが改元対応を説明
https://pc.watch.impress.co.jp/docs/news/1157118.html
同社では、1993年に「マイクロソフト標準キャラクタセット」として、
相互運用を目的とした文字コードを策定しているが、
今回の新元号対応では同社独自の対応は行なわず、ベースとなる標準に準拠し、
Code Page 932/拡張文字を含むシフトJISでは対応を行なわないと説明。
Unicodeについては標準の対応に準じた更新を予定する。
フォント更新については、同社のシステム標準フォントである
MSゴシックやMeiryo UI、Yu Gothic UIなどで新元号に対応するとした。
なお、IME辞書の更新については、フォントを含むすべての更新作業後の対応となる。
https://pc.watch.impress.co.jp/docs/news/1157118.html
同社では、1993年に「マイクロソフト標準キャラクタセット」として、
相互運用を目的とした文字コードを策定しているが、
今回の新元号対応では同社独自の対応は行なわず、ベースとなる標準に準拠し、
Code Page 932/拡張文字を含むシフトJISでは対応を行なわないと説明。
Unicodeについては標準の対応に準じた更新を予定する。
フォント更新については、同社のシステム標準フォントである
MSゴシックやMeiryo UI、Yu Gothic UIなどで新元号に対応するとした。
なお、IME辞書の更新については、フォントを含むすべての更新作業後の対応となる。
948デフォルトの名無しさん
2018/12/07(金) 16:19:20.12ID:qBlHhwTE え、これってひょっとして新元号合字が使えるのはUnicode系統だけで、
JIS X0208/SJIS/CP932系統では今後永遠に使えるようにならないってこと?
元号合字を必要としてるとこって、まさに未だそういう系統を使ってるとこだと思うんだけど…
JIS X0208/SJIS/CP932系統では今後永遠に使えるようにならないってこと?
元号合字を必要としてるとこって、まさに未だそういう系統を使ってるとこだと思うんだけど…
949デフォルトの名無しさん
2018/12/07(金) 16:48:04.41ID:7WHjGWxq 独自の文字セットで運用すりゃいいだけ
950デフォルトの名無しさん
2018/12/07(金) 21:50:22.19ID:0/x3pMw+ JIS X 0213に入ったら
当然Shift_JISにもいれるべき
~ 2D5F
潤@2D6F
氏@2D6E
香@2D6D
2D5Eが空いてる
当然Shift_JISにもいれるべき
~ 2D5F
潤@2D6F
氏@2D6E
香@2D6D
2D5Eが空いてる
951デフォルトの名無しさん
2018/12/07(金) 22:22:10.91ID:nIptkpuh 和田研細丸ゴシックのU+32FFのグリフ
平成
の次
で吹いたw
平成
の次
で吹いたw
952デフォルトの名無しさん
2018/12/07(金) 22:28:33.61ID:Z7Pkiqbl しかし年号の余裕も言うほどないよな
10人くらいがばばーっと毎年のように亡くなって年号も変わったらどうするつもりなのだろう
なんだかんだで西暦が一番よねえ
もしくはネトウヨが言うような皇紀とやらにしちゃいなよ
人で変わらない数字って楽ちんよー
四桁にもなれば先頭はまず変わらないわけだし
10人くらいがばばーっと毎年のように亡くなって年号も変わったらどうするつもりなのだろう
なんだかんだで西暦が一番よねえ
もしくはネトウヨが言うような皇紀とやらにしちゃいなよ
人で変わらない数字って楽ちんよー
四桁にもなれば先頭はまず変わらないわけだし
953デフォルトの名無しさん
2018/12/07(金) 23:44:21.45ID:Sv6zm0b9 そんなにしょっちゅう変わったらさすがに文字コード需要のほうがなくなりそうだが
954デフォルトの名無しさん
2018/12/08(土) 01:15:36.39ID:7zz08Xs4 どのみち継承者を今後10年で10人確保するのは無理なので…
955デフォルトの名無しさん
2018/12/08(土) 02:21:31.30ID:nIDZ4yFF 赤ちゃんでもいいので可能性はある
956デフォルトの名無しさん
2018/12/08(土) 03:58:41.86ID:xmV4OmOO 既にある文字を組み合わせた合字が増え続けるとわかっているなら次の文字が半分の大きさであることを
表すコントロールコードを作ってしまってそれを付加した2文字を使った方が良いのではないか?
そうしないと延々と文字が増え続ける。
表すコントロールコードを作ってしまってそれを付加した2文字を使った方が良いのではないか?
そうしないと延々と文字が増え続ける。
957デフォルトの名無しさん
2018/12/08(土) 05:46:24.58ID:4O5fRXD5 なんかプレッシャーに耐えかねてホモに走って断絶なんてことになりそうな気もするけどなあ
958デフォルトの名無しさん
2018/12/08(土) 08:49:48.25ID:VbRdNM0/ 縦書きも考慮しなきゃいけないとか面倒くさすぎだな
新元号対応について
https://citpc.jp/download/2018-12-06%20CITPC%20Seminar_Ken%20Tamaru.pdf
新元号対応について
https://citpc.jp/download/2018-12-06%20CITPC%20Seminar_Ken%20Tamaru.pdf
959デフォルトの名無しさん
2018/12/09(日) 20:48:07.44ID:NLNV6qg6 >>948
JIS X 0213が話題になった時もMicrosoftが表明したのは
「マイクロソフト標準キャラクタセットはもう凍結、
CP932の拡張はしない、UCS/Unicodeとしてはサポートする」
だったから既定の方針通りですな。
http://www.jepa.or.jp/jepa_cms/wp-content/uploads/2010/05/jepa0000518783.pdf
https://www.itscj.ipsj.or.jp/hasshin_joho/unei/files/unei21-Kajisa.pdf
JIS X 0213が話題になった時もMicrosoftが表明したのは
「マイクロソフト標準キャラクタセットはもう凍結、
CP932の拡張はしない、UCS/Unicodeとしてはサポートする」
だったから既定の方針通りですな。
http://www.jepa.or.jp/jepa_cms/wp-content/uploads/2010/05/jepa0000518783.pdf
https://www.itscj.ipsj.or.jp/hasshin_joho/unei/files/unei21-Kajisa.pdf
960デフォルトの名無しさん
2018/12/10(月) 08:46:40.86ID:S9fSc6ei Unifontだと、32FFは
32
FF (undefined)
だね。こうゆうのが、一番解りやすくていいんだけど、
なぜ他のフォントは、マネをしないんだろうか?
32
FF (undefined)
だね。こうゆうのが、一番解りやすくていいんだけど、
なぜ他のフォントは、マネをしないんだろうか?
961デフォルトの名無しさん
2018/12/10(月) 13:28:03.68ID:7KZwr80a Firefoxとかはフォントにない文字は自動でその表示になるよね。
まあ、文字コードがどうとか関係ない大多数の人にとって、
そんなデバッグモードみたいな出力されても逆に意味不明だから広がらないんだろうな。
まあ、文字コードがどうとか関係ない大多数の人にとって、
そんなデバッグモードみたいな出力されても逆に意味不明だから広がらないんだろうな。
962デフォルトの名無しさん
2018/12/10(月) 17:39:24.58ID:A+rv6wMQ 未収録のままにして他のフォントで表示してくれたほうがありがたいからなあ
963デフォルトの名無しさん
2018/12/10(月) 19:51:03.00ID:hinx2Zbo それだな
グリフがあると自動フォールバックが利かなくなる
グリフがあると自動フォールバックが利かなくなる
964デフォルトの名無しさん
2018/12/10(月) 22:52:22.99ID:N5SCf3O2 U+32FFは初期のUnicodeでは現在U+3004にあるJISマークだったんだな。
で、当時U+3004は記号扱いの「仝」で漢字扱いの「仝」(U+4EDD)とは区別してたらしい。
で、当時U+3004は記号扱いの「仝」で漢字扱いの「仝」(U+4EDD)とは区別してたらしい。
965デフォルトの名無しさん
2018/12/10(月) 23:18:14.27ID:hinx2Zbo 新元号はM/T/S/H以外が実用上望ましいんだよな。
Jか…いけるなあ。
Jか…いけるなあ。
966デフォルトの名無しさん
2018/12/11(火) 13:17:12.25ID:eQLW3H68 放送大学のUnicodeの番組わかりやすかった
967デフォルトの名無しさん
2018/12/11(火) 16:17:48.41ID:gC3VOuLX 地上波で映らなくなったから見れない…
968デフォルトの名無しさん
2018/12/11(火) 18:11:21.44ID:uSURGRNJ 残念だ
969デフォルトの名無しさん
2018/12/11(火) 20:34:24.45ID:ku/Zz2dV 囲みCJK文字/月ブロックは平成の次で全て埋まると思ったが、U+321Fがまだ空いてるな。
次の次の元号はもしその時になっても空きだったらそこになるのかな。
次の次の元号はもしその時になっても空きだったらそこになるのかな。
970デフォルトの名無しさん
2018/12/11(火) 21:42:40.13ID:Hrs/4e8e >>960
フォントサイズが増えるからでしょ?
フォントサイズが増えるからでしょ?
971デフォルトの名無しさん
2018/12/15(土) 07:05:36.47ID:LC13wD1r >>966
紹介サイトのURLとか貼れます?
紹介サイトのURLとか貼れます?
972デフォルトの名無しさん
2018/12/15(土) 13:39:28.60ID:ciQUdpOi シラバス
https://www.ouj.ac.jp/hp/kamoku/2019/kyouyou/C/joho/index.html
この前見たのはこれだったかな
情報理論とデジタル表現(’19)
の 第11回 テキストの符号化
これもおすすめ
デジタル情報の処理と認識(’18)
通信概論(’14)
https://www.ouj.ac.jp/hp/bangumi/year_tv.html
公開番組もあり
https://vod.ouj.ac.jp/view/ouj/#/navi/vod?ca=489
https://www.youtube.com/channel/UCd8zAzjHkIcPbnTDyn-q50w/videos
https://www.ouj.ac.jp/hp/kamoku/2019/kyouyou/C/joho/index.html
この前見たのはこれだったかな
情報理論とデジタル表現(’19)
の 第11回 テキストの符号化
これもおすすめ
デジタル情報の処理と認識(’18)
通信概論(’14)
https://www.ouj.ac.jp/hp/bangumi/year_tv.html
公開番組もあり
https://vod.ouj.ac.jp/view/ouj/#/navi/vod?ca=489
https://www.youtube.com/channel/UCd8zAzjHkIcPbnTDyn-q50w/videos
973デフォルトの名無しさん
2018/12/15(土) 14:24:01.62ID:/xz8BzsC Windows 10 Insider Preview、メモ帳でBOMなしのUTF-8が選択可能に | スラド デベロッパー
https://developers.srad.jp/story/18/12/14/0345249/
ついに
https://developers.srad.jp/story/18/12/14/0345249/
ついに
974デフォルトの名無しさん
2018/12/15(土) 14:46:24.79ID:Sg9amITu BOMカットするのなんてマなら簡単だろ
975デフォルトの名無しさん
2018/12/15(土) 15:14:00.77ID:+6LwXb2C マジかよ圧倒的シェアのWindowsがBOM付きだからという理由で自分は全部BOM月にしてたのに梯子外されたのかよ
976デフォルトの名無しさん
2018/12/15(土) 15:21:32.65ID:Sg9amITu SJIS絶滅はよ
977デフォルトの名無しさん
2018/12/15(土) 15:27:12.87ID:EyhC0X8P >>975
わざとらしい。Windowsのネイティブ文字コードはUTF16なんだから普通はUTF16を使うだろ
メモ帳で保存するときに、Unicodeを選んだらUTF16になる
UnicodeといえばUTF16のこと
わざとらしい。Windowsのネイティブ文字コードはUTF16なんだから普通はUTF16を使うだろ
メモ帳で保存するときに、Unicodeを選んだらUTF16になる
UnicodeといえばUTF16のこと
>>975
そもそも Byte Order Mark の必要のない UTF-8 に BOM を付けていることが論理的に矛盾していますよね
そもそも Byte Order Mark の必要のない UTF-8 に BOM を付けていることが論理的に矛盾していますよね
979デフォルトの名無しさん
2018/12/15(土) 15:44:04.63ID:EyhC0X8P >>979
>UTF-8の仕様によると、BOMは文書がUnicodeであることを自動判定するためにも用いられる
>らしい
らしい、ですか…
本当にそうなのか確かめてみました。RFC3629 https://tools.ietf.org/html/rfc3629 の記述は
The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known
informally as "BYTE ORDER MARK" (abbreviated "BOM").
BOM は本来は「ゼロ長割り込みなしスペース」という意味らしいですね…
ながながとあれやこれは書いてあったのですが結論はよくわからないです、誰か英語のできる人、どこを読めばいいか教えてください…
>UTF-8の仕様によると、BOMは文書がUnicodeであることを自動判定するためにも用いられる
>らしい
らしい、ですか…
本当にそうなのか確かめてみました。RFC3629 https://tools.ietf.org/html/rfc3629 の記述は
The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known
informally as "BYTE ORDER MARK" (abbreviated "BOM").
BOM は本来は「ゼロ長割り込みなしスペース」という意味らしいですね…
ながながとあれやこれは書いてあったのですが結論はよくわからないです、誰か英語のできる人、どこを読めばいいか教えてください…
981デフォルトの名無しさん
2018/12/15(土) 21:51:17.49ID:px2y3yP7 ISO10646では誤解を受けそうなBOMという呼び名は使われていなくてSignatureと言うらしい。
現在ではU+FEFFは専らSignatureを表すものとして、もともとのゼロ幅ノーブレークスペースの意味で
使用することは推奨されていない。代わりにU+2060 WORD JOINERを使用することになっている。
現在ではU+FEFFは専らSignatureを表すものとして、もともとのゼロ幅ノーブレークスペースの意味で
使用することは推奨されていない。代わりにU+2060 WORD JOINERを使用することになっている。
982デフォルトの名無しさん
2018/12/15(土) 23:06:31.96ID:8aRCy95z やはり頭悪いのはunicodeと符号化を混同してる
文書は符号化されたunicodeということになる
2つ以上のオクテットを使う符号単位で
BOM入れないヤツは池沼だからな
文書は符号化されたunicodeということになる
2つ以上のオクテットを使う符号単位で
BOM入れないヤツは池沼だからな
983デフォルトの名無しさん
2018/12/16(日) 00:59:01.64ID:0WbTxJge WindowsがなぜUTF-16のことをUnicodeといっているかというと、
Windows NT 初代の3.1(1994年)当時は世界中の文字は16bitで
全て表現できると思われていたからだよ。
Windows NTは最初からUnicodeに対応したOSなのだが、
当時はUnicode = 16bit = UTF-16が成り立っていた
それが間違っているとわかってUnicodeが21bitに拡張されたのが
Unicode 2.0 (1996年7月)
メモ帳がUTF-16をUnicodeと表現するのはその名残りだよ
そういう歴史を知らないで語ると恥をかく
Windows NT 初代の3.1(1994年)当時は世界中の文字は16bitで
全て表現できると思われていたからだよ。
Windows NTは最初からUnicodeに対応したOSなのだが、
当時はUnicode = 16bit = UTF-16が成り立っていた
それが間違っているとわかってUnicodeが21bitに拡張されたのが
Unicode 2.0 (1996年7月)
メモ帳がUTF-16をUnicodeと表現するのはその名残りだよ
そういう歴史を知らないで語ると恥をかく
984デフォルトの名無しさん
2018/12/16(日) 02:37:42.34ID:/e3hQGaS その当時の話をするならUCS-2じゃないの?
985デフォルトの名無しさん
2018/12/16(日) 05:34:39.63ID:oz52hRFm 寿司と言えば江戸だったから江戸前って名前になった、まで読んだ。
986デフォルトの名無しさん
2018/12/16(日) 11:01:00.63ID:0qV7OEGg 時すでにお寿司
987デフォルトの名無しさん
2018/12/16(日) 12:33:16.52ID:GapmNYlr988デフォルトの名無しさん
2018/12/16(日) 12:35:57.48ID:VlX3xGEw 寿司と言えば江戸ではなかったから、
江戸の寿司と強調したいときは、わざわざ江戸前寿司というようになった
ではないのか?
江戸の寿司と強調したいときは、わざわざ江戸前寿司というようになった
ではないのか?
989デフォルトの名無しさん
2018/12/16(日) 13:50:47.39ID:52dtexo8 寿司食いねえ! 🍣
990デフォルトの名無しさん
2018/12/16(日) 15:02:40.57ID:/e3hQGaS 押し寿司とかなれ寿司が寿司だよな。
酢で酸っぱくした寿司なんかフェイク寿司もいいところ。
酢で酸っぱくした寿司なんかフェイク寿司もいいところ。
991デフォルトの名無しさん
2018/12/16(日) 18:49:12.48ID:A6SlBDUO 押し寿司も酢飯使ってるよ
992デフォルトの名無しさん
2018/12/16(日) 20:12:23.42ID:oz52hRFm 火縄銃といえば種子島だから種子島って名前になった、まで読んだ
993デフォルトの名無しさん
2018/12/16(日) 20:40:53.56ID:Ux2imWCY 違うぞ。種子島の種とは、
子種のことだぞ。
種子島=子種島=ザーメン島
子種のことだぞ。
種子島=子種島=ザーメン島
994デフォルトの名無しさん
2018/12/16(日) 21:01:19.88ID:/e3hQGaS だから鉄砲はぴゅぴゅっと出るんですね
995デフォルトの名無しさん
2018/12/16(日) 21:10:12.52ID:oz52hRFm >>987
日本語でok
日本語でok
996デフォルトの名無しさん
2018/12/17(月) 16:59:55.19ID:Pfqpaohb997デフォルトの名無しさん
2018/12/17(月) 21:10:45.75ID:ncIi/eoH ドイツ語だと植物の種子も同じだからどうでもいい。
998デフォルトの名無しさん
2018/12/17(月) 21:18:37.04ID:lO+98ZHR999デフォルトの名無しさん
2018/12/17(月) 22:43:33.00ID:iPWzsOu1 >>996
thanx
thanx
1000デフォルトの名無しさん
2018/12/18(火) 01:01:53.52ID:dCapM8E2 次スレなぜか分裂
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 329日 2時間 3分 30秒
新しいスレッドを立ててください。
life time: 329日 2時間 3分 30秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★4 [ぐれ★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 【インバウンド】中国人観光客の日本での消費額は年間約2兆円超…中国政府は公務員の出張取り消し [1ゲットロボ★]
- 「クマはなるべく山に返す努力を」「クマと戦争は間違っている」動物保護活動家の主張 棲み分けと学習放獣でクマ被害なくなるのか?★7 [ぐれ★]
- アンケート調査で「高市発言は問題なし」 93.5%wwwwwwwwwwwwwwwwwwwwwwwww [279254606]
- 自閉症が「んなっしょい」と連呼するお🏡
- 現役猟師・俳優 東出昌大が語る「クマはそんな危ないもんじゃない」
- 【悲報】大分市佐賀関の火事、20軒→170軒に延焼🔥 [481941988]
- 日本人の海外旅行したきのマナーよくなったのはいつから
- へそグリグリ
