プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
探検
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5329デフォルトの名無しさん
2018/05/30(水) 13:24:00.49ID:uOQbJF8C330デフォルトの名無しさん
2018/05/30(水) 14:33:31.86ID:glkZKJxk 復旧
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
331デフォルトの名無しさん
2018/05/30(水) 20:29:52.46ID:+kRmOuNK >>329
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
332デフォルトの名無しさん
2018/05/30(水) 20:46:20.24ID:/bFYrAtR だから「ラウンドトリップ用」って話だろ?
333デフォルトの名無しさん
2018/05/30(水) 20:50:56.47ID:+kRmOuNK >>331
タイプミス。318→319
タイプミス。318→319
334デフォルトの名無しさん
2018/05/30(水) 20:55:57.87ID:+kRmOuNK335デフォルトの名無しさん
2018/05/30(水) 21:06:09.88ID:JjJ1rb8T 気に入らないなら自分で満足の行くように書き直して貼り付ければ?
典拠示されてるんだから。
典拠示されてるんだから。
336デフォルトの名無しさん
2018/05/31(木) 00:48:48.00ID:Rt4SPplt そんな中途半端に書き直して貼り付けるからデマの元になるんだろ。反省しろ。
337デフォルトの名無しさん
2018/05/31(木) 05:31:03.12ID:fKyHNhNo デマはどっちだよ……「CJK互換文字は」という文脈からは「CJK互換文字に含まれる全ての文字は」という意味しか受け取れないのだが?
「一部」なんていう表現はどっから湧き出てきたんだよ……。
「一部」なんていう表現はどっから湧き出てきたんだよ……。
338デフォルトの名無しさん
2018/05/31(木) 09:53:50.67ID:Rt4SPplt339デフォルトの名無しさん
2018/05/31(木) 12:04:29.61 ケチ付けるんなら他人を納得させられる論拠と出典を出せよ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
340デフォルトの名無しさん
2018/05/31(木) 15:11:25.68ID:LXR1oL3d 南京大虐殺は30万人アルニダ
341デフォルトの名無しさん
2018/05/31(木) 20:31:47.82ID:fKyHNhNo 誰か結論下さい(他力本願)。
342デフォルトの名無しさん
2018/05/31(木) 23:08:01.93ID:CO1u2co/ >>319のリンク先の規格書で、ラウンドトリップ用だから使用を推奨しないとされているのは以下の3種類だけ。
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
343デフォルトの名無しさん
2018/06/01(金) 05:30:12.89ID:vog2AnDp 誰が誰かよくわかんないけど少なくともCJK互換漢字の一部に関しては
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
344デフォルトの名無しさん
2018/06/01(金) 07:06:38.23ID:RdSMK5as345デフォルトの名無しさん
2018/06/01(金) 08:37:44.05ID:d/KZJvqH >>343
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
346デフォルトの名無しさん
2018/06/01(金) 11:58:37.96 >>342
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
347デフォルトの名無しさん
2018/06/01(金) 12:07:07.22ID:uCsHgk1n 規格書嫁とか無茶言うやつがいます。
あれは暗号で書いてあるので書いた人にも読めません。
あれは暗号で書いてあるので書いた人にも読めません。
348デフォルトの名無しさん
2018/06/01(金) 12:41:04.24ID:gevSrdmF あなたの能力の限界が人並み外れて低いからといって他人を同類扱いするのは良くない
349デフォルトの名無しさん
2018/06/01(金) 14:43:43.87ID:s/+fnCQL >>346
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
350デフォルトの名無しさん
2018/06/01(金) 22:29:28.35ID:/Zhh/Hrk351デフォルトの名無しさん
2018/06/01(金) 22:43:44.67352デフォルトの名無しさん
2018/06/01(金) 23:15:14.57ID:/Zhh/Hrk353デフォルトの名無しさん
2018/06/01(金) 23:19:16.78ID:d/KZJvqH 既にデマは溢れてるので、今さら少しくらいデマが増えたところで、どうってことないという見方もあるが
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
354デフォルトの名無しさん
2018/06/02(土) 03:00:41.99 弊社の開発プロジェクトでは「CJK互換」と名の付く文字は一律使用禁止とします
355デフォルトの名無しさん
2018/06/02(土) 05:43:50.91ID:6Boi961X Unicodeが公式に「利用を推奨しない」と明言しているのはCJK互換表意文字のそれも一部ってことはデマじゃないよね?
356デフォルトの名無しさん
2018/06/02(土) 06:07:25.49ID:23A3G5JH ここまでの議論読ませてもらったが
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
357デフォルトの名無しさん
2018/06/02(土) 08:33:48.72ID:6Boi961X358デフォルトの名無しさん
2018/06/02(土) 13:06:52.93ID:23A3G5JH 「これは食べられません」
と
「電子レンジ調理専用」
と
「電子レンジ調理専用」
359デフォルトの名無しさん
2018/06/02(土) 13:52:43.55ID:yUEJ+BJS Scheduled maintenance on June 2 and June 9 between 5am pst and 6pm pst. Expect down times of up to 5 hours while we upgrade the power feeds in our data center.
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
361デフォルトの名無しさん
2018/06/04(月) 17:00:48.61ID:pTAw0294 >>342
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
362デフォルトの名無しさん
2018/06/04(月) 23:13:57.26ID:M5dk3jbS 後半、ちょっと違うんでは? JIS X 0213 の追加漢字は別に無理して BMP に入ってない。普通に Exntend の方に入ってる。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
363デフォルトの名無しさん
2018/06/04(月) 23:20:06.40ID:M5dk3jbS 規格がいってるのは CJK互換漢字ブロックはもともと複数の文字コードとのラウンドトリップ用なんだけど、
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
364デフォルトの名無しさん
2018/06/06(水) 14:26:39.66ID:R+kWiM6Z Announcing The Unicode Standard, Version 11.0
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
365デフォルトの名無しさん
2018/06/07(木) 22:48:02.08ID:YXHr2tyJ Unicode 11.0出たのか、つかもう一年経ったのか……。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
366デフォルトの名無しさん
2018/06/07(木) 23:56:45.77ID:LqY2ZR0d 一昨年末に名称が正式決定したニホニウム等の元素を表す漢字がUROの末尾に追加になったんだな。
367デフォルトの名無しさん
2018/06/08(金) 00:10:00.49 そんなもんで漢字増やすなや!
368デフォルトの名無しさん
2018/06/08(金) 14:59:48.37ID:HNv18lZE 去年も書いたけど
Core Specification
Appendix D
Version History of the Standard
の漢字のとこの数字が足した数と合計で合わないんだよなぁ
48違うって何なんだろ。
Core Specification
Appendix D
Version History of the Standard
の漢字のとこの数字が足した数と合計で合わないんだよなぁ
48違うって何なんだろ。
369デフォルトの名無しさん
2018/06/08(金) 23:58:07.79ID:ljSzk/l3 CJK統合漢字のUROの空きコードポイントは残り16個か。次でとうとうU+9FF0番台になる。
それらも全部使い切ったらその次の少数の緊急に必要な漢字追加は拡張A末尾の空きU+40B6〜Fを使う事になるのかな。
でそこも使い切ったらBMPへの漢字追加は本当に終わりで拡張BやC、D…の末尾の空きを使用ってことになるんだろうな。
それらも全部使い切ったらその次の少数の緊急に必要な漢字追加は拡張A末尾の空きU+40B6〜Fを使う事になるのかな。
でそこも使い切ったらBMPへの漢字追加は本当に終わりで拡張BやC、D…の末尾の空きを使用ってことになるんだろうな。
370デフォルトの名無しさん
2018/06/09(土) 00:37:24.38ID:8sRiN6h8 文字列置換から除外するための一時退避の需要あるでしょ。
unicodeはプログラマが自由に使っていい領域ってどこだろう。
unicodeはプログラマが自由に使っていい領域ってどこだろう。
371デフォルトの名無しさん
2018/06/09(土) 01:02:14.54 「外字」でウィキれ
372デフォルトの名無しさん
2018/06/09(土) 09:13:51.52ID:8sRiN6h8373デフォルトの名無しさん
2018/06/09(土) 19:05:32.10ID:roRwdie6 curl 'http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt' | wc -l
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。
374デフォルトの名無しさん
2018/06/10(日) 06:07:59.44ID:gv3HXRco 何?結局16バイトに収まってたという話?
375デフォルトの名無しさん
2018/06/10(日) 06:08:19.99ID:gv3HXRco ビットだ……恥ずかしい
376デフォルトの名無しさん
2018/06/10(日) 15:33:08.87ID:mkooDB8i377デフォルトの名無しさん
2018/06/10(日) 16:00:53.49ID:aEB47NCz Android P Beta 2、グリーンサラダの絵文字からゆで卵が消える | スラド デベロッパー
https://developers.srad.jp/story/18/06/09/0621201/
ゆで卵を入れる多様性は許されないのか
https://developers.srad.jp/story/18/06/09/0621201/
ゆで卵を入れる多様性は許されないのか
378デフォルトの名無しさん
2018/06/11(月) 13:52:38.76ID:HvQh9O78 ジェンダーの方もなんか過剰だよね。政治的な活動家でもいるのかね
サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all
サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all
379デフォルトの名無しさん
2018/06/11(月) 16:02:07.37ID:yunMmu3l なんか力抜けたわw
381デフォルトの名無しさん
2018/06/13(水) 00:45:51.71 どうなってんのこれ🤔
🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕
🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕
382デフォルトの名無しさん
2018/06/13(水) 00:55:38.87ID:ixGTG5kv 5ちゃんでemojiのAAは文字数制限が厳しいからどうしても小さくなりがちだな
383デフォルトの名無しさん
2018/06/13(水) 06:58:34.14ID:mbRQ9skB なにか問題でも?
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿
384デフォルトの名無しさん
2018/06/17(日) 09:04:29.91ID:89kw/R7U ユニコードとUTF8は何が違うんでしょうか
どちらもユニコード?それとも別のコード?頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・
どちらもユニコード?それとも別のコード?頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・
385デフォルトの名無しさん
2018/06/17(日) 09:50:58.25ID:GftzeAnS アップル外字どうなの
386デフォルトの名無しさん
2018/06/17(日) 12:32:46.14ID:IMOrQ/Bc >>384
文字集合と文字符号の違いならわかる?
文字集合と文字符号の違いならわかる?
387デフォルトの名無しさん
2018/06/17(日) 12:38:22.96388デフォルトの名無しさん
2018/06/17(日) 12:51:10.01ID:usQhZnOB Shift_JISだって文字集合違ったりベンダ固有拡張あったりで
全然丸く収まってないよ殴り合いだよ
全然丸く収まってないよ殴り合いだよ
389デフォルトの名無しさん
2018/06/17(日) 13:31:33.71ID:wUKxAbyR MSのgithub買収でVSからclone出来ないリポジトリが増えて
SJIS消えてくれたらいいのに
っていうかwindowsの標準localeでUTF-8選びたいんだが
chcp65001はもういやバグだらけ
SJIS消えてくれたらいいのに
っていうかwindowsの標準localeでUTF-8選びたいんだが
chcp65001はもういやバグだらけ
390デフォルトの名無しさん
2018/06/17(日) 13:54:11.58ID:bLV6Ydf8 >>389
今のWindows10ではUTF-8選べるから人柱になってくれ
今のWindows10ではUTF-8選べるから人柱になってくれ
391デフォルトの名無しさん
2018/06/18(月) 01:32:33.22ID:44rsiuEs linux つかってる俺はUTF8統一で隙はなかった。
そういえばGO言語ってソースコードはUTF8で書けって仕様で規定されてるんだな。(変な文字変数名に使えてビビった)
そういえばGO言語ってソースコードはUTF8で書けって仕様で規定されてるんだな。(変な文字変数名に使えてビビった)
392デフォルトの名無しさん
2018/06/18(月) 15:52:30.27ID:54OwzSMe sjisはまだ許せる。utf16てめーはダメだ
内部コードに留めてメモリから外に出てこないでくれ
内部コードに留めてメモリから外に出てこないでくれ
393デフォルトの名無しさん
2018/06/18(月) 16:14:38.61ID:q6319o4n std::wstringがデフォルトでUTF-32になるLinux 64bit版のSTLにも同じこと言えんの?
394デフォルトの名無しさん
2018/06/18(月) 16:17:38.73ID:HrWV3yi6 SJISは完全に廃用でおk
395デフォルトの名無しさん
2018/06/18(月) 16:32:51.52ID:UtQrM811 ほんそれ
396デフォルトの名無しさん
2018/06/18(月) 17:04:46.60ID:EvkbZGBx char32_tのある今、wchar_tの存在価値なんて無いでしょ
環境依存する上にWindowsではUTF-16ということで1要素1文字の前提も崩れてるし
環境依存する上にWindowsではUTF-16ということで1要素1文字の前提も崩れてるし
397デフォルトの名無しさん
2018/06/18(月) 20:41:12.57ID:44rsiuEs 誰に賛成して、誰に反対しているかわからん。安価つけろ。
398デフォルトの名無しさん
2018/06/19(火) 07:29:13.13ID:DGMT9Nzy ?
399デフォルトの名無しさん
2018/06/19(火) 23:25:00.68ID:3zIXQUO/ A社やG社始めメジャーなクラウド系サービスは全部UTF-8だな
400デフォルトの名無しさん
2018/06/20(水) 01:39:40.00ID:xDrhFFX5 でも客にはSJIS対応を求められる不思議
401デフォルトの名無しさん
2018/06/20(水) 01:55:53.31ID:9U83APqd 意味がわからないよな
SJIS神話は何なのだろう
ジジイだけでなく中年や、中には学生にまであるよねww
学生なんて生まれたときからUTF-8の環境にいるはずで、
わざわざ使いにくい環境をどこで覚えてくるんだろうと怖くもあるww
SJIS神話は何なのだろう
ジジイだけでなく中年や、中には学生にまであるよねww
学生なんて生まれたときからUTF-8の環境にいるはずで、
わざわざ使いにくい環境をどこで覚えてくるんだろうと怖くもあるww
402デフォルトの名無しさん
2018/06/20(水) 02:06:06.18ID:xDrhFFX5 日本語が2バイトで済む安心感じゃないの?
あと、最近の根拠もなく他国をおとしめて喜んでいる類の人達には、
日本専用のコード体系かっけーさすが日本すげーとか思ってそう。
あと、最近の根拠もなく他国をおとしめて喜んでいる類の人達には、
日本専用のコード体系かっけーさすが日本すげーとか思ってそう。
403デフォルトの名無しさん
2018/06/20(水) 06:24:00.33ID:ZRnpXX67 >>402
日本のビジネスデータは全銀フォーマット等のような固定長が基本だから
文字のバイト数が可変のUTF8は向かないんだよね
うちのシステムでも、相手がUTF8で作ったテキストを送りつけてきて
大事故になったことがあった
日本のビジネスデータは全銀フォーマット等のような固定長が基本だから
文字のバイト数が可変のUTF8は向かないんだよね
うちのシステムでも、相手がUTF8で作ったテキストを送りつけてきて
大事故になったことがあった
404デフォルトの名無しさん
2018/06/20(水) 08:03:37.13ID:Va19lMsb 日本はまだマシで英語しか知らない欧米の連中だと「文字は1バイト」が常識だから
多言語化してても日本語を表示すると半分しか表示されないとかザラ。
最近はライブラリの整備や(通常全角幅の)絵文字の浸透のおかげで欧米の保守層にも文字コードの概念が伝わってるけどね。
多言語化してても日本語を表示すると半分しか表示されないとかザラ。
最近はライブラリの整備や(通常全角幅の)絵文字の浸透のおかげで欧米の保守層にも文字コードの概念が伝わってるけどね。
405デフォルトの名無しさん
2018/06/20(水) 08:52:51.05ID:OmEBDQrT 絵文字どころか10年以上前流行ったような古い日本の全角顔文字発掘してきて使ったりしてるよな最近
406デフォルトの名無しさん
2018/06/20(水) 15:17:43.40ID:OnxnZInx >>401
ほんそれ
ほんそれ
407デフォルトの名無しさん
2018/06/20(水) 15:19:01.43ID:OnxnZInx408デフォルトの名無しさん
2018/06/20(水) 17:02:56.44ID:AAtEE73s utf-8で何も考えずにソートしたら漢字の並びが非直感的になるから
しぶしぶsjis
しぶしぶsjis
409デフォルトの名無しさん
2018/06/20(水) 19:18:14.29ID:d5aRGVoI >>404
想像で言ってるだろ
想像で言ってるだろ
410デフォルトの名無しさん
2018/06/20(水) 19:25:53.85ID:/OAGNKMT このスレは、Windowsを実務PCとして使ってない人が愚痴をこぼすスレですか。
411デフォルトの名無しさん
2018/06/20(水) 19:50:25.18ID:FyXniq7l ほんそれ。
Windows使ってりゃSJIS要求するのは普通だし、そのWindowsはレガシーとしてSJISを捨てられないだけだし。
神話とか日本専用コードとかw
Windows使ってりゃSJIS要求するのは普通だし、そのWindowsはレガシーとしてSJISを捨てられないだけだし。
神話とか日本専用コードとかw
412デフォルトの名無しさん
2018/06/20(水) 20:58:05.50ID:Va19lMsb Windowsの文字コード周りで唯一好きなのは改行コードが\r\nである点。
他の環境ではLFだけという実際に即していないコードだから嫌。
LFなら普通は「桁位置はそのままで次の行に」でしょ……
abc\n
de
↑こうなるべき。
他の環境ではLFだけという実際に即していないコードだから嫌。
LFなら普通は「桁位置はそのままで次の行に」でしょ……
abc\n
de
↑こうなるべき。
413デフォルトの名無しさん
2018/06/20(水) 21:28:20.83ID:FyXniq7l Windowsは互換性のためしょうがない部分はあるが、そういうのは\e[でやってろって感じだな。
414デフォルトの名無しさん
2018/06/21(木) 01:11:25.06ID:M+oxnni+415デフォルトの名無しさん
2018/06/21(木) 01:29:39.14ID:9yZQgWTf ラインプリンター由来じゃなくてタイプライター由来じゃないの
キャリッジリターン
ラインフィード
キャリッジリターン
ラインフィード
416デフォルトの名無しさん
2018/06/21(木) 01:34:17.28ID:M+oxnni+417デフォルトの名無しさん
2018/06/21(木) 01:45:44.30ID:9yZQgWTf じゃあラインプリンターにもキャリッジあるの?
https://www.e-bridge.jp/eb/tcontents/yasasikunai-p/images/imageA001.jpg
https://www.e-bridge.jp/eb/tcontents/yasasikunai-p/images/imageA001.jpg
418デフォルトの名無しさん
2018/06/21(木) 02:17:29.23ID:vn+zRuHD ラインまるごと打つからラインプリンターなんだよねw
419デフォルトの名無しさん
2018/06/21(木) 09:07:52.61ID:y5k3a+mj MACみたいにCRだけっていうのは病気だけど
CR+LFが来たら常にCR無視しておけばいいし
自分で出力するときはLFだけ出力しておけばいい
それだけ
CR+LFが来たら常にCR無視しておけばいいし
自分で出力するときはLFだけ出力しておけばいい
それだけ
420デフォルトの名無しさん
2018/06/21(木) 09:41:35.70ID:CR9+5isI Why is the line terminator CR+LF?
https://blogs.msdn.microsoft.com/oldnewthing/20040318-00/?p=40193
If you go to the various internet protocol documents, such as RFC 0821 (SMTP), RFC 1939 (POP), RFC 2060 (IMAP), or RFC 2616 (HTTP),
you'll see that they all specify CR+LF as the line termination sequence.
So the the real question is not "Why do CP/M, MS-DOS, and Win32 use CR+LF as the line terminator?"
but rather "Why did other people choose to differ from these standards documents and use some other line terminator?"
https://blogs.msdn.microsoft.com/oldnewthing/20040318-00/?p=40193
If you go to the various internet protocol documents, such as RFC 0821 (SMTP), RFC 1939 (POP), RFC 2060 (IMAP), or RFC 2616 (HTTP),
you'll see that they all specify CR+LF as the line termination sequence.
So the the real question is not "Why do CP/M, MS-DOS, and Win32 use CR+LF as the line terminator?"
but rather "Why did other people choose to differ from these standards documents and use some other line terminator?"
421デフォルトの名無しさん
2018/06/22(金) 13:23:16.23ID:zvOmzJZB そのブログは CR + LF を正当化してるけど、テキストファイルの改行は
単に行のデリミタであって、カーソルの移動を意味してるわけじゃないと思うんだよね
単に行のデリミタであって、カーソルの移動を意味してるわけじゃないと思うんだよね
422デフォルトの名無しさん
2018/06/22(金) 15:59:28.46ID:MYEvMa8B International Business Machines
423デフォルトの名無しさん
2018/06/22(金) 21:46:22.33ID:Lyh+6zOM HAL 9000
"I'm sorry, Dave, I'm afraid I can't do that."
"I'm sorry, Dave, I'm afraid I can't do that."
424デフォルトの名無しさん
2018/06/26(火) 16:07:00.46ID:Jp9iFqVj >>421
だよな。テレタイプじゃないんだから10か13をLE(Line End)にすればいいんだ
だよな。テレタイプじゃないんだから10か13をLE(Line End)にすればいいんだ
425デフォルトの名無しさん
2018/06/26(火) 22:23:33.42ID:PAZ2qH9Y 一方でEBCDICはCRやLFとは別にNLを定義した。
426デフォルトの名無しさん
2018/06/27(水) 00:01:18.11ID:4lF2I/sY コレが正解
https://i.stack.imgur.com/e4xm6.jpg
つまり
carriage returnは行頭に復帰
line feedは行送り
CRだけなら何度も同じ行が上書きされる(行送りされない)
LFだけなら例えば3行だとこうなる
XXXXXXXX
XXXXXXXX
XXXXXXXX
https://i.stack.imgur.com/e4xm6.jpg
つまり
carriage returnは行頭に復帰
line feedは行送り
CRだけなら何度も同じ行が上書きされる(行送りされない)
LFだけなら例えば3行だとこうなる
XXXXXXXX
XXXXXXXX
XXXXXXXX
427デフォルトの名無しさん
2018/06/27(水) 00:23:59.29ID:Xb4utxw7 ⮠じゃなくて⮦
428デフォルトの名無しさん
2018/06/27(水) 00:37:35.67ID:BTQKl7xc■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国国営メディア「沖縄は日本ではない」… ★6 [BFU★]
- ナイツ塙が指摘のローソンコーヒーカップ、ロゴ「L」で誤解生みデザイン変更へ 在庫使い切る3か月後にリニューアル [muffin★]
- 政府、株式の配当など金融所得を高齢者の医療保険料や窓口負担に反映する方針を固めた [バイト歴50年★]
- 【速報】 高市政権、「日本版DOGE」を立ち上げ 米国で歳出削減をした「政府効率化省(DOGE)」になぞらえたもの [お断り★]
- バービー、 台湾有事の発言の波紋で「たまったもんじゃない」「高市さんに真意は聞きたい」「国民に向けて説明してほしい」 [muffin★]
- 20代の3割が「テレビ見ない」現実…そして静かに広がる「究極のテレビ離れ」とは [muffin★]
- 【悲報】中国→日本行きの航空チケット、高市有事の影響で50万人分がキャンセルされる [834922174]
- 【悲報】早速高市首相のせいで全国の民泊でキャンセルラッシュwwwwwwwwwwww 経営者も嘆き「こんな事は初めてだ…」😲 [871926377]
- んなっしょい🍬禁止🈲のお🏡
- 中国「高市が謝罪撤回しないとこれ全部なくなるけどどうする?」 [931948549]
- 高市早苗「……なんて言ってみたw」中国「なんだ、言ってみただけかw」👈これで全部元通りになるという事実 [782460143]
- 【悲報】ガラパゴス島国ジャップ、自分達の容姿が優れてると錯覚してしまう [383063292]
