Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
レス数が1000を超えています。これ以上書き込みはできません。
2018/12/16(日) 12:38:15.61ID:VlX3xGEw
958デフォルトの名無しさん
2020/06/24(水) 19:38:46.76ID:e6Wuxio/ というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
959デフォルトの名無しさん
2020/06/24(水) 22:24:49.91ID:N310/pVU んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅
https://ja.wikipedia.org/wiki/東アジアの文字幅
960デフォルトの名無しさん
2020/06/25(木) 18:59:45.90ID:xHxuQznk >>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
961デフォルトの名無しさん
2020/06/25(木) 22:37:41.64ID:5bjWZftZ 曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?
962デフォルトの名無しさん
2020/06/26(金) 13:02:51.64ID:PjbtVFt+ %s の文字数とかで文字列の幅調整出来ないんだよな
963デフォルトの名無しさん
2020/06/26(金) 20:34:46.91ID:gjCuj5Av しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
964デフォルトの名無しさん
2020/06/26(金) 20:59:35.95ID:7oUp4uPe そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ
白人のやることはいつもそうだ
>>964
それはグレートチャイナ様が抵抗してくださるのでは?
それはグレートチャイナ様が抵抗してくださるのでは?
966デフォルトの名無しさん
2020/06/26(金) 22:11:14.85ID:7oUp4uPe 彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
>>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
968デフォルトの名無しさん
2020/06/27(土) 00:33:35.05ID:swJlVBV3 簡字体は半角でも行けそう感あるな
969デフォルトの名無しさん
2020/06/27(土) 01:47:56.80ID:9wE9An+g 斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか
渡辺渡邊渡邉もどうせ一緒だろうとか
970デフォルトの名無しさん
2020/06/27(土) 01:53:30.16ID:2VXy+TcG ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
971デフォルトの名無しさん
2020/06/27(土) 02:06:13.19ID:a36N+BtR972デフォルトの名無しさん
2020/06/27(土) 02:22:38.17ID:n/FbqQvh そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな
年金記録問題になるとな
973デフォルトの名無しさん
2020/06/27(土) 02:25:59.19ID:cFHckwkh カンジカナヘンカン(キリッ
974デフォルトの名無しさん
2020/06/27(土) 03:48:57.43ID:N26qrFyY でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
976デフォルトの名無しさん
2020/06/27(土) 08:30:57.19ID:fTkQtmqM >>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
977デフォルトの名無しさん
2020/06/27(土) 08:59:10.45ID:8YWxnx/1978デフォルトの名無しさん
2020/06/27(土) 09:13:49.81ID:wwwZDyDi イタイ痔でイタイ字
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
979デフォルトの名無しさん
2020/06/27(土) 09:39:39.53ID:twDHZDh4 >>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
980デフォルトの名無しさん
2020/06/27(土) 09:58:34.18ID:g61E5/Hd >>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
981デフォルトの名無しさん
2020/06/27(土) 14:15:22.95ID:bBs10q1N 表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。
982デフォルトの名無しさん
2020/06/27(土) 15:22:20.76ID:QSLeN3Uh ขอบคุณค่ะ
983デフォルトの名無しさん
2020/06/27(土) 19:08:33.76ID:g61E5/Hd なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。
文句かも、確かに。
984デフォルトの名無しさん
2020/06/28(日) 11:00:01.09ID:9sOk9wG3985デフォルトの名無しさん
2020/06/28(日) 20:30:07.87ID:PNBTsuo1 参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない
各自環境でどう表示されてるかは関知しない
986デフォルトの名無しさん
2020/07/01(水) 17:25:24.99ID:MDN2nnZZ 俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
987デフォルトの名無しさん
2020/07/01(水) 19:30:44.51ID:V8kaCwil つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?
988デフォルトの名無しさん
2020/07/01(水) 19:32:49.62ID:IfUrt5hg 面って旧字体か知らんけど内側が口の字もあるんだね
989デフォルトの名無しさん
2020/07/01(水) 22:04:25.91ID:21fnQhh9 「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
990デフォルトの名無しさん
2020/07/02(木) 05:58:14.56ID:29pTsVv7 >>989
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
991デフォルトの名無しさん
2020/07/02(木) 20:52:25.00ID:Ia6zfvih 野家
993デフォルトの名無しさん
2020/07/02(木) 23:07:28.07ID:NYHAh4sv994デフォルトの名無しさん
2020/07/03(金) 01:39:17.36ID:I4sf0FL7 いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
995デフォルトの名無しさん
2020/07/03(金) 02:49:52.70ID:C0o/qkVy そのせいじゃないだろう
996デフォルトの名無しさん
2020/07/03(金) 08:00:38.22ID:I4sf0FL7 私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
997デフォルトの名無しさん
2020/07/03(金) 09:38:17.14ID:oXZRCloQ 自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
998デフォルトの名無しさん
2020/07/03(金) 11:53:19.11ID:6268sYfp 嵜
ア
ア
999デフォルトの名無しさん
2020/07/03(金) 14:11:53.17ID:/+uSoVK/ ア崎
1000デフォルトの名無しさん
2020/07/03(金) 14:13:13.87ID:/+uSoVK/ ↑ホントだ変換入力してるのに文字化けする
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 高市早苗総理「金利上昇よりも日本の成長が大事」 [Hitzeschleier★]
- 【将棋】福間香奈 女流六冠が会見 妊娠・出産でタイトル戦の事実上不戦敗 「妊娠したら、どちらか一方を諦めないといけない状況」 [冬月記者★]
- 「残クレ」でマイホーム、国が銀行向け保険 新型住宅ローン普及促す -日経 ★2 [少考さん★]
- 【速報】 米国政府、中国が日本の自衛隊にレーダーを照射を批判、同事案で中国を批判するのは初めて [お断り★]
- 【コメ】卸売業者「簡単に安売りできない」「大暴落起きれば大赤字に」 JA「新米の販売進度が近年になく遅い。コメの回転が悪い」 ★2 [Hitzeschleier★]
- 【野球】止まらぬ野球人口減少に危機感 ラミレス氏「野球人口は激減、人気自体も下がっている」「もっと野球ができる環境を整えるべき」 [冬月記者★]
- 高市と維新、国会で鈴木大臣を褒めまくるwww「現場のことを分かってる!鈴木大臣はようやっとる!」 [888298477]
- 【高市速報】小泉進次郎「事前に中国軍から飛行訓練を開始すると連絡があったのは事実」★2 [931948549]
- 【悲報】たけガイ、「中卒」という言葉を覚えてしまう🏡
- JR東海「リニア工事で水が枯れるのは一瞬だし回復させる手立てないわこれ」 [744361492]
- グラフィックボードのVRAMは「8GB」で十分だという事実 [422186189]
- 自作pc時期が悪いおじさん、絶命 [329329848]
