Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
レス数が1000を超えています。これ以上書き込みはできません。
2018/12/16(日) 12:38:15.61ID:VlX3xGEw
952デフォルトの名無しさん
2020/06/23(火) 10:14:55.66ID:4kHZmTBE 倍角と2倍角は違うんだっけ
4倍角もあったような
4倍角もあったような
953デフォルトの名無しさん
2020/06/24(水) 00:49:18.29ID:U0shKhxD 倍角って横だよね
縦倍角ってのもあった気がする
縦倍角ってのもあった気がする
954デフォルトの名無しさん
2020/06/24(水) 02:37:42.69ID:Qbz2qwLg 〴〳
〵〵
これの有効活用をしたい
〵〵
これの有効活用をしたい
955デフォルトの名無しさん
2020/06/24(水) 12:14:26.52ID:deVcUtEo >>951
というかどういうレベルの話をしているのか掴みかねてね。
「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。
リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。
というかどういうレベルの話をしているのか掴みかねてね。
「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。
リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。
956デフォルトの名無しさん
2020/06/24(水) 12:28:35.59ID:deVcUtEo と思ったがまたそのうちw
957デフォルトの名無しさん
2020/06/24(水) 13:08:49.76ID:Qbz2qwLg どこまでもかみあわんやっちゃな
958デフォルトの名無しさん
2020/06/24(水) 19:38:46.76ID:e6Wuxio/ というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
959デフォルトの名無しさん
2020/06/24(水) 22:24:49.91ID:N310/pVU んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅
https://ja.wikipedia.org/wiki/東アジアの文字幅
960デフォルトの名無しさん
2020/06/25(木) 18:59:45.90ID:xHxuQznk >>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
961デフォルトの名無しさん
2020/06/25(木) 22:37:41.64ID:5bjWZftZ 曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?
962デフォルトの名無しさん
2020/06/26(金) 13:02:51.64ID:PjbtVFt+ %s の文字数とかで文字列の幅調整出来ないんだよな
963デフォルトの名無しさん
2020/06/26(金) 20:34:46.91ID:gjCuj5Av しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
964デフォルトの名無しさん
2020/06/26(金) 20:59:35.95ID:7oUp4uPe そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ
白人のやることはいつもそうだ
>>964
それはグレートチャイナ様が抵抗してくださるのでは?
それはグレートチャイナ様が抵抗してくださるのでは?
966デフォルトの名無しさん
2020/06/26(金) 22:11:14.85ID:7oUp4uPe 彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
>>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
968デフォルトの名無しさん
2020/06/27(土) 00:33:35.05ID:swJlVBV3 簡字体は半角でも行けそう感あるな
969デフォルトの名無しさん
2020/06/27(土) 01:47:56.80ID:9wE9An+g 斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか
渡辺渡邊渡邉もどうせ一緒だろうとか
970デフォルトの名無しさん
2020/06/27(土) 01:53:30.16ID:2VXy+TcG ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
971デフォルトの名無しさん
2020/06/27(土) 02:06:13.19ID:a36N+BtR972デフォルトの名無しさん
2020/06/27(土) 02:22:38.17ID:n/FbqQvh そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな
年金記録問題になるとな
973デフォルトの名無しさん
2020/06/27(土) 02:25:59.19ID:cFHckwkh カンジカナヘンカン(キリッ
974デフォルトの名無しさん
2020/06/27(土) 03:48:57.43ID:N26qrFyY でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
976デフォルトの名無しさん
2020/06/27(土) 08:30:57.19ID:fTkQtmqM >>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
977デフォルトの名無しさん
2020/06/27(土) 08:59:10.45ID:8YWxnx/1978デフォルトの名無しさん
2020/06/27(土) 09:13:49.81ID:wwwZDyDi イタイ痔でイタイ字
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
979デフォルトの名無しさん
2020/06/27(土) 09:39:39.53ID:twDHZDh4 >>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
980デフォルトの名無しさん
2020/06/27(土) 09:58:34.18ID:g61E5/Hd >>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
981デフォルトの名無しさん
2020/06/27(土) 14:15:22.95ID:bBs10q1N 表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。
982デフォルトの名無しさん
2020/06/27(土) 15:22:20.76ID:QSLeN3Uh ขอบคุณค่ะ
983デフォルトの名無しさん
2020/06/27(土) 19:08:33.76ID:g61E5/Hd なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。
文句かも、確かに。
984デフォルトの名無しさん
2020/06/28(日) 11:00:01.09ID:9sOk9wG3985デフォルトの名無しさん
2020/06/28(日) 20:30:07.87ID:PNBTsuo1 参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない
各自環境でどう表示されてるかは関知しない
986デフォルトの名無しさん
2020/07/01(水) 17:25:24.99ID:MDN2nnZZ 俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
987デフォルトの名無しさん
2020/07/01(水) 19:30:44.51ID:V8kaCwil つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?
988デフォルトの名無しさん
2020/07/01(水) 19:32:49.62ID:IfUrt5hg 面って旧字体か知らんけど内側が口の字もあるんだね
989デフォルトの名無しさん
2020/07/01(水) 22:04:25.91ID:21fnQhh9 「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
990デフォルトの名無しさん
2020/07/02(木) 05:58:14.56ID:29pTsVv7 >>989
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
991デフォルトの名無しさん
2020/07/02(木) 20:52:25.00ID:Ia6zfvih 野家
993デフォルトの名無しさん
2020/07/02(木) 23:07:28.07ID:NYHAh4sv994デフォルトの名無しさん
2020/07/03(金) 01:39:17.36ID:I4sf0FL7 いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
995デフォルトの名無しさん
2020/07/03(金) 02:49:52.70ID:C0o/qkVy そのせいじゃないだろう
996デフォルトの名無しさん
2020/07/03(金) 08:00:38.22ID:I4sf0FL7 私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
997デフォルトの名無しさん
2020/07/03(金) 09:38:17.14ID:oXZRCloQ 自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
998デフォルトの名無しさん
2020/07/03(金) 11:53:19.11ID:6268sYfp 嵜
ア
ア
999デフォルトの名無しさん
2020/07/03(金) 14:11:53.17ID:/+uSoVK/ ア崎
1000デフォルトの名無しさん
2020/07/03(金) 14:13:13.87ID:/+uSoVK/ ↑ホントだ変換入力してるのに文字化けする
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 中国国営メディア「沖縄は日本ではない」… [BFU★]
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 【こんなの初めて…】民泊には既にキャンセルも 中国の渡航自粛で [ぐれ★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 高市政権にパイプ役不在…日中高まる緊張 公明党の連立離脱影響、自民内にも懸念「自分でまいた種は自分で刈り取ってもらわないと」 [ぐれ★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 『しんちゃんと岸田さん』 [175344491]
- 自民「高市の一言でこれまで積み上げてきた関係が駄目になる。言葉の重みを分かっていない。自分でまいた種は自分で刈り取ってもらう」 [256556981]
- 【悲報】泉健太「質問した立憲民主党が悪いという主張は、高市政権が野党の忖度で成り立つ政権という汚名を自ら着るようなもの」 [519511584]
- 中国発日本行の航空券、491,000件(全体の32%)がキャンセルされたと判明。高市どうすんのこれ [603416639]
- 中国国営放送「日本は琉球をただちに中国に返還せよ」 キタ━━━━(゚∀゚)━━━━!!!!! [314039747]
- 【高市速報】小野田経済安保相「中国依存はリスクなおおおおおおおおおおお」 [127986362]
