Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
■ このスレッドは過去ログ倉庫に格納されています
2018/12/16(日) 12:38:15.61ID:VlX3xGEw
753デフォルトの名無しさん
2019/11/22(金) 21:23:42.16ID:SnsQ0S1X アメリカでも筆記体が廃れつつあるんじゃなかったか
せいぜいサインする時に使うくらい
せいぜいサインする時に使うくらい
754デフォルトの名無しさん
2019/11/22(金) 22:42:29.42ID:+ybPmekP ラテン文字は筆を選ばないでも問題無いが
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道
755デフォルトの名無しさん
2019/11/22(金) 23:50:42.29ID:1ACgXjue 墨汁ドバー
756デフォルトの名無しさん
2019/11/23(土) 09:52:15.28ID:StIP5iHr ん? 江戸時代から句読点はあったよ。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。
757デフォルトの名無しさん
2019/11/23(土) 10:17:05.69ID:LEhIlmd1 >>756
一般に使われ出したのは明治でしょ
一般に使われ出したのは明治でしょ
758デフォルトの名無しさん
2019/11/23(土) 10:53:20.31ID:cBKKqL2b >>749-750
今年の漢字の季節ですね
今年の漢字の季節ですね
759デフォルトの名無しさん
2019/11/23(土) 14:16:40.50ID:SCQQhBmf 風か水かって感じかなあ
災とかはこの前使ったよね
災とかはこの前使ったよね
760デフォルトの名無しさん
2019/11/23(土) 14:20:31.57ID:Lev/ciM6 金とか何回か選ばれてるのはあるな
二年連続とかは知らん
二年連続とかは知らん
761デフォルトの名無しさん
2019/11/23(土) 15:30:58.21ID:OKqvuGhi 令
762デフォルトの名無しさん
2019/11/23(土) 16:40:21.39ID:l4WHmfnE もうそろそろコンピュータの世界では
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?
764デフォルトの名無しさん
2019/11/23(土) 17:45:30.08ID:ExB3uxT/ C言語がASCII前提としていたので、
UTF16やUTF32では互換性を保てなかったのが理由
UTF16やUTF32では互換性を保てなかったのが理由
765デフォルトの名無しさん
2019/11/23(土) 18:02:19.00ID:UeuUKNdC 32bitで足りるんか?
766デフォルトの名無しさん
2019/11/23(土) 18:05:22.65ID:Lev/ciM6 今のところ32bitっつってもスカスカだろ
767デフォルトの名無しさん
2019/11/23(土) 18:45:44.31ID:KvoIJqUR 文字が4億も存在するんかいな。
768デフォルトの名無しさん
2019/11/23(土) 18:46:53.89ID:k/QFWxVo じゃけん戸籍に登録されてる異字体全部収録しましょうね〜(鬼畜)
769デフォルトの名無しさん
2019/11/23(土) 18:51:31.87ID:KvoIJqUR 旧字体はIPAがマップしたんじゃなかったっけ?
770デフォルトの名無しさん
2019/11/23(土) 20:53:37.67ID:x1VOKq1M 固定長好きな人が定期的に出てくるのはなんでなの?
セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに
セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに
771デフォルトの名無しさん
2019/11/23(土) 21:03:09.45ID:pGKd1Nh3 21bitもの空間与えたら要らん文字まで突っ込みまくってごみ溜めみたいになってしまったじゃないか。
772デフォルトの名無しさん
2019/11/23(土) 21:12:47.43ID:LYBJTBw0 絵文字は特に漢字に馴染みが無い連中が嬉しがってるけど、象形文字の発明前に戻ったようだよ
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった
773デフォルトの名無しさん
2019/11/23(土) 23:04:09.59ID:uD1YCxhq >769
ipaは都合約6万字ある
ipaは都合約6万字ある
774デフォルトの名無しさん
2019/11/24(日) 00:15:00.98ID:daL/rw2X 16bit固定なら世界中の文字が記述できるとして始まったのがそもそものUnicodeだからな
775デフォルトの名無しさん
2019/11/24(日) 07:48:18.59ID:wAZlnZnW >>757
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。
776デフォルトの名無しさん
2019/11/24(日) 11:58:02.36ID:bBACDgxb >>776
おもしろいと思っていってるの?
おもしろいと思っていってるの?
778デフォルトの名無しさん
2019/11/24(日) 12:07:46.48ID:bBACDgxb QZさんからレスもらえるとは思わなかった
779デフォルトの名無しさん
2019/11/24(日) 12:30:57.16ID:4a4z1fkQ780デフォルトの名無しさん
2019/11/24(日) 12:43:02.24ID:iwyjZSbL 質問じゃなくて、馬鹿にしてるんだろ
え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味
え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味
781デフォルトの名無しさん
2019/11/24(日) 12:53:04.27ID:6n0WdTOH >>781
なぜ韓国人だとおもったのですか?
なぜ韓国人だとおもったのですか?
785デフォルトの名無しさん
2019/11/24(日) 13:13:33.28ID:BlMs70wA 憲法9条を改正するだけじゃダメなのよ。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。
786デフォルトの名無しさん
2019/11/24(日) 15:33:55.44ID:EdYAI6jd >>762
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ
787デフォルトの名無しさん
2019/11/24(日) 17:10:15.65ID:5wTOyTy7788デフォルトの名無しさん
2019/11/25(月) 15:25:07.92ID:s1hiXzdE >>787
おっとそれ以上言っちゃあいけない
おっとそれ以上言っちゃあいけない
789デフォルトの名無しさん
2019/11/30(土) 13:54:16.72ID:eovy2x2M 【びっくりサイエンス】 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30
790デフォルトの名無しさん
2019/11/30(土) 15:03:21.41ID:dLS32wGr 別に「びっくり」ではないなw
791デフォルトの名無しさん
2019/11/30(土) 21:10:49.04ID:OkgV2S2L それ言ったらドンキーにも延焼する
792デフォルトの名無しさん
2019/11/30(土) 21:25:08.69ID:mO6/udRn ドンキーほうけーい
793デフォルトの名無しさん
2019/12/01(日) 17:02:36.55ID:zxgavQqm 今年の漢字は天
794デフォルトの名無しさん
2019/12/01(日) 17:27:44.79ID:xqkDTdKR いっそU+32FFと書いてほしい
795デフォルトの名無しさん
2019/12/03(火) 02:50:32.39ID:TSc17kJh 「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声
796デフォルトの名無しさん
2019/12/03(火) 12:56:42.44ID:dBsSbed7 可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?
797デフォルトの名無しさん
2019/12/03(火) 14:48:10.41ID:32eP5DBa 異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか
798デフォルトの名無しさん
2019/12/03(火) 15:19:10.13ID:9x1aaywv 倍角、四倍角も入れて
799デフォルトの名無しさん
2019/12/03(火) 15:35:57.78ID:IUIY88nX HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw
800デフォルトの名無しさん
2019/12/03(火) 17:26:32.29ID:Y2nmLwy/ Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき
801デフォルトの名無しさん
2019/12/04(水) 16:24:48.77ID:IlQO2KEp802デフォルトの名無しさん
2019/12/04(水) 19:52:55.02ID:sxQF45hm 連続してないからあくまでも記号扱いなんだろうな。
803デフォルトの名無しさん
2019/12/04(水) 20:23:19.21ID:bwCWk38v 発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
804デフォルトの名無しさん
2019/12/05(木) 15:53:38.96ID:1Yvcqq3b >>801
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
805デフォルトの名無しさん
2019/12/05(木) 16:32:04.91ID:IbmhSLeW IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ
806デフォルトの名無しさん
2019/12/06(金) 14:18:04.16ID:CxS2VDwU807デフォルトの名無しさん
2019/12/06(金) 23:32:11.23ID:Ob0T3VF2 SKK使ってるからだけどそんな印象は全く無い
808デフォルトの名無しさん
2019/12/10(火) 22:31:10.24ID:zD6aLrgM SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。
809デフォルトの名無しさん
2020/01/01(水) 02:03:31.89ID:ZBRDXVGi あけましておめでとう!
今年もこのスレの皆さんに多幸感がありますように!
今年もこのスレの皆さんに多幸感がありますように!
810デフォルトの名無しさん
2020/01/01(水) 11:19:22.03ID:tqBP4ADq 字にはヒラギノ〜ル♪
811デフォルトの名無しさん
2020/01/01(水) 22:58:15.38ID:fGGzsdYV あけましておめでとうございます
ISO/IEC 10646の新版は今年中に出るかな〜?
ISO/IEC 10646の新版は今年中に出るかな〜?
812デフォルトの名無しさん
2020/01/03(金) 06:32:52.61ID:wMN1Z8Zd Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。
まぁ、文字コードの問題ではないんだが。
まぁ、文字コードの問題ではないんだが。
813デフォルトの名無しさん
2020/01/03(金) 10:33:29.05ID:lHIykz7y 特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ
814デフォルトの名無しさん
2020/01/03(金) 22:33:53.11ID:wMN1Z8Zd >>813
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
815デフォルトの名無しさん
2020/01/07(火) 14:48:29.36ID:lPDbYu1J どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE
https://gigazine.net/news/20200106-which-emoji-scissors-close/
面白い
https://gigazine.net/news/20200106-which-emoji-scissors-close/
面白い
816デフォルトの名無しさん
2020/01/07(火) 15:01:40.99ID:2Dq0zKSW 左利き用のはさみも用意汁ωωω
817デフォルトの名無しさん
2020/01/07(火) 15:12:21.25ID:dfBogwvq ちなみによく切れるはさみはここが曲線
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
818デフォルトの名無しさん
2020/01/07(火) 16:36:04.95ID:g+gnVlWv はさみディレクションセレクター
819デフォルトの名無しさん
2020/01/18(土) 12:49:25.00ID:jQMC+jX5 ぷにコードに関するチラ裏
localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ
idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ
idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
820デフォルトの名無しさん
2020/01/24(金) 09:35:27.22ID:jBJ9cIqM 6月のWG2は高松になったのか
また国外から来にくそうな
また国外から来にくそうな
821デフォルトの名無しさん
2020/01/26(日) 00:45:55.40ID:C+NhYhXj 道後温泉に行くか
822デフォルトの名無しさん
2020/01/30(木) 14:46:03.72ID:WswUNrPx Unicode Emoji 13.0 - Now final for 2020
http://blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
http://blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
823デフォルトの名無しさん
2020/01/30(木) 16:08:26.17ID:m1itn91m 今更タピ岡かい
824デフォルトの名無しさん
2020/01/31(金) 12:43:23.65ID:G4fIlptF Unicodeは完全にコンソーシアムのおもちゃになってんな
825デフォルトの名無しさん
2020/01/31(金) 15:08:09.88ID:OCbveUqO タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。
>>825
詰将棋用に上下逆の漢字を入れて欲しかった
詰将棋用に上下逆の漢字を入れて欲しかった
827デフォルトの名無しさん
2020/01/31(金) 22:55:44.99ID:GHfVRZCY G入れるのまじやめて
828デフォルトの名無しさん
2020/02/01(土) 00:49:18.17ID:6vnUAWit 要するに新種の漢字なんだな
国ごとに生活が違うから、結局何万種必要になる
国ごとに生活が違うから、結局何万種必要になる
829デフォルトの名無しさん
2020/02/02(日) 00:50:49.11ID:wzqxdRGo 将棋の駒は多分誰も提案書を出さないせい
830デフォルトの名無しさん
2020/02/02(日) 01:02:15.43ID:0w4OLLiX それ通ったらドンジャラ提案するわ
831デフォルトの名無しさん
2020/02/02(日) 01:17:07.29ID:Vi9q8JVy 漢字の扱いは本当に難しい
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・
832デフォルトの名無しさん
2020/02/03(月) 01:41:22.43ID:qflv74w2 テスト٩( 'ω' )و
833デフォルトの名無しさん
2020/02/03(月) 08:57:05.26ID:uSBWqXrE 825だが、将棋の駒がダメな理由は、>>469 にある通り、
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。
834デフォルトの名無しさん
2020/02/03(月) 11:59:58.53ID:62FLJlST 解説本だと普通に使われてるよな
835デフォルトの名無しさん
2020/02/03(月) 13:40:49.09ID:yHobSnyY タピオカが使われているのかと誤読
836デフォルトの名無しさん
2020/02/03(月) 13:47:35.80ID:62FLJlST 読み手のリテラシーが問われます
837デフォルトの名無しさん
2020/02/03(月) 13:54:08.64ID:eKPmxfCz 天使を天便と読み取ったまま放置するとか割とマジ。
838デフォルトの名無しさん
2020/02/03(月) 22:56:08.65ID:KZTuy2Ys 架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。
839デフォルトの名無しさん
2020/02/03(月) 22:59:18.31ID:wgq762c2 漢字以前の象形文字モドキの再発明だからなぁ
取捨選択もなく全然洗練されないまま数だけ増えてる
取捨選択もなく全然洗練されないまま数だけ増えてる
840デフォルトの名無しさん
2020/02/03(月) 23:33:42.55ID:s4V/Vj8i そのうち抽象化が進んでいくのか
841デフォルトの名無しさん
2020/02/04(火) 13:26:51.57ID:gTERf/2s 政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ
842デフォルトの名無しさん
2020/02/04(火) 13:28:31.24ID:c6iCZcrL コーヒー、お茶、タクシー、台風もほしい
843デフォルトの名無しさん
2020/02/04(火) 20:12:02.43ID:U7azh68T844デフォルトの名無しさん
2020/02/04(火) 21:29:49.71ID:t1/0lpTx 絵文字ってここにどう書き込めばいいんです?
☸️
↓
☸
専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆状態でうまく表示されない…
☸️
↓
☸
専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆状態でうまく表示されない…
845デフォルトの名無しさん
2020/02/05(水) 08:47:40.80ID:fZOBAWLP >>842
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
846デフォルトの名無しさん
2020/02/05(水) 10:08:51.00ID:So1jciyU 🍵 you know me.
847デフォルトの名無しさん
2020/02/05(水) 10:23:19.19ID:MS9bo9CR 固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
848デフォルトの名無しさん
2020/02/05(水) 10:24:42.24ID:MS9bo9CR 固定フォントじゃなくて等幅フォントでした
849デフォルトの名無しさん
2020/02/05(水) 16:23:36.59ID:2rKdW1Ec てすと
☸
☸
850デフォルトの名無しさん
2020/02/05(水) 16:24:56.28ID:2rKdW1Ec851デフォルトの名無しさん
2020/02/05(水) 16:28:36.97ID:2rKdW1Ec852デフォルトの名無しさん
2020/02/05(水) 16:30:38.68ID:So1jciyU ☸ 法輪ラブ ☸
853デフォルトの名無しさん
2020/02/05(水) 18:34:07.02ID:qBm/0cTb >>847
・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1
・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)
・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる
・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)
・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)
・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1
・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)
・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる
・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)
・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)
・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【中国外務省】日中関係悪化は高市氏に責任と名指しで非難… [BFU★]
- 【中国外務省】日中関係悪化は高市氏に責任と名指しで非難… ★2 [BFU★]
- 外務省局長は無言で厳しい表情…日中の高官協議終了か 高市首相“台湾”発言で中国が強硬対応 発言撤回求めたか…★2 [BFU★]
- 小野田紀美・経済安保担当相「何か気に入らないことがあればすぐに経済的威圧をする国への依存はリスク」 [Hitzeschleier★]
- 政府、株式の配当など金融所得を高齢者の医療保険料や窓口負担に反映する方針を固めた [バイト歴50年★]
- 【維新】吉村知事「中国人観光客だけに頼るビジネスモデル変えていかないといけない」「高市総理の発言は撤回する必要はない」 [Hitzeschleier★]
- 中国高官と話す外務省局長の表情、やばい [175344491]
- 中国外務省「日中関係の悪化は高市早苗首相が原因」と名指しで強く非難。キタ━(゚∀゚)━! [153490809]
- 【悲報】日本人「俺以外の日本人が中国と戦ってくれるぞ!」 [616817505]
- 日本政府「高市総理の発言は問題ないと伝え、中国総領事のSNS投稿は問題があると中国に伝えました😊」 [931948549]
- 維新の吉村代表「高市総理に中国総領事の国外退去を要請した。今後、知事として中国イベントには出席しない」 [359572271]
- 【悲報】安倍晋三と高市早苗、どっちがヤベーの🤔 [616817505]
