文字コード総合スレ Part12
■ このスレッドは過去ログ倉庫に格納されています
>>169
ブリックパックの右二つがなんだかわからない 真珠を絵に入れるなら pearl oyster にしとけばいいのに >>176
ほとんどのルーターで禁止されているけど、ルーターのWebUIでSSIDを設定する時に
JavaScriptの文字列チェックを外して強引にUTF-8で設定させるのが一部で流行っているらしい。 内部では単なるヌル終端のバイト列として扱ってるだけなんだろう >>180
見えているのに到達できない場所みたいだな ユニコードの文字の説明(#から右の部分)がのっているテキストファイルの置き場所って
どこかわかります。できれば、日本語だけでなく全文字が欲しい。
↓こんなやつがずらっと。
0x878D U+337E # SQUARE ERA NAME MEIZI [2000] そこ知ってるならもう辿り着けたも同然なのに
一つ上がってみよう 一昔前に、大塩平八郎のLANや応仁のLANというSSIDが話題になったことがあるよね。
俺は見たこと無くて何とも言えないのだけど、実際に接続できたのだろうか? 境界判定するつもりが教会判定することになり異端審問にかけられた。 Nobody expects the Spanish Inquisition! >>190
Nobody knows the trouble i've seen, nobody knows but Jesus! https://unicode.org/cldr/utility/character.jsp?a=1D00
↑ここにアクセスしても空白のページが表示されるだけなんだけど
みなさんもそう?
前までは確かに存在したページの筈……。 確かに空白だな、と思ってソース見たらtofuが並んでた Service Temporarily Unavailable そうか…
あのページはすごい便利に使わしてもらってたのに、利用できないとは残念 >>197
そのページから個々の文字に関する情報って見れなくね? >>199
unicode、すっかりグダグダたな。なんだよ絵文字って。 U+32ffにはplaceholderも入れてないのか >>201
「ゑ」の小さい字もできるんだ、
「ぇ」みたいに。 その読みにくい文体、中学のマイコン部の先輩が部誌に書いてたコラムに似てるなと思った 内容はともかく
> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b#comment-ba92e82cf5ff8a829c10>
↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。 苦情が出た時のために拡張領域があるんだから許してあげてよ。 小さいゐゑヰヱは "used to write archaic Japanese" なんだけど
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった リンゴロゴ(U+F8FF)を使った Tim が正しく表示される環境は限定的なのかな?
私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
https://www.afpbb.com/articles/-/3214744
【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。
トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。
するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。
ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP
ティム・クック氏のツイッター・アカウント
https://twitter.com/tim_cook
https://twitter.com/5chan_nel (5ch newer account) Private Use Area を公にさらす変態 Tim Appleと呼ばれたTim Cook、Tim Tofuを名乗る。 >>207
>CJK文化圏にいる利用者からは扱いずらすぎる
わざとそれを狙って毒撒いたんじゃね? >>216
「あたしわゆる」の後なんて書いてあるの? >>218
さない
「あたしわ ゆるさない」 だろ >>207
長すぎてどこまで読んだか判らない
>>217
ありがとー >>220
>>192は俺な訳だがなぜ無関係なあなたが返事をしているんだw UAX #29: Unicode Text Segmentation
http://www.unicode.org/reports/tr29/tr29-35.html#Modifications
Unicode 12.0.0 では新しく U+FF10..U+FF19 の全角数字を数字扱いするようになったのね。
UAX #14 では Ideographic のままだし何で今頃変えたのかよく分からないけど。 これから漢数字とか丸数字も数字扱いしだすゾォー^
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ >>223
まじかよ
互換性がとも思うけど,寧ろ便利なのかな。 ダブルクリックで文字列選択するような機能に影響でなければいいけどなあ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ Unicodeじゃなくて個別のライブラリの仕様次第だと思うけど、近い将来影響が出てきそうだね。 そういえば(今もそうかは知らないが)Firefoxは「々」がそういう選択のされ方だった。あれはなんでなんだろう。 正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。 このスレかどっかでC99で作られたUnicodeライブラリの紹介を見掛けた気がするんだけど
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです ICUは有名なのですぐ見付かるだろうしなによりC99じゃない。
utf8procじゃねーの? 新元号発表の時の墨書、楷書体だけど「令」の字形はU+F9A8に似ていた。
何らかの揉め事になって面白い事になるかも。 てか「人一卩」と「人丶マ」は異体字セレクタにあるけど、官房長官が掲げた「人丶卩」が無いな Gengo-Oshuujiコレクションを申請するときがきたか あのお習字も公文書扱いらしいな
汎用電子あたりにぶち込んでいいぞ 個人的には新元号に2004年のJISで例示字形変更された字や第2水準以下の字が使われなくて良かったと思ってる。 >>245
そんな大事な話でFA98とF9A8間違うとか絶対わざとやってるだろ
消して投稿しなおせよ >>247
そもそも字が下手過ぎて習字の基本すら出来てないやろ
和にしても
ノ木口
なのに
ノ丶木口
って描かれてる アドビのフォントが新元号「令和」に対応--2パターンの合字を追加
https://japan.cnet.com/article/35135080/
この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。 集合住宅名にありがちシリーズだと㌞・㌪はあるがヒルズとかテラスとかがないな Unicodeに入れるのはむりぽ
AJ1ならワンチャンあるかも >>250
誰でも読み書き出来る字を選ぶという配慮であろう。
令は小学4年、和は3年で習う字だ。
今時のキラキラネーム(DQNネーム)とは違う。 常用漢字から選ぶとは最初に告知されてたが、
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。 あの「令和」っていう習字の画像って公文書として入手できないのかな。 どのメーカーの半紙と墨汁を使ったか公開すればバカ売れだな https://twitter.com/yanok/status/1113052042254143489
令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?
これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
https://twitter.com/5chan_nel (5ch newer account) >>264
電子化された契約文書に大正の年号が使われることがないから影響もなかった。 大正時代に生まれた人なんかいくらでも電子管理の対象になりうるだろ 大正はIME類に成語として登録されてるからよっぽどでもないかぎり他の大は出てこんわね。
でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。 じゃあ令和もIME登録したらいい,って思っちゃうのは素人考えなんですかね。 ■ このスレッドは過去ログ倉庫に格納されています