X



文字コード総合スレ Part12

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん
垢版 |
2018/12/16(日) 12:38:15.61ID:VlX3xGEw
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
0170デフォルトの名無しさん
垢版 |
2019/02/06(水) 15:28:47.74ID:kcXvzDdu
絵文字ちゃうやん
ただの絵
0177デフォルトの名無しさん
垢版 |
2019/02/09(土) 16:49:37.43ID:UMSUoHVI
>>176
ほとんどのルーターで禁止されているけど、ルーターのWebUIでSSIDを設定する時に
JavaScriptの文字列チェックを外して強引にUTF-8で設定させるのが一部で流行っているらしい。
0180デフォルトの名無しさん
垢版 |
2019/02/10(日) 15:54:10.44ID:PXpe84p+
無理やり設定しても繋げられなくなる気がする
0182デフォルトの名無しさん
垢版 |
2019/02/10(日) 20:01:32.56ID:MigChu0H
🍭
あめ

0184デフォルトの名無しさん
垢版 |
2019/02/10(日) 23:37:08.37ID:/Ok9Y0Js
ユニコードの文字の説明(#から右の部分)がのっているテキストファイルの置き場所って
どこかわかります。できれば、日本語だけでなく全文字が欲しい。

↓こんなやつがずらっと。
0x878D U+337E # SQUARE ERA NAME MEIZI [2000]
0187デフォルトの名無しさん
垢版 |
2019/02/12(火) 17:07:51.47ID:uPzbFBNW
一昔前に、大塩平八郎のLANや応仁のLANというSSIDが話題になったことがあるよね。
俺は見たこと無くて何とも言えないのだけど、実際に接続できたのだろうか?
0189デフォルトの名無しさん
垢版 |
2019/02/14(木) 21:24:21.21ID:sLL+4j00
境界判定するつもりが教会判定することになり異端審問にかけられた。
0191 ◆QZaw55cn4c
垢版 |
2019/02/15(金) 21:47:29.13ID:8MeM2Ami
>>190
Nobody knows the trouble i've seen, nobody knows but Jesus!
0194デフォルトの名無しさん
垢版 |
2019/02/24(日) 14:46:38.10ID:YwY0sV++
Service Temporarily Unavailable
0195デフォルトの名無しさん
垢版 |
2019/02/24(日) 17:25:45.84ID:Nokppl90
そうか…
あのページはすごい便利に使わしてもらってたのに、利用できないとは残念
0196デフォルトの名無しさん
垢版 |
2019/02/25(月) 10:45:27.39ID:Opp/wdL5
>>192 がトドメ刺したんか
0202デフォルトの名無しさん
垢版 |
2019/03/07(木) 11:12:32.47ID:MaxgRiSY
仕事する馬鹿ほど面倒なものはない
0206デフォルトの名無しさん
垢版 |
2019/03/08(金) 18:46:01.42ID:soybuSeV
その読みにくい文体、中学のマイコン部の先輩が部誌に書いてたコラムに似てるなと思った
0207デフォルトの名無しさん
垢版 |
2019/03/08(金) 18:58:34.86ID:8O+4MLhG
内容はともかく

> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b#comment-ba92e82cf5ff8a829c10>;

↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。
0208デフォルトの名無しさん
垢版 |
2019/03/08(金) 19:17:05.59ID:orP5LHkV
苦情が出た時のために拡張領域があるんだから許してあげてよ。
0209デフォルトの名無しさん
垢版 |
2019/03/08(金) 20:40:25.47ID:9ZplOVC2
小さいゐゑヰヱは "used to write archaic Japanese" なんだけど
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった
0211デフォルトの名無しさん
垢版 |
2019/03/08(金) 22:42:36.27ID:orP5LHkV
リンゴロゴ(U+F8FF)を使った Tim  が正しく表示される環境は限定的なのかな?

私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
https://www.afpbb.com/articles/-/3214744
 【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
 ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
 公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。

 トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
 アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。

 するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
 ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
 「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
 「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
 「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。

 ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
 ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
 昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP


ティム・クック氏のツイッター・アカウント
https://twitter.com/tim_cook
https://twitter.com/5chan_nel (5ch newer account)
0215デフォルトの名無しさん
垢版 |
2019/03/09(土) 07:26:47.29ID:ZOfzHyh2
>>207
>CJK文化圏にいる利用者からは扱いずらすぎる

わざとそれを狙って毒撒いたんじゃね?
0216デフォルトの名無しさん
垢版 |
2019/03/09(土) 07:28:53.38ID:JheZ4dDX
>>207
ぁたιゎゆるさナょぃ
0220デフォルトの名無しさん
垢版 |
2019/03/10(日) 17:51:22.00ID:uFsYqTSV
>>207
長すぎてどこまで読んだか判らない

>>217
ありがとー
0224デフォルトの名無しさん
垢版 |
2019/03/14(木) 22:33:54.00ID:+YVU0bVz
これから漢数字とか丸数字も数字扱いしだすゾォー^
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ
0226デフォルトの名無しさん
垢版 |
2019/03/15(金) 06:30:19.25ID:/rrmc9zm
ダブルクリックで文字列選択するような機能に影響でなければいいけどなあ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ
0227デフォルトの名無しさん
垢版 |
2019/03/15(金) 06:41:57.81ID:t7/3/Ky+
Unicodeじゃなくて個別のライブラリの仕様次第だと思うけど、近い将来影響が出てきそうだね。
0229デフォルトの名無しさん
垢版 |
2019/03/15(金) 12:07:15.17ID:JrKcPYyj
そういえば(今もそうかは知らないが)Firefoxは「々」がそういう選択のされ方だった。あれはなんでなんだろう。
0230デフォルトの名無しさん
垢版 |
2019/03/15(金) 14:05:00.83ID:SEjqglYP
漢数字の数字扱いまだ?
0232デフォルトの名無しさん
垢版 |
2019/03/15(金) 15:39:45.46ID:a2hOwysQ
ソート順が萬>千>百>拾とかか
0234デフォルトの名無しさん
垢版 |
2019/03/15(金) 19:36:37.30ID:t7/3/Ky+
正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。
0238デフォルトの名無しさん
垢版 |
2019/03/24(日) 03:18:52.69ID:OrJDHzVf
フモフモ
0240デフォルトの名無しさん
垢版 |
2019/03/24(日) 14:16:39.59ID:2vsRyi47
このスレかどっかでC99で作られたUnicodeライブラリの紹介を見掛けた気がするんだけど
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです
0241デフォルトの名無しさん
垢版 |
2019/03/24(日) 14:32:46.63ID:DqM6OskA
過去様が卒業したとこ
0242デフォルトの名無しさん
垢版 |
2019/03/24(日) 16:01:40.15ID:4oYv+rwZ
未来様。
0243デフォルトの名無しさん
垢版 |
2019/03/27(水) 17:42:59.30ID:WhOBGSwK
ICUは有名なのですぐ見付かるだろうしなによりC99じゃない。
utf8procじゃねーの?
0246デフォルトの名無しさん
垢版 |
2019/04/01(月) 22:00:00.14ID:SiO8nKzk
新元号発表の時の墨書、楷書体だけど「令」の字形はU+F9A8に似ていた。
何らかの揉め事になって面白い事になるかも。
0247デフォルトの名無しさん
垢版 |
2019/04/01(月) 23:51:37.27ID:PpRhn1A4
てか「人一卩」と「人丶マ」は異体字セレクタにあるけど、官房長官が掲げた「人丶卩」が無いな
0250デフォルトの名無しさん
垢版 |
2019/04/02(火) 10:10:03.96ID:GTYTa8Tr
個人的には新元号に2004年のJISで例示字形変更された字や第2水準以下の字が使われなくて良かったと思ってる。
0251デフォルトの名無しさん
垢版 |
2019/04/02(火) 12:05:10.00ID:5+C+zQyU
>>245
そんな大事な話でFA98とF9A8間違うとか絶対わざとやってるだろ
消して投稿しなおせよ
0252デフォルトの名無しさん
垢版 |
2019/04/02(火) 12:10:05.14ID:5+C+zQyU
>>247
そもそも字が下手過ぎて習字の基本すら出来てないやろ

和にしても
ノ木口
なのに
ノ丶木口
って描かれてる
0254デフォルトの名無しさん
垢版 |
2019/04/02(火) 18:12:09.33ID:ONyiz5iP
アドビのフォントが新元号「令和」に対応--2パターンの合字を追加
https://japan.cnet.com/article/35135080/

この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。
0255デフォルトの名無しさん
垢版 |
2019/04/02(火) 21:47:42.61ID:qF1eZplP
集合住宅名にありがちシリーズだと㌞・㌪はあるがヒルズとかテラスとかがないな
0258デフォルトの名無しさん
垢版 |
2019/04/03(水) 22:13:58.47ID:FgHYrjKu
>>250
誰でも読み書き出来る字を選ぶという配慮であろう。
令は小学4年、和は3年で習う字だ。
今時のキラキラネーム(DQNネーム)とは違う。
0259デフォルトの名無しさん
垢版 |
2019/04/03(水) 23:15:11.57ID:cN3kYbRs
常用漢字から選ぶとは最初に告知されてたが、
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。
0263デフォルトの名無しさん
垢版 |
2019/04/04(木) 03:17:29.09ID:sXgQQUMv
字が下手過ぎた
やり直せ
0264デフォルトの名無しさん
垢版 |
2019/04/04(木) 08:30:46.45ID:VfgtU/Z4
https://twitter.com/yanok/status/1113052042254143489

令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?

これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
https://twitter.com/5chan_nel (5ch newer account)
0265デフォルトの名無しさん
垢版 |
2019/04/04(木) 13:53:52.02ID:lQbbBBhx
リとり間違うような恥ずかしい間違いだな
0268デフォルトの名無しさん
垢版 |
2019/04/06(土) 19:32:01.25ID:EXSfDg77
大正はIME類に成語として登録されてるからよっぽどでもないかぎり他の大は出てこんわね。

でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。
0269デフォルトの名無しさん
垢版 |
2019/04/07(日) 11:42:20.44ID:8ULyWhed
じゃあ令和もIME登録したらいい,って思っちゃうのは素人考えなんですかね。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況