プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
探検
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5496デフォルトの名無しさん
2018/07/05(木) 20:37:53.33ID:cHUpj8OH >>495
線文字Aとか楔形文字拡張とか見ても同じこと言えるか?
線文字Aとか楔形文字拡張とか見ても同じこと言えるか?
497デフォルトの名無しさん
2018/07/05(木) 21:16:32.44ID:CqUNBSEq >>496
でもあれは互換性もクソもないじゃん
でもあれは互換性もクソもないじゃん
498デフォルトの名無しさん
2018/07/05(木) 22:49:22.73ID:cHUpj8OH 誰にも読めない、使えない、未解読の古代文字とか登録してるくらいだから、現代でも使用可能な文字なら余裕って話だ。
499デフォルトの名無しさん
2018/07/05(木) 23:18:38.72ID:0kDXGIdf だめか
𒀑
𒄦
くさび
𒀑
𒄦
くさび
500デフォルトの名無しさん
2018/07/06(金) 07:29:45.69ID:3U2Ta28u ~(元号を一文字化したもの)とかあるからな
申請すれば何でも通るんじゃねーの
申請すれば何でも通るんじゃねーの
501デフォルトの名無しさん
2018/07/06(金) 08:24:58.10ID:QJllJwz8 申請する権利のある人ならな。
大手OSメーカー、国家規格代表、ごく一部の文字専門家。
大手OSメーカー、国家規格代表、ごく一部の文字専門家。
502デフォルトの名無しさん
2018/07/06(金) 08:47:24.31ID:IGjSb2yt 潤A~などは、昔の(日本の)文字コードとの互換性を取るために
残しているだけ。だから、次の元号の合わせ文字は通らない。
残しているだけ。だから、次の元号の合わせ文字は通らない。
503デフォルトの名無しさん
2018/07/06(金) 10:05:30.92ID:odzQpd8G 文部の沙汰も金私大
504デフォルトの名無しさん
2018/07/06(金) 19:02:02.70ID:3U2Ta28u >>502
もうコードの場所を確保してあるってMSの元号対応ブログで言ってたよ
もうコードの場所を確保してあるってMSの元号対応ブログで言ってたよ
505デフォルトの名無しさん
2018/07/06(金) 22:30:52.61ID:p79Hvr/2506デフォルトの名無しさん
2018/07/07(土) 01:28:54.42ID:kLxolQc6 空いてるとこにテキトーにいれてるだけやん
文字コードが連続してないし
ひどいマッピングされてるわ
文字コードが連続してないし
ひどいマッピングされてるわ
507デフォルトの名無しさん
2018/07/07(土) 10:47:15.09ID:OQyJYPpl 元号は、これからもどんどん増えてゆくんだから、Unicodeに
「日本元号面」を作って、そこに入れるようにしてほしい。
「日本元号面」を作って、そこに入れるようにしてほしい。
508デフォルトの名無しさん
2018/07/07(土) 11:50:18.74ID:kLxolQc6 ちなみに先に書いた全文検索エンジンでは
アイウエオもアイウエオも
ガギグゲゴもガギグゲゴも
12345も12345も
abcdeもabcdeも
同じ文字コードとして扱ってる
つまりどっちでキーワード書いても当たる
見た目(つまりグリフ)が違うだけで同じだからな
しかし明治大正昭和平成を合紫順~までは
やってない
すでにいろんなもんでその全文検索エンジンは使われてるが
コレで文句がきたことはない
つまりだれも気にしてない
アイウエオもアイウエオも
ガギグゲゴもガギグゲゴも
12345も12345も
abcdeもabcdeも
同じ文字コードとして扱ってる
つまりどっちでキーワード書いても当たる
見た目(つまりグリフ)が違うだけで同じだからな
しかし明治大正昭和平成を合紫順~までは
やってない
すでにいろんなもんでその全文検索エンジンは使われてるが
コレで文句がきたことはない
つまりだれも気にしてない
509デフォルトの名無しさん
2018/07/07(土) 13:23:15.59ID:WVErtcKw カ゚キ゚ク゚ケ゚コ゚はどうなるんだ
510デフォルトの名無しさん
2018/07/07(土) 13:49:40.16ID:kLxolQc6 こんな感じの内容からインデックスやマッチング用のデータが作成される
ガギグゲゴ ガギグゲゴ ⇒ カ゛キ゛ク゛ケ゛コ゛
カ゚キ゚ク゚ケ゚コ゚ ⇒ カ゜キ゜ク゜ケ゜コ゜
つまりインデックスやマッチング用のデータを作る前に前処理で一気に痴漢することになる
で、キーワードをガギグゲゴやガギギゲゴやカ゛キ゛ク゛ケ゛コ゛にすると
カ゛キ゛ク゛ケ゛コ゛で検索することになる
つまりこの全文検索エンジンは濁音も半濁音も検索できる超優れものといえるのだ
ガギグゲゴ ガギグゲゴ ⇒ カ゛キ゛ク゛ケ゛コ゛
カ゚キ゚ク゚ケ゚コ゚ ⇒ カ゜キ゜ク゜ケ゜コ゜
つまりインデックスやマッチング用のデータを作る前に前処理で一気に痴漢することになる
で、キーワードをガギグゲゴやガギギゲゴやカ゛キ゛ク゛ケ゛コ゛にすると
カ゛キ゛ク゛ケ゛コ゛で検索することになる
つまりこの全文検索エンジンは濁音も半濁音も検索できる超優れものといえるのだ
511デフォルトの名無しさん
2018/07/07(土) 14:06:53.21ID:IMiijYtR 痴漢アカン
512デフォルトの名無しさん
2018/07/07(土) 14:25:13.00ID:WVErtcKw 俺はそういうのを考えるのが面倒だからUNICODE正規化だけしてる
おかげで平成と~もちゃんと検索でヒットする
おかげで平成と~もちゃんと検索でヒットする
513デフォルトの名無しさん
2018/07/07(土) 15:16:01.20ID:kLxolQc6 ちなみに客ごとに置換辞書を作ってる
客ごとに要望が違うからな
客によってはいろんな要望をいってくる客もいる
その要望に応えるのも仕事だからな
で、そのなかに合紫順~を置換した例はない
全角にマッピングされてるasciiや半角カナの部分は
コレについてほぼ間違いなくみな同じ結論になる
それ以外で異なる特殊な部分は結構ある
文字コードでシノニムの部分もあれば、それ以外でシノニムにしたい部分もあったりする
それは客の業務に依存する部分になるからな
客ごとに要望が違うからな
客によってはいろんな要望をいってくる客もいる
その要望に応えるのも仕事だからな
で、そのなかに合紫順~を置換した例はない
全角にマッピングされてるasciiや半角カナの部分は
コレについてほぼ間違いなくみな同じ結論になる
それ以外で異なる特殊な部分は結構ある
文字コードでシノニムの部分もあれば、それ以外でシノニムにしたい部分もあったりする
それは客の業務に依存する部分になるからな
514デフォルトの名無しさん
2018/07/07(土) 15:17:11.21ID:kLxolQc6 考えるのはキミじゃないワケ
キミはただのドカタなワケ
わかる?
客と良好な関係を保つには
できるだけ、それは仕様ですは避けないといけない
そしてそれを低いコストで実現できないといけない
なにをしたいのかはっきりといってる部分については
こっちから客の業務についてどうこういう必要も理由もないし
こんなしょうもないことを実現するためにめっちゃカネかかりますよとかいえるワケもない
そういうことだ
キミはただのドカタなワケ
わかる?
客と良好な関係を保つには
できるだけ、それは仕様ですは避けないといけない
そしてそれを低いコストで実現できないといけない
なにをしたいのかはっきりといってる部分については
こっちから客の業務についてどうこういう必要も理由もないし
こんなしょうもないことを実現するためにめっちゃカネかかりますよとかいえるワケもない
そういうことだ
515デフォルトの名無しさん
2018/07/07(土) 15:56:51.92ID:hSg2x2AH516デフォルトの名無しさん
2018/07/07(土) 17:04:10.09ID:i11AJyJz 絵文字の無茶な合成が有りなんだから
平と成をzwjでくっつけたら~になるとかでいいのに
平と成をzwjでくっつけたら~になるとかでいいのに
517デフォルトの名無しさん
2018/07/07(土) 20:17:18.16ID:Ty8z3s6n 魚 + ZWJ + 里 = 鯉
とか収拾がつかなくなる
とか収拾がつかなくなる
518デフォルトの名無しさん
2018/07/07(土) 20:47:01.42ID:hSg2x2AH 光+宙=ピカチュウとか?
519デフォルトの名無しさん
2018/07/07(土) 21:11:51.93ID:URcWOMtI 次の元号組み文字はCP932やJISX0213には入るのかな?
520デフォルトの名無しさん
2018/07/07(土) 22:51:54.27ID:AwQTnpwn 月+光=胱とか
実際に胱を人名に使えるようにしてほしいという要望があるそうだ
実際に胱を人名に使えるようにしてほしいという要望があるそうだ
521デフォルトの名無しさん
2018/07/08(日) 00:07:58.74ID:ib3y3idC 自力でマッピングするnkfの遅さ。文化遺産だから保守され続けるのだろうけど。
522デフォルトの名無しさん
2018/07/08(日) 00:46:47.26ID:5rg7g6N2 ていうか確かそういう(漢字を結合する)のにピッタシな文字が用意されてた筈。
漢字表示文字だとかいう名称だったけど、検索してもそれらしい記事が引っ掛からんので
多分この名称は違う。
漢字表示文字だとかいう名称だったけど、検索してもそれらしい記事が引っ掛からんので
多分この名称は違う。
523デフォルトの名無しさん
2018/07/08(日) 00:54:45.54ID:AL4TGRyQ524デフォルトの名無しさん
2018/07/08(日) 21:30:52.45ID:Dz8m9jRj >>520
でもその月は本来は肉なのでわ
でもその月は本来は肉なのでわ
525デフォルトの名無しさん
2018/07/08(日) 21:58:14.68ID:VztP7D+N526デフォルトの名無しさん
2018/07/08(日) 22:00:52.97ID:fj164SAR >>520
要望する人はそんなの気にしないんでしょ
要望する人はそんなの気にしないんでしょ
527デフォルトの名無しさん
2018/07/08(日) 22:01:58.98ID:fj164SAR528デフォルトの名無しさん
2018/07/08(日) 22:15:50.43ID:0enAxBm5 合字と、ひとつの漢字が偏旁に分かれているのとはまた別だろ
529デフォルトの名無しさん
2018/07/08(日) 22:25:52.71ID:fj164SAR 胱を人名に使えるようにしてほしいと要望している人たちは
胱を月と光の合字のようなものと考えてるんだろうなって話だからな
胱を月と光の合字のようなものと考えてるんだろうなって話だからな
530デフォルトの名無しさん
2018/07/08(日) 22:58:07.18ID:CFOYAJun しかし肉と光でなんで膀胱なんだろうな
光は頭の上に火を掲げる神聖な存在を表していたらしいけど
特殊な性癖の人が尿を聖水というのと関係があるのかしら
光は頭の上に火を掲げる神聖な存在を表していたらしいけど
特殊な性癖の人が尿を聖水というのと関係があるのかしら
531デフォルトの名無しさん
2018/07/08(日) 23:05:05.80ID:FVlDE0YC 三光作戦の光
532デフォルトの名無しさん
2018/07/09(月) 02:42:13.13ID:f4diYHew 形声文字という概念も知らんのか…
533デフォルトの名無しさん
2018/07/09(月) 03:26:55.92ID:kfYRLcv/ >>530
https://blog.goo.ne.jp/ishiseiji/e/0177ce8e642676c6cffe2e87b0fc4766
胱 コウ 月部にく
解字 「月(からだ)+光(ひろがる)」 の会意形声。身体の中で尿をためておく袋状のもの。尿がたまってくると袋がひろがる。
意味 「膀胱ボウコウ」(ゆばりぶくろ)に使われる字。旁ボウも光コウも、ひろがる意。これに肉月をつけて身体のなかで尿をためて拡がる器官を表した。
https://blog.goo.ne.jp/ishiseiji/e/0177ce8e642676c6cffe2e87b0fc4766
胱 コウ 月部にく
解字 「月(からだ)+光(ひろがる)」 の会意形声。身体の中で尿をためておく袋状のもの。尿がたまってくると袋がひろがる。
意味 「膀胱ボウコウ」(ゆばりぶくろ)に使われる字。旁ボウも光コウも、ひろがる意。これに肉月をつけて身体のなかで尿をためて拡がる器官を表した。
534デフォルトの名無しさん
2018/07/09(月) 04:35:05.56ID:4WT+OSln 肺やちんこも広がるのですが?
535デフォルトの名無しさん
2018/07/11(水) 19:19:37.68ID:gmqqN491 昔の知識じゃそんなこと分からんやろ
足りない頭ひねって考えろやボケナス
足りない頭ひねって考えろやボケナス
536デフォルトの名無しさん
2018/07/11(水) 19:27:48.34ID:A6luu057 昔のちんこは拡がらなかったのですか!?
537デフォルトの名無しさん
2018/07/11(水) 22:21:59.51ID:LQKpeeG0 大陸の人のちんこはやらかい印象がある
538デフォルトの名無しさん
2018/07/12(木) 02:46:54.78ID:iPCGhCdE ギリシャでは包茎が持て囃されたしね
539デフォルトの名無しさん
2018/07/12(木) 09:58:56.70ID:x8Svnlzm 豚の膀胱が蹴鞠の材料だっけ
540デフォルトの名無しさん
2018/07/18(水) 22:57:34.06ID:BB+kHIx9 新元号がUnicode12にギリ間に合わないから12.1出そうかって話が出てきたか
541デフォルトの名無しさん
2018/07/19(木) 01:23:42.91ID:yQzT/5Dr この前危うく間に合いそうになってましたけどね
542デフォルトの名無しさん
2018/07/19(木) 06:57:15.79ID:0leqnnH4 えぇ そんな一国の事情でUnicode様が右往左往されるのですか!?
543デフォルトの名無しさん
2018/07/22(日) 16:13:27.34ID:WQtj2cDH トルコリラの「も」みたいなやつ追加した時もほぼそれだけじゃなかったっけ?
544デフォルトの名無しさん
2018/07/25(水) 14:58:24.45ID:oBls1I2Q Adobe-Japan1-6 Is Expecting!
https://blogs.adobe.com/CCJKType/2018/07/adobe-japan1-6-is-expecting.html
えーAdobe-Japan1-7って新元号を追加するだけで終わりなのー?
https://blogs.adobe.com/CCJKType/2018/07/adobe-japan1-6-is-expecting.html
えーAdobe-Japan1-7って新元号を追加するだけで終わりなのー?
545デフォルトの名無しさん
2018/07/25(水) 17:15:18.78ID:41CwtA3+ う、うん…(´・ω・`)
546デフォルトの名無しさん
2018/07/25(水) 18:24:58.87ID:oBls1I2Q JIS X 0212 補助漢字の残りはいつになったら……(´・ω・`)
547デフォルトの名無しさん
2018/07/25(水) 19:23:56.34ID:rm2bmQuM UTF-7の仕組みをはじめてしったが面倒くさいエンコードだった。
UTF-16と、BASE64に依存しててこれがなければ成立しないのかよ。
単体で存在するUTF-8とかと一緒かとおもってた。
UTF-16と、BASE64に依存しててこれがなければ成立しないのかよ。
単体で存在するUTF-8とかと一緒かとおもってた。
548デフォルトの名無しさん
2018/07/25(水) 22:28:09.49ID:NKwfwGfT 元号の組文字に先行リリースするほどの価値があるかなぁ
何にしろ早くAJ18出してよ
何にしろ早くAJ18出してよ
549デフォルトの名無しさん
2018/07/25(水) 22:55:41.73ID:QC64Azkr 元号の組文字使ってるとこあんの?
550デフォルトの名無しさん
2018/07/26(木) 00:34:28.84ID:a2xMjw11 来年の5月までまだ9ヶ月強あるのに今の時点でもうAJ1-7は2文字だけと決めてしまうなんて
候補の選定ってそんなに手間のかかるもんなのかねぇ
候補の選定ってそんなに手間のかかるもんなのかねぇ
551デフォルトの名無しさん
2018/07/26(木) 20:55:22.84ID:vMAtbXfy どの言語圏であれ、国家が絡めば、Unicode界隈ではおおごとだよ。日本の元号だってまさにそう。
あの絵文字どうしますかね、とかそういうレベルじゃないから。
あの絵文字どうしますかね、とかそういうレベルじゃないから。
552デフォルトの名無しさん
2018/07/27(金) 01:59:49.37ID:mPyMQHHw 元号も絵文字にしようよもう
覚えるの大変だよ
覚えるの大変だよ
553デフォルトの名無しさん
2018/07/27(金) 02:29:56.02ID:27BaLAkY そもそも漢字や象形文字は、一種の絵文字だけどね。
554デフォルトの名無しさん
2018/07/27(金) 02:40:46.86ID:1Fj2fl7C そもそも論はどうでもいい
555デフォルトの名無しさん
2018/07/27(金) 03:15:50.87ID:Wnb3i599 AJ16が出て結構経つとはいえこの間JISの改訂があったわけでもないんで
意外とAJ18も数十〜数百文字程度の小規模アップデートで終わるかも
意外とAJ18も数十〜数百文字程度の小規模アップデートで終わるかも
556デフォルトの名無しさん
2018/07/27(金) 04:12:40.69ID:L9NPxvRK 元号が絵文字になるとVSによって色黒な昭和とか女性的な明治とかが生まれるのか
557デフォルトの名無しさん
2018/07/27(金) 12:33:29.72ID:iHbYMqNW 元号なんて漢字2文字並べて書けばいいからそんな急ぐ必要無いだろ。
組み文字はUnicode13以降でもいいだろ。
組み文字はUnicode13以降でもいいだろ。
558デフォルトの名無しさん
2018/07/27(金) 17:48:33.71ID:27BaLAkY 大国であれ小国であれ、一国家の行政が絡んでいるという時点で、急ぐ必要があるんだよ。
なにしろ影響を受ける人の桁数が違う。
なにしろ影響を受ける人の桁数が違う。
559デフォルトの名無しさん
2018/07/27(金) 19:18:57.24ID:OorWiyDH 元号組文字なんか使ってる奴いるの?
560デフォルトの名無しさん
2018/07/27(金) 19:32:41.17ID:VZghEMWS 役所やぞ
561デフォルトの名無しさん
2018/07/27(金) 19:45:53.97ID:ZZpxf/7G 文字の名前もグリフも未定だけどとりあえずコードポイントだけ押さえましたなんて
Unicode史に残る珍事だと思うわ
Unicode史に残る珍事だと思うわ
562デフォルトの名無しさん
2018/07/27(金) 19:56:54.08ID:Sut8d6Pq 影響を受けやすいような手段を一国家の行政が採用している無能さを棚に上げてるから駄目なんだ
563デフォルトの名無しさん
2018/07/27(金) 20:31:49.16ID:27BaLAkY 「ワシは知らん」とUnicodeが無視した場合、本来は1ベンダーにすぎないマイクロソフトがそのしわ寄せに対応することになり、
結局、マイクロソフトの独自拡張をUnicodeがしぶしぶ追認することになるので二度手間なんだよ。
結局、マイクロソフトの独自拡張をUnicodeがしぶしぶ追認することになるので二度手間なんだよ。
564デフォルトの名無しさん
2018/07/27(金) 22:03:28.66ID:x//i6AWs 北朝鮮の将軍様専用ハングルとか数文字は国家規格に入ってるにも関わらず
未だにUnicodeに入れて貰えてないよな。
未だにUnicodeに入れて貰えてないよな。
565デフォルトの名無しさん
2018/07/27(金) 22:09:52.68ID:N1oOfHi2 元首の交代に伴って変更される紀年法をまだ使ってる国なんて他にあんのかね
566デフォルトの名無しさん
2018/07/27(金) 23:53:13.41ID:G98hsmYh まず無いだろうけど、もし新元号が現時点でUnicodeに無い漢字を使うものになったら
統合漢字のURO末端に緊急追加になるだろうな。
統合漢字のURO末端に緊急追加になるだろうな。
567デフォルトの名無しさん
2018/07/28(土) 01:26:08.91ID:YvWIBfUX568デフォルトの名無しさん
2018/07/28(土) 14:53:59.34ID:39ICzHjE M明治
T対象
S昭和
H平成
A麻原
T対象
S昭和
H平成
A麻原
569デフォルトの名無しさん
2018/07/28(土) 14:57:49.43ID:gid9j1yM ゆぁ〜えーびぃ〜すぃ〜ん♪
570デフォルトの名無しさん
2018/07/30(月) 00:49:54.80ID:/AsJWau1 >>564
そういえばあれって三代目用の文字もあるのかな?
そういえばあれって三代目用の文字もあるのかな?
571デフォルトの名無しさん
2018/07/31(火) 17:52:18.88ID:A7NyuH1x 将軍様専用ハングル以外にUnicode未収録文字は縞模様の三角とか謎の記号がいくつかあったな。
北朝鮮で使われてるRed Star OSではUnicodeが使われてるけどこれらはPUAに割り当てられてる。
因みにWindowsの北朝鮮版は無い。
>>570
2012年頃の改訂で追加されたらしい。
北朝鮮で使われてるRed Star OSではUnicodeが使われてるけどこれらはPUAに割り当てられてる。
因みにWindowsの北朝鮮版は無い。
>>570
2012年頃の改訂で追加されたらしい。
572デフォルトの名無しさん
2018/07/31(火) 23:58:28.90ID:NbiBz0uu 新元号組み文字はJIS X0213には入れるのかな。
入れるとしたら~の1つ前の1面13区62点、シフトでJIS0x877D辺りか。
入れるとしたら~の1つ前の1面13区62点、シフトでJIS0x877D辺りか。
573デフォルトの名無しさん
2018/08/02(木) 01:17:44.00ID:OU+qDqBT 専用ハングルはなんで「金」とか「日」とか重複する文字を代ごとに別々に入れてるのか謎
574デフォルトの名無しさん
2018/08/02(木) 01:31:21.78ID:A1dOXp8b >>573
謎か?
謎か?
575デフォルトの名無しさん
2018/08/02(木) 04:36:12.48ID:0KRWeg2T 最近の文字コードやばない?
576デフォルトの名無しさん
2018/08/02(木) 08:45:58.28ID:XfZDNvg1 文字コードとしては謎だろ
担当は何をしているのか
指摘どころか質問した時点で解雇されるルールでもあるのかよってくらいに謎だわ
担当は何をしているのか
指摘どころか質問した時点で解雇されるルールでもあるのかよってくらいに謎だわ
577デフォルトの名無しさん
2018/08/03(金) 00:21:52.08ID:SeT2nEoR やっぱおじいちゃんの金とおとうさんの正をを孫に使ったりしたら怒られるのかな。
グリフを見ただけで誰用の金なのかを見比べるスキルが必要になるんだろうな。
グリフを見ただけで誰用の金なのかを見比べるスキルが必要になるんだろうな。
578デフォルトの名無しさん
2018/08/03(金) 20:44:28.67ID:TC+4ZTQW nkfコマンドってなにもオプション指定しないでも文字化け直してくれるんだなw
どうやってるのか知らなくて怖いが(普段はiconv(1)を使ってる)
どうやってるのか知らなくて怖いが(普段はiconv(1)を使ってる)
579デフォルトの名無しさん
2018/08/04(土) 01:43:06.83ID:i5vBNvJr 美乳
580デフォルトの名無しさん
2018/08/04(土) 02:59:33.13ID:iDjKbl2c >>579
今時EUC-jpが生きてるシステムってあるの?
今時EUC-jpが生きてるシステムってあるの?
581デフォルトの名無しさん
2018/08/04(土) 04:56:17.77ID:iUNKVgUH 文字コードの自動判別は、100% 正確じゃない
間違うこともある
間違うこともある
582デフォルトの名無しさん
2018/08/04(土) 09:23:39.15ID:LcV/uUAN bit 順に意味があるんだろうけど
"\xC8\xFE\xC6\xFD"
なんでこれで自動検出できるかの説明が欲しい
"\xC8\xFE\xC6\xFD"
なんでこれで自動検出できるかの説明が欲しい
583デフォルトの名無しさん
2018/08/04(土) 09:42:12.43ID:eMjkhZRT584デフォルトの名無しさん
2018/08/04(土) 16:00:30.01ID:qslvxdhp UnicodeはUCS-4を基本形にして
UTF-8はUCS-4の圧縮版のような扱いでいいんじゃないか
UCS-4ならCode Chartsに書かれている値をそのまま使うから分かりやすいし
UTF-16は廃止してもいいと思う
UTF-8はUCS-4の圧縮版のような扱いでいいんじゃないか
UCS-4ならCode Chartsに書かれている値をそのまま使うから分かりやすいし
UTF-16は廃止してもいいと思う
585デフォルトの名無しさん
2018/08/04(土) 22:01:13.64ID:TFSU2vbY わざわざ廃止とかデメリットしかない
586デフォルトの名無しさん
2018/08/04(土) 22:35:16.02ID:sXotmGKy WindowsのAPIがUTF-16ベースなのに廃止とか無理でしょ
587デフォルトの名無しさん
2018/08/04(土) 23:38:59.79ID:Xh+3QD0k pcre はutf8対応が不完全。無理もない話だけど。
文字コードのライブラリを作る人からすればutf8よりも、utf16やutf32の方が便利。
文字コードのライブラリを作る人からすればutf8よりも、utf16やutf32の方が便利。
588デフォルトの名無しさん
2018/08/04(土) 23:53:51.88ID:9dBFGr/9 そのutf-8の問題は utf-16でもutf-32でも同じなのでは
589デフォルトの名無しさん
2018/08/05(日) 03:05:25.66ID:lHG7kQYc seekがめんどくさいのがUTF-8の問題だと思うんだけど違うの?
590デフォルトの名無しさん
2018/08/05(日) 03:36:24.64ID:oEhLV38F UTF-16はUTF-8とUTF-32のデメリットを兼ね備えていて、
メリットが無いような気がする。
メリットが無いような気がする。
591デフォルトの名無しさん
2018/08/05(日) 04:33:54.11ID:kXrZdLCy このスレに来るような人が、どうしてutf8とutf16/32が同じと思うのか不思議。
自力で文字判定処理をやったことがないスクリプト言語プログラミング一辺倒の人?
自力で文字判定処理をやったことがないスクリプト言語プログラミング一辺倒の人?
592デフォルトの名無しさん
2018/08/05(日) 08:22:11.27ID:RknsX4qY593デフォルトの名無しさん
2018/08/05(日) 08:42:30.75ID:kXrZdLCy pythonなんて内部の文字コードutf16だよ。
使う側が意識せずに済んでるってのがむしろ凄いわけで。
utf16要らないとか言ってる人は、事業仕分けでドヤ顔する民主党議員だわ。
使う側が意識せずに済んでるってのがむしろ凄いわけで。
utf16要らないとか言ってる人は、事業仕分けでドヤ顔する民主党議員だわ。
594デフォルトの名無しさん
2018/08/05(日) 10:13:37.02ID:lHG7kQYc 仕分けしたからモリカケだけで済んでるんじゃないの?
595デフォルトの名無しさん
2018/08/05(日) 12:03:49.97ID:LsZm/jJA 本当だよ
無駄な予算にかけようとするこういうバカは消えてほしい
無駄な予算にかけようとするこういうバカは消えてほしい
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 日本損失1.7兆円に修正 中国渡航自粛の影響試算 [蚤の市★]
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」 [冬月記者★]
- 【実況】博衣こよりのえちえち朝こよ🧪 ★2
- 【実況】博衣こよりのえちえち朝こよ🧪
- カカロット、腰痛い
- 結局松本人志ノーダメージじゃん
- 【!?】高市早苗「靖国神社電撃参拝プラン」浮上!これもう戦争だろ… [481941988]
- 今朝も阿佐ヶ谷に住みたくて咽び泣いてる😭
