文字コード総合スレ Part11

レス数が950を超えています。1000を超えると書き込みができなくなります。
1デフォルトの名無しさん2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/

910デフォルトの名無しさん2018/11/24(土) 22:31:27.28ID:3CbvFbkZ
20年くらい前にfjで「8bit通らないMTAってまだどっかで稼働してるのかね?」って話をしてたような気がするが。

911デフォルトの名無しさん2018/11/24(土) 23:28:09.38ID:or35NFsF
ならUTF-7使うしかない

912デフォルトの名無しさん2018/11/24(土) 23:36:50.36ID:nC23MCFq
20年前でもほぼ8bitが通る状況だったならMUAの側も
8bit文字をエンコードせずに送る設定を用意してもよさそうだが
それができるMUAはあるんだろうか

913デフォルトの名無しさん2018/11/25(日) 00:05:18.90ID:KC5pxzP6
>>903
店名って公的な機関に届け出る書類に記載したりすることあるのかな?
この漢字は使えたのだろうか...

914デフォルトの名無しさん2018/11/25(日) 00:12:25.76ID:nGQiRV3b
税の申告書で屋号とか書く欄があったような無かったような

915デフォルトの名無しさん2018/11/25(日) 01:10:56.47ID:Tmpw9nku
https://hitosara.com/0005040173/
既になくなってしまったみたい

文字だけでなく読みさえも実在の怪しい「おとど」のほうは元気なようだが

916デフォルトの名無しさん2018/11/25(日) 17:37:13.70ID:arFqKMW0
>>909
>問題なく送れた

おま環だけうまくいっても意味無いんだ

917デフォルトの名無しさん2018/11/26(月) 00:16:22.18ID:55zKdsET
>>905
局部の隠し方が絶妙すぎて笑う

918デフォルトの名無しさん2018/11/26(月) 11:27:31.30ID:SVaivieI
>>914
昔はあった、今もあるかは知らん

919板の新参者ですが2018/11/27(火) 07:32:04.24ID:bOfqa3Yp
5chでは、スレッドによってか板によってか知りませんが、
Unicode文字が数値文字参照に化けたりって、どういう場合
なのでしょうか?

スレの立て方で決められるのでしょうか?
 ⇒設定方法など、どなたか詳細をご存知でしたらご教示願います。
それとも板ごとに決まっているのでしょうか?
 ⇒設定一覧など、どなたか詳細をご存知でしたらご教示願います。

基本的なことようですが、自分では検索でうまくヒットできません。

920デフォルトの名無しさん2018/11/27(火) 08:48:35.30ID:vqp/19EL
>>919

https://info.5ch.net/index.php/SETTING.TXT

その板のSETTING.TXTのBBS_UNICODE による

921デフォルトの名無しさん2018/11/27(火) 10:50:58.56ID:zH6Yh8LQ
BBS_UNICODE=passでも、今は数値文字参照(10進数)だけが使えるんだよな。
以前は数値文字参照(16進数)も文字実体参照も使えたんだけど。

js使った変換ツールで変換してるわ。

922デフォルトの名無しさん2018/11/27(火) 14:22:21.18ID:pHjl6gJ9
>>921
へえ、知らなかった。
なんかある時期から使えなくなった気がして、
ちゃんとできてる書き込みが謎だったわ。10進限定とは。

923デフォルトの名無しさん2018/11/27(火) 16:22:46.53ID:zH6Yh8LQ
とりあえず現状を試しておこう。

ハートの全角文字テスト
♥ → ♥
♥ → ♥
♥ → ♥

さて、どうかな?

924デフォルトの名無しさん2018/11/27(火) 19:32:26.19ID:t2TLQBob
📛 日本人には幼稚園児の名札に見える絵文字は、外国人には何なのかさっぱりわからず『燃えるトーフ』と呼ばれていた - Togetter
https://togetter.com/li/1292538

925デフォルトの名無しさん2018/11/27(火) 19:57:48.88ID:gXLD+0BO
顔文字はこれ以上増やすよりZWJを使って目とか口とかを組み合わせて
自分で作れるようにした方がいいと思う

926デフォルトの名無しさん2018/11/27(火) 20:14:23.30ID:+uQVAXpU
全角とは

927デフォルトの名無しさん2018/11/28(水) 02:59:23.88ID:BkKDQWNJ
FULL WIDTH

928デフォルトの名無しさん2018/11/28(水) 04:06:11.10ID:A2M+lx4Y
>>926
全てにおいて角こそが至上であると妄信する一種のトランス状態
一例をだすと漫画「おれは直角」の主人公がそうである

929デフォルトの名無しさん2018/11/28(水) 09:49:40.91ID:zomCLGU3
横方向に Full Width 全角
縦方向に Full Width 倍角

930デフォルトの名無しさん2018/11/28(水) 12:51:43.14ID:b91COmuR
ワープロ専用機時代、横倍角なんていう気持ち悪いのがあったな

931デフォルトの名無しさん2018/11/28(水) 15:08:09.04ID:N7oZ3GQl



気持ち悪いってもこれよりはマシやろ

932デフォルトの名無しさん2018/11/29(木) 01:40:08.15ID:lIzTCHsu
HALF WIDTH  (^-^)
FULL WIDTH  (    ^    _    ^    )

933デフォルトの名無しさん2018/11/29(木) 14:33:52.79ID:Msn7clch
iconvの文字集合オプションに「EUC-JISX0213」っていうのがあったんだけど
これシステムはEUC-jpと認識するけど中にはJIS X 0213で定められた新しい文字を
入れられるって意味……じゃないよね。
というのはSKK-JISYOで使いたい異字体があったのでこのエンコーディングをしてみたけど無理だったので。

934デフォルトの名無しさん2018/11/30(金) 13:11:19.56ID:FBzo8MwT
>>933
少しぐらいは調べろよ……検索したら幾らでも情報が出てくるよ。
EUC-JPの一種だけど今は廃止されてる。

EUC-JIS-2004 - Wikipedia
https://ja.wikipedia.org/wiki/EUC-JIS-2004

EUC-JISX0213 ‐ 通信用語の基礎知識
https://www.wdic.org/w/WDIC/EUC-JISX0213

935デフォルトの名無しさん2018/11/30(金) 14:13:45.09ID:P5LXHiB7
廃止されたんか…

936デフォルトの名無しさん2018/11/30(金) 14:42:42.21ID:XOMh22Gb
廃止されたんよ

937デフォルトの名無しさん2018/11/30(金) 14:59:53.47ID:5jWhYr7h
そうなんかい…

938デフォルトの名無しさん2018/12/01(土) 01:50:51.78ID:V6WUEvLt
EUCで0213したいときはどうすればいいんだ…

939デフォルトの名無しさん2018/12/01(土) 02:27:14.32ID:O7l2nkqH
普通にEUC-JIS-2004を使え

940デフォルトの名無しさん2018/12/01(土) 02:33:51.02ID:LH+8CiFR
えぇ…

941デフォルトの名無しさん2018/12/01(土) 04:17:45.98ID:r8gMvw+h
なんで廃止するんだ…

942デフォルトの名無しさん2018/12/01(土) 15:43:51.59ID:4cHgv8YS
よう分からん。
EUC-JISX0213(JIS X 0213:2000ベース)は廃止されて、EUC-JIS-2004(JIS X 0213:2004ベース)になったってことでいいのか?

943デフォルトの名無しさん2018/12/01(土) 16:34:03.50ID:bl/45R/s
改訂のタイミングでX0213から-2004に名前が変わっただけってこと?

944デフォルトの名無しさん2018/12/03(月) 16:03:32.93ID:FWFg2HSw
>>942
そゆこと。
実際にはEUC-JIS-2004が上位互換だし、ウィキペディアからの引用だけど、

>なお、この符号化方式はJIS X 0213の初版 (2000年) ではEUC-JISX0213と命名されていた。
>2004年改正におけるUCS互換漢字10文字の有無だけが異なるが、大きな違いではないためEUC-JIS-2004と同一視されることもある。

とのことなので、ほぼ同じものと思ってよい。

945デフォルトの名無しさん2018/12/04(火) 00:06:31.38ID:kEiJOL5a
なあんだ

946デフォルトの名無しさん2018/12/05(水) 23:26:18.07ID:0a3ULp4B
JISの漢字コードってたまにそういうのあるよね
2文字増えただけのJIS0208-1990とか

947デフォルトの名無しさん2018/12/07(金) 11:12:03.49ID:baVD1zSv
日本マイクロソフトやAdobeが改元対応を説明
https://pc.watch.impress.co.jp/docs/news/1157118.html

同社では、1993年に「マイクロソフト標準キャラクタセット」として、
相互運用を目的とした文字コードを策定しているが、
今回の新元号対応では同社独自の対応は行なわず、ベースとなる標準に準拠し、
Code Page 932/拡張文字を含むシフトJISでは対応を行なわないと説明。
Unicodeについては標準の対応に準じた更新を予定する。

フォント更新については、同社のシステム標準フォントである
MSゴシックやMeiryo UI、Yu Gothic UIなどで新元号に対応するとした。
なお、IME辞書の更新については、フォントを含むすべての更新作業後の対応となる。

948デフォルトの名無しさん2018/12/07(金) 16:19:20.12ID:qBlHhwTE
え、これってひょっとして新元号合字が使えるのはUnicode系統だけで、
JIS X0208/SJIS/CP932系統では今後永遠に使えるようにならないってこと?

元号合字を必要としてるとこって、まさに未だそういう系統を使ってるとこだと思うんだけど…

949デフォルトの名無しさん2018/12/07(金) 16:48:04.41ID:7WHjGWxq
独自の文字セットで運用すりゃいいだけ

950デフォルトの名無しさん2018/12/07(金) 21:50:22.19ID:0/x3pMw+
JIS X 0213に入ったら
当然Shift_JISにもいれるべき
~ 2D5F
潤@2D6F
氏@2D6E
香@2D6D

2D5Eが空いてる

951デフォルトの名無しさん2018/12/07(金) 22:22:10.91ID:nIptkpuh
和田研細丸ゴシックのU+32FFのグリフ

平成
の次

で吹いたw

952デフォルトの名無しさん2018/12/07(金) 22:28:33.61ID:Z7Pkiqbl
しかし年号の余裕も言うほどないよな
10人くらいがばばーっと毎年のように亡くなって年号も変わったらどうするつもりなのだろう
なんだかんだで西暦が一番よねえ
もしくはネトウヨが言うような皇紀とやらにしちゃいなよ
人で変わらない数字って楽ちんよー
四桁にもなれば先頭はまず変わらないわけだし

953デフォルトの名無しさん2018/12/07(金) 23:44:21.45ID:Sv6zm0b9
そんなにしょっちゅう変わったらさすがに文字コード需要のほうがなくなりそうだが

954デフォルトの名無しさん2018/12/08(土) 01:15:36.39ID:7zz08Xs4
どのみち継承者を今後10年で10人確保するのは無理なので…

955デフォルトの名無しさん2018/12/08(土) 02:21:31.30ID:nIDZ4yFF
赤ちゃんでもいいので可能性はある

956デフォルトの名無しさん2018/12/08(土) 03:58:41.86ID:xmV4OmOO
既にある文字を組み合わせた合字が増え続けるとわかっているなら次の文字が半分の大きさであることを
表すコントロールコードを作ってしまってそれを付加した2文字を使った方が良いのではないか?
そうしないと延々と文字が増え続ける。

957デフォルトの名無しさん2018/12/08(土) 05:46:24.58ID:4O5fRXD5
なんかプレッシャーに耐えかねてホモに走って断絶なんてことになりそうな気もするけどなあ

958デフォルトの名無しさん2018/12/08(土) 08:49:48.25ID:VbRdNM0/
縦書きも考慮しなきゃいけないとか面倒くさすぎだな

新元号対応について
https://citpc.jp/download/2018-12-06%20CITPC%20Seminar_Ken%20Tamaru.pdf

959デフォルトの名無しさん2018/12/09(日) 20:48:07.44ID:NLNV6qg6
>>948
JIS X 0213が話題になった時もMicrosoftが表明したのは
「マイクロソフト標準キャラクタセットはもう凍結、
CP932の拡張はしない、UCS/Unicodeとしてはサポートする」
だったから既定の方針通りですな。

http://www.jepa.or.jp/jepa_cms/wp-content/uploads/2010/05/jepa0000518783.pdf
https://www.itscj.ipsj.or.jp/hasshin_joho/unei/files/unei21-Kajisa.pdf

960デフォルトの名無しさん2018/12/10(月) 08:46:40.86ID:S9fSc6ei
Unifontだと、32FFは

32
FF  (undefined)

だね。こうゆうのが、一番解りやすくていいんだけど、
なぜ他のフォントは、マネをしないんだろうか?

新着レスの表示
レス数が950を超えています。1000を超えると書き込みができなくなります。
レスを投稿する