プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/12/17(月) 16:48:24.47ID:Pfqpaohb22さまよえる蟻人間 ◆T6xkBnTXz7B0
2019/03/10(日) 18:05:00.62ID:eLFCjw3Q23デフォルトの名無しさん
2019/03/11(月) 04:49:49.14ID:pTTv+VC9 本当に怖い文字コードの話
なんか貼れないので分割
heppoko.
hatenadiary.
jp/
entry/
2018/04/28/184559
なんか貼れないので分割
heppoko.
hatenadiary.
jp/
entry/
2018/04/28/184559
24デフォルトの名無しさん
2019/03/11(月) 08:44:07.99ID:u2Hto+zd ツイッターで#テクノロジー犯罪と検索して、まじでやばいことを四代目澄田会の幹部がやってる
被害者に対して暴力団以外にタゲそらしをしてるがやってるのは暴力団で普段外に出ることが少ないため遊びで公共の電波と同じような電波を使って殺人をしてる
統失はほとんどが作られた病気で実際は電波によって音声送信や思考盗聴ができることが最近明らかになりつつある
警察や病院では病気としてマニュアル化されてしまっているのが現状で被害者は泣き寝入りしてる
被害者がリアルタイムで多い現状を知って、被害者間でしか本当の事だと認知できていない
実際にできると思われていない事だから、ただの幻聴ではない実際に頭の中で会話ができる
できないことだと思われているからこそ真面目に被害を訴えてる
海外でも周知されつつあることを知ってほしい。
このままだとどんどん被害が広がる一方
#テクノロジー犯罪
#四代目澄田会
被害者に対して暴力団以外にタゲそらしをしてるがやってるのは暴力団で普段外に出ることが少ないため遊びで公共の電波と同じような電波を使って殺人をしてる
統失はほとんどが作られた病気で実際は電波によって音声送信や思考盗聴ができることが最近明らかになりつつある
警察や病院では病気としてマニュアル化されてしまっているのが現状で被害者は泣き寝入りしてる
被害者がリアルタイムで多い現状を知って、被害者間でしか本当の事だと認知できていない
実際にできると思われていない事だから、ただの幻聴ではない実際に頭の中で会話ができる
できないことだと思われているからこそ真面目に被害を訴えてる
海外でも周知されつつあることを知ってほしい。
このままだとどんどん被害が広がる一方
#テクノロジー犯罪
#四代目澄田会
25デフォルトの名無しさん
2019/03/11(月) 13:01:21.07ID:qRllmJaM >>218
ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ
ㇹ゚ン゚'ㇳ̃ヴ゙ニ゙コ゚ヮヰ文̂字̠コ゚−ト゚ノ゙ㇵナ゚ㇱ
26デフォルトの名無しさん
2019/03/11(月) 14:24:48.05ID:hfHU2O5u char_traits の length って信用していいの?
27デフォルトの名無しさん
2019/03/12(火) 03:51:12.13ID:FSVt1tPQ 若干違和感ある部分も
絵文字がある種のUnicodeバグを世界から一掃しつつある件について
note.mu/
ruiu/n/nc9d93a45c2ec
絵文字がある種のUnicodeバグを世界から一掃しつつある件について
note.mu/
ruiu/n/nc9d93a45c2ec
2019/07/12(金) 14:43:41.63ID:q8HbeEfz
Unicodeが出してるiconvみたいな変換ライブライあるじゃん?
あれどうなん?
あれどうなん?
2019/12/25(水) 20:38:30.91ID:N+K1pmuB
なんか文字追加されたね。
https://unicode.org/charts/beta/nameslist/
https://unicode.org/charts/beta/nameslist/
2019/12/27(金) 08:43:18.71ID:GMT90LLU
と思ったらUnicode 13発行されるのか。
2020/04/11(土) 19:22:36.64ID:md0SvLvZ
またUnicode.orgのサーバー落ちてる……
2020/06/17(水) 21:52:52.20ID:5H4oQmhP
2020/07/03(金) 16:13:30.65ID:o8JvC3od
34デフォルトの名無しさん
2020/07/03(金) 20:55:14.32ID:elbfDzqw 重複スレが残ってたのか
Part13立てちゃった
Part13立てちゃった
2020/07/03(金) 23:14:01.31ID:uIgOlo/V
「コマンドプロンプトはcp932(SJIS)である」はウソ
Windows NTの標準の文字コードであるUnicode(UTF16-LE)の
テキストファイルを作り、chcp 932のままtypeコマンドで表示してみましょう
文字化けせずに表示されますね?
(フォントがない場合は表示されないがそれ以外は問題ない)
これは明らかにコマンドプロンプトがUnicodeで動作している証拠です。
コマンドプロンプトがUnicode動いているという証明はこれで十分だと思いますが、
もし仮に反論があるならその根拠を言ってくれれば説明を追加します。
(根拠なしにcp932にきまってるだろ!みたいなものは一言で潰しますのでよろしく)
Windows NTの標準の文字コードであるUnicode(UTF16-LE)の
テキストファイルを作り、chcp 932のままtypeコマンドで表示してみましょう
文字化けせずに表示されますね?
(フォントがない場合は表示されないがそれ以外は問題ない)
これは明らかにコマンドプロンプトがUnicodeで動作している証拠です。
コマンドプロンプトがUnicode動いているという証明はこれで十分だと思いますが、
もし仮に反論があるならその根拠を言ってくれれば説明を追加します。
(根拠なしにcp932にきまってるだろ!みたいなものは一言で潰しますのでよろしく)
36デフォルトの名無しさん
2020/07/03(金) 23:59:01.41ID:2ewiuNjd37デフォルトの名無しさん
2020/07/04(土) 00:12:44.08ID:xxQcNpXl ヒラキ゛ノ角コ゛シック
2020/07/04(土) 02:05:01.27ID:Vdunr+kB
MS Gothic = MS ゴシック
MS PGothic = MS Pゴシック
MS UI Gothic = MS UI Gothic
MS PGothic = MS Pゴシック
MS UI Gothic = MS UI Gothic
2020/07/04(土) 21:58:35.22ID:0DTN05zS
「うわー、ID:uIgOlo/V 君て博識なんだね。私も試してみるね。
「コマンドプロンプトを開いて…と
「それで “漢字”と入力したファイル k を UTF16 LE で保存と…
「よし準備完了!
--
C:\>od -x k
0000000 feff 6f22 5b57 000d 000a
0000012
C:\>type k
漢字
C:\>copy k con
・"oW[
1 個のファイルをコピーしました。
C:\>cat k
・"oW[
C:\>type k | od -t x1
0000000 8a bf 8e 9a 0d 0a
0000006
C:\>
--
「あれれ? ID:uIgOlo/V 君、なんかおかしいよ? どうして?
「“「コマンドプロンプトはcp932(SJIS)である」はウソ”なんだよね?
「コマンドプロンプトを開いて…と
「それで “漢字”と入力したファイル k を UTF16 LE で保存と…
「よし準備完了!
--
C:\>od -x k
0000000 feff 6f22 5b57 000d 000a
0000012
C:\>type k
漢字
C:\>copy k con
・"oW[
1 個のファイルをコピーしました。
C:\>cat k
・"oW[
C:\>type k | od -t x1
0000000 8a bf 8e 9a 0d 0a
0000006
C:\>
--
「あれれ? ID:uIgOlo/V 君、なんかおかしいよ? どうして?
「“「コマンドプロンプトはcp932(SJIS)である」はウソ”なんだよね?
40デフォルトの名無しさん
2020/07/04(土) 22:21:02.22ID:xxQcNpXl cmd /U /C echo Hello | od -t x1
2020/07/04(土) 23:31:46.91ID:M3d71N9d
42デフォルトの名無しさん
2020/07/05(日) 12:27:30.05ID:dKznqT0V >>39
chcp 65001
chcp 65001
2020/07/05(日) 13:58:13.31ID:jQ41esUI
というか、コマンドプロンプトにCP932にない文字を貼り付けて普通に出力できている時点で
コマンドプロンプトが特定のコードページに依存していないと気づくだろ。
echo 六四清场
コマンドプロンプトが特定のコードページに依存していないと気づくだろ。
echo 六四清场
2020/07/05(日) 14:04:49.45ID:jQ41esUI
mingwのcatやgrepをコマンドプロンプトから呼び出すと一時的にchcp 65001な状態になって画面出力される。
2020/07/05(日) 21:04:09.52ID:M+BkbwUs
2020/07/05(日) 23:20:17.80ID:jQ41esUI
2020/07/06(月) 01:59:06.09ID:T074ZQpk
mingwのcatやgrepでSJISにない文字も表示できるので
その論法は成り立たない
その論法は成り立たない
48デフォルトの名無しさん
2020/07/06(月) 10:35:57.48ID:vjiPzzt6 SJISちゃんのことは早く忘れろ
2020/07/07(火) 00:26:29.24ID:wqab1oeP
やだーExcelのマクロファイルSJISだもん
50デフォルトの名無しさん
2020/07/08(水) 17:17:18.70ID:h0xUNipw Office文書自体はOOXMLでUTF-8になったのに
マクロは未だにShift_JISなのか。
マクロは未だにShift_JISなのか。
2020/07/09(木) 09:25:45.33ID:vrNDocOm
唐突かつ広範な主張
マウントスタート
主観的な理由
地に足のつかない結論
わずかな文章に愚かさが詰め込まれていて揶揄せずにおれない
マウントスタート
主観的な理由
地に足のつかない結論
わずかな文章に愚かさが詰め込まれていて揶揄せずにおれない
52デフォルトの名無しさん
2020/07/18(土) 13:33:37.82ID:uRU3MGLx 知られざる顔文字の世界
https://www.hottolink.co.jp/blog/20161114_66202/
https://www.hottolink.co.jp/blog/20161114_66202/
2020/07/20(月) 21:19:31.88ID:SNT5szCU
AppleとGoogle、世界絵文字デーに新絵文字を披露
https://www.itmedia.co.jp/news/articles/2007/20/news053.html
https://www.itmedia.co.jp/news/articles/2007/20/news053.html
54デフォルトの名無しさん
2020/07/21(火) 11:54:04.73ID:+OCbOnRh 絵文字の話題鹿無いのか
2020/07/21(火) 11:57:01.74ID:SHIoqAPz
もうそろそろ音文字もできてほしいよね
2020/07/21(火) 19:48:37.21ID:yq9jKXcW
昔懐かしMIDI復活
2020/07/22(水) 01:25:29.84ID:u6QrHnkl
いつかはアニメ文字も作られるのかな?
2020/07/22(水) 03:14:08.06ID:WLvtiBEO
>>57
iモードにあったような無かったような
iモードにあったような無かったような
2020/07/22(水) 03:39:38.34ID:IIwMuy9z
<MARQUEE><BLINK>動きがあるのは気が散るからやめてほしいな</BLINK></MARQUEE>
2020/07/22(水) 07:25:55.44ID:IySnQNum
懐かしのって
初音ミクとかMIDIで出来てるだろ
初音ミクとかMIDIで出来てるだろ
2020/07/22(水) 11:49:19.63ID:J4Vacr3k
>>59
<ITALIC><BIG>旧タグなら書き込めるんだw</BIG></ITALIC>
<ITALIC><BIG>旧タグなら書き込めるんだw</BIG></ITALIC>
2020/07/24(金) 03:27:13.24ID:6ZonvnML
音文字か。そう言えば Ctrl+G (7) は BELL だったような。
ASCIIだけか? Unicode だと決まってないんだっけ?
ASCIIだけか? Unicode だと決まってないんだっけ?
2020/07/24(金) 03:43:48.92ID:5ghYNMX+
マザボのブザーでも鳴るの?
2020/07/24(金) 05:05:05.45ID:6ZonvnML
さあ? 処理するプログラムに寄るんだろうな。
Windows のコマンドプロンプトで 7 のコード出力してみたら音が出たよ。
Windows のコマンドプロンプトで 7 のコード出力してみたら音が出たよ。
2020/07/24(金) 05:05:33.57ID:6ZonvnML
BIOSのビープ音ではなく Windows 側のサウンドの設定が関係しているんだろうと思う。
2020/07/24(金) 10:07:32.92ID:gSKUw3+G
UnicodeでもU+0007はBELL CHARACTER
67デフォルトの名無しさん
2020/07/24(金) 10:53:36.75ID:qMgm686n printf("\x7\n");
2020/07/24(金) 11:02:13.19ID:kTZ1cNqr
マザボのビープスピーカではなくサウンドデバイスで鳴らすようになったのはwin7以降だっけ
2020/07/24(金) 11:14:24.17ID:f4UMJCtp
2000ジャマイカ
2020/07/24(金) 17:43:05.10ID:YBlLKE+B
2000の時代に練習した時はprintfでビープ鳴ってた
2020/07/24(金) 18:43:29.22ID:sQG3RcOn
>>68
普通に考えりゃvista以降からでしょう
7かvistaかで本体beep鳴らすapi叩いたらpcmでがっかりだったのは覚えてる
apiだとATのbios同様周波数や長さ指定できて遊べたんだがな
同時にいじられるとよくないから切られたんでしょう
普通に考えりゃvista以降からでしょう
7かvistaかで本体beep鳴らすapi叩いたらpcmでがっかりだったのは覚えてる
apiだとATのbios同様周波数や長さ指定できて遊べたんだがな
同時にいじられるとよくないから切られたんでしょう
2020/07/24(金) 19:01:43.86ID:vNSj5xVg
なついなぁ。
Win32API Beep()
https://docs.microsoft.com/en-us/windows/win32/api/utilapiset/nf-utilapiset-beep
Win32API Beep()
https://docs.microsoft.com/en-us/windows/win32/api/utilapiset/nf-utilapiset-beep
2020/07/24(金) 19:18:02.12ID:yBBtjj2V
beep用スピーカーがマザーボードから省略され始めたんだよ。
2020/07/24(金) 19:22:19.50ID:7vmGBdx3
昔は音を鳴らせるアプリは一つだけだった。
いつからか複数のアプリが同時に鳴らせるようになったんだが
いつからだっけな
いつからか複数のアプリが同時に鳴らせるようになったんだが
いつからだっけな
2020/07/25(土) 00:55:48.04ID:W2vK2AQR
うろ覚えだが、ビープスピーカーで力業で音楽演奏するソフトがあったような気がする
2020/07/30(木) 04:08:23.78ID:y8VtuE5G
77デフォルトの名無しさん
2020/07/30(木) 16:30:24.90ID:EPvquY9v tab は \t
だから
bell は \b
と思ってた時期がある
だから
bell は \b
と思ってた時期がある
78デフォルトの名無しさん
2020/07/30(木) 16:41:49.22ID:TNnZNpws 合わせると
食べる
食べる
2020/07/31(金) 22:29:23.92ID:j/9/9lyu
>>77
\bの本当の意味ってなんだっけ。
\bの本当の意味ってなんだっけ。
2020/07/31(金) 22:33:31.30ID:LZrfPAZb
バックスペース
2020/07/31(金) 22:42:27.48ID:LZrfPAZb
しかしこういうのってティッカーテープとかテレタイプの時代にさかのぼるらしいね。
現物を見たことはないが用語だけはいろいろ残っているという。
現物を見たことはないが用語だけはいろいろ残っているという。
2020/08/01(土) 01:00:50.03ID:WNKlelSF
遠隔で物理CR/LFは夢がある
2020/08/01(土) 18:43:21.40ID:6JQgXAfu
一番夢があるのは肯定応答とかかな。
というのも,改行やエスケープとかはもちろん,場合によっては警鈴なんかも
未だに現役なのに対して,「肯定応答」という意味で^Fが使われているのを見たことがないから。
^Fはもう,各ベンダーごとに都合の良い,全く違う制御シーケンスになっちゃってる。
というのも,改行やエスケープとかはもちろん,場合によっては警鈴なんかも
未だに現役なのに対して,「肯定応答」という意味で^Fが使われているのを見たことがないから。
^Fはもう,各ベンダーごとに都合の良い,全く違う制御シーケンスになっちゃってる。
2020/08/01(土) 19:03:29.73ID:hFu7PbvL
NAK
2020/08/26(水) 16:48:18.06ID:P4l77+uM
毎日新聞ニュースさんはTwitterを使っています 「天皇陛下即位のお祝い品のリストと写真を㏋で公開 宮内庁」 / Twitter
https://
twi
tter.com/
mainichijpnews/status/1297833742753439744
HPが合字の㏋ (U+33CB)に
https://
twi
tter.com/
mainichijpnews/status/1297833742753439744
HPが合字の㏋ (U+33CB)に
2020/08/26(水) 17:29:56.14ID:tn5jjKWE
正規化のせいやな。
知らんけど。
知らんけど。
2020/08/27(木) 00:37:34.21ID:Jx+0/WN9
いまだに手書き、あるいは印刷した紙で原稿を入れてくる記者がいて、
入稿をOCRで文字起こししたらHPをその合字の方に認識、そのまま放置、とか?
ちなみにこれってHorse Powerでよかったですか?
入稿をOCRで文字起こししたらHPをその合字の方に認識、そのまま放置、とか?
ちなみにこれってHorse Powerでよかったですか?
2020/08/27(木) 11:49:50.52ID:igmT7d/I
馬力
2020/09/02(水) 16:48:23.22ID:wDhsuzOT
そう言えば中国のGB 18030が改訂されるって話はどうなったんだろう?
何年か前にKenが最終原案を見たよって言ってた気がしたけど、続報がない。
何年か前にKenが最終原案を見たよって言ってた気がしたけど、続報がない。
2020/09/02(水) 23:24:39.67ID:jWdQ7Iud
その後Kenの姿を見た者はいないという
2020/09/03(木) 15:58:49.10ID:ACS7FND0
13対応の花園もマダー?
2020/09/20(日) 08:14:38.84ID:BIMERbR5
Emoji 13.1 - Now final, to be widely available in 2021
http://blog.unicode.org/2020/09/emoji-131-now-final-to-be-widely.html
http://blog.unicode.org/2020/09/emoji-131-now-final-to-be-widely.html
2020/09/20(日) 18:04:46.19ID:j6+bQw5M
Androidの絵文字追加がOSバージョンアップ前提だから取り残される環境が多すぎるんだよな
どうにかアプリ枠で配信してくれたらいいのに
どうにかアプリ枠で配信してくれたらいいのに
94デフォルトの名無しさん
2020/09/20(日) 18:46:29.19ID:RjVJO5D2 woman with beard
誰得?
誰得?
95デフォルトの名無しさん
2020/09/20(日) 18:47:31.92ID:RjVJO5D2 https://www.unicode.org/announcements/emoji-13-1-annc-couples.jpg
最初から顔に色なんか付けなきゃ良かったのに
最初から顔に色なんか付けなきゃ良かったのに
2020/09/20(日) 20:32:09.64ID:69fdZo9j
だっぷるがつけちゃったんだもん
97デフォルトの名無しさん
2020/09/21(月) 00:08:08.68ID:fGf6DMu1 顔に色が無いと全部白人に観えるんだろ
黒い顔だけ造っておけばよかった
黒い顔だけ造っておけばよかった
2020/09/21(月) 09:05:25.63ID:apXLM6YN
そもそも文字コードになんで色情報なんか含めたんだろ
あれも発端はPCがらみだっけ?
あれも発端はPCがらみだっけ?
2020/09/21(月) 10:33:58.83ID:13UcesYH
俺は良かったと思うけどな。おかげで文章としての表現力が上がった。
100デフォルトの名無しさん
2020/09/21(月) 10:35:23.80ID:13UcesYH 一夫多妻を表す絵文字はつくらないのかね?
101デフォルトの名無しさん
2020/09/21(月) 10:44:58.40ID:M8W5JifW 姦
嬲
嫐
嬲
嫐
102デフォルトの名無しさん
2020/09/21(月) 17:50:51.21ID:ttv6HIBF >>95
そっか、これコードを結合していくと作れるんだ。面白い。
男+白肌+ハート+男+黒肌 みたいな。
仕組みは面白いが、処理する側は大変そうw
あとキーボードの絵文字パレットとか、全パターン表示しないといけないのかな?
そっか、これコードを結合していくと作れるんだ。面白い。
男+白肌+ハート+男+黒肌 みたいな。
仕組みは面白いが、処理する側は大変そうw
あとキーボードの絵文字パレットとか、全パターン表示しないといけないのかな?
103デフォルトの名無しさん
2020/09/21(月) 18:17:56.53ID:fI5zzMAW > 仕組みは面白いが、処理する側は大変そうw
うん。だから個々の人が処理するんじゃなくて
OS標準のテキスト処理として実装されたから素晴らしいんだよ
普通に文字を出力すれば、絵文字対応になるから
うん。だから個々の人が処理するんじゃなくて
OS標準のテキスト処理として実装されたから素晴らしいんだよ
普通に文字を出力すれば、絵文字対応になるから
104デフォルトの名無しさん
2020/09/21(月) 18:45:37.15ID:ttv6HIBF >>103
OSレベルでテキストのレンダリングとかめんどくさくなったはいうまでもなく、
一般のデベロッパもユニコード文字列をうかつに処理できなくなった罠。
ま、 ちゃんとAPIを使えとか、そういうことで、それはいいことなのかもしれないけど。
OSレベルでテキストのレンダリングとかめんどくさくなったはいうまでもなく、
一般のデベロッパもユニコード文字列をうかつに処理できなくなった罠。
ま、 ちゃんとAPIを使えとか、そういうことで、それはいいことなのかもしれないけど。
105デフォルトの名無しさん
2020/09/21(月) 19:08:16.33ID:sDzSgcbr ユニコードはウィルスなので送らないでください
106デフォルトの名無しさん
2020/09/21(月) 19:45:05.95ID:LKcGYABn >>104
それは絵文字以前の話だけどね。
Unicodeの当初の目標でも16bit固定=C言語の終端文字である\0が1文字の中に
含まれる事があるので、文字はUnicodeとして扱わなければいけないことが決定していた。
Unix/Linux系ではC言語の終端文字である\0を避けるためにUTF-8を採用したが
可変長バイトだから、これもUnicodeとして扱わなければいけない。
どちらにしろちゃんとAPIを使えという話は避けられなかったんだよ。
そして絵文字のおかげでサロゲートペアが必要となる文字への対応が進むといういい結果をもたらしたw
それは絵文字以前の話だけどね。
Unicodeの当初の目標でも16bit固定=C言語の終端文字である\0が1文字の中に
含まれる事があるので、文字はUnicodeとして扱わなければいけないことが決定していた。
Unix/Linux系ではC言語の終端文字である\0を避けるためにUTF-8を採用したが
可変長バイトだから、これもUnicodeとして扱わなければいけない。
どちらにしろちゃんとAPIを使えという話は避けられなかったんだよ。
そして絵文字のおかげでサロゲートペアが必要となる文字への対応が進むといういい結果をもたらしたw
107デフォルトの名無しさん
2020/09/21(月) 21:02:01.32ID:XIYZJxnC 想定しないといけない1文字の長さを具体的有限にしてくれないかなあ
108デフォルトの名無しさん
2020/09/21(月) 21:15:43.93ID:GxzcHgtD アキラメロン
最終的には複数の文字を組み合わせて64 x 64 ドットに
自由なアイコンを作れるようになるだろう
最終的には複数の文字を組み合わせて64 x 64 ドットに
自由なアイコンを作れるようになるだろう
109デフォルトの名無しさん
2020/09/21(月) 23:04:34.98ID:dVFtF0fU 今時ピクセルは無いだろ。
SVG埋め込みの方が可能性がある。
SVG埋め込みの方が可能性がある。
110デフォルトの名無しさん
2020/09/22(火) 03:30:53.25ID:EwzeVKsQ >Unix/Linux系ではC言語の終端文字である\0を避けるためにUTF-8を採用したが
これは違うんじゃまいか
結果的にそうなっただけであって
意図してそうした訳じゃない
これは違うんじゃまいか
結果的にそうなっただけであって
意図してそうした訳じゃない
111デフォルトの名無しさん
2020/09/22(火) 03:34:39.51ID:Ab752W48112デフォルトの名無しさん
2020/09/22(火) 05:08:49.52ID:w/6Y1Cd5 UTF8の方がUTF16より歴史が古いよ。
ユニコードが国際規格になる前からある。
ユニコードが国際規格になる前からある。
113デフォルトの名無しさん
2020/09/22(火) 11:24:31.43ID:X1mK+PSm114デフォルトの名無しさん
2020/09/22(火) 11:58:02.00ID:UY6+hZuP >>112
> UTF8の方がUTF16より歴史が古いよ。
> ユニコードが国際規格になる前からある。
いちいちすぐバレる適当なウソつくんじゃねーよ
https://ja.wikipedia.org/wiki/Unicode#%E6%AD%B4%E5%8F%B2
1991年10月 Unicode 1.0.0 7,161文字 初期バージョン、16ビットの文字コード
1992年6月 Unicode 1.0.1 28,359文字 CJK統合漢字を導入
https://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
> UTF-8 was designed, in front of my eyes, on a
> placemat in a New Jersey diner one night in September or so 1992.
UTF-8は1992年9月に私の目の前で設計された
> We had used the original UTF from ISO 10646
> to make Plan 9 support 16-bit characters, but we hated it.
Plan 9で16ビット文字をサポートするためにISO 10646の
オリジナルのUTFを使用していた が私たちはそれを嫌っていました。
> However, UCS and its UTF variant do not protect
> null bytes and/or the ASCII slash ("/") making these character encodings
> incompatible with existing Unix implementations.
しかしUCSとその亜種であるUTFはヌル文字とスラッシュを保護せず
存在するUnixの実装と互換性がありません。
> UTF8の方がUTF16より歴史が古いよ。
> ユニコードが国際規格になる前からある。
いちいちすぐバレる適当なウソつくんじゃねーよ
https://ja.wikipedia.org/wiki/Unicode#%E6%AD%B4%E5%8F%B2
1991年10月 Unicode 1.0.0 7,161文字 初期バージョン、16ビットの文字コード
1992年6月 Unicode 1.0.1 28,359文字 CJK統合漢字を導入
https://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
> UTF-8 was designed, in front of my eyes, on a
> placemat in a New Jersey diner one night in September or so 1992.
UTF-8は1992年9月に私の目の前で設計された
> We had used the original UTF from ISO 10646
> to make Plan 9 support 16-bit characters, but we hated it.
Plan 9で16ビット文字をサポートするためにISO 10646の
オリジナルのUTFを使用していた が私たちはそれを嫌っていました。
> However, UCS and its UTF variant do not protect
> null bytes and/or the ASCII slash ("/") making these character encodings
> incompatible with existing Unix implementations.
しかしUCSとその亜種であるUTFはヌル文字とスラッシュを保護せず
存在するUnixの実装と互換性がありません。
115デフォルトの名無しさん
2020/09/22(火) 12:07:37.87ID:EwzeVKsQ それは単にカラーで表示していただけで色情報を持っていたわけじゃないだろ。
発端はやっぱり肌色の問題だったらしい。
https://internet.watch.impress.co.jp/docs/special/670150.html
発端はやっぱり肌色の問題だったらしい。
https://internet.watch.impress.co.jp/docs/special/670150.html
116デフォルトの名無しさん
2020/09/22(火) 14:22:08.65ID:iCejn/78 ナメック星人用に緑の肌もあるの?
117デフォルトの名無しさん
2020/09/22(火) 15:07:13.30ID:pk1eyzkq >>114
わかっていないのはお前
UCS-2≠UTF-16
1991年のUnicode 1.0.0の時点ではUnicodeの符号化文字は2バイトのみだったから2バイト固定長符号化
文字集合や符号化方式のUCS-2は当然存在していたが、サロゲートペアを使って1文字を2バイトまたは
4バイトで表現する符号化方式のUTF-16はこの時点では存在していない(存在できない)
Unicode 1.1.0より前にFSS-UTFという名称でファイルシステム安全な符号化方式として現在のUTF-8が
Plan9向けに策定され1993年のUnicode 1.1.0で導入
ttps://www.unicode.org/versions/Unicode1.1.0/appF.pdf
1996年のUnicode 2.0.0でサロゲートペアが導入されたのでサロゲートペアを利用する符号化方式の
UTF-16が概念として登場(まだ概念のみでUTF-16という名称はついていないはず)
ttp://unicode.org/versions/Unicode2.0.0/
FSS-UTFがUTF-2を経てUTF-8という名称になったのは同じくUnicode 2.0.0
ttp://www.unicode.org/versions/Unicode2.0.0/appA.pdf
ISO/IEC 10646としてはUTF-16もUTF-8も1996/10/15発行のAMD 1とAMD 2で策定
わかっていないのはお前
UCS-2≠UTF-16
1991年のUnicode 1.0.0の時点ではUnicodeの符号化文字は2バイトのみだったから2バイト固定長符号化
文字集合や符号化方式のUCS-2は当然存在していたが、サロゲートペアを使って1文字を2バイトまたは
4バイトで表現する符号化方式のUTF-16はこの時点では存在していない(存在できない)
Unicode 1.1.0より前にFSS-UTFという名称でファイルシステム安全な符号化方式として現在のUTF-8が
Plan9向けに策定され1993年のUnicode 1.1.0で導入
ttps://www.unicode.org/versions/Unicode1.1.0/appF.pdf
1996年のUnicode 2.0.0でサロゲートペアが導入されたのでサロゲートペアを利用する符号化方式の
UTF-16が概念として登場(まだ概念のみでUTF-16という名称はついていないはず)
ttp://unicode.org/versions/Unicode2.0.0/
FSS-UTFがUTF-2を経てUTF-8という名称になったのは同じくUnicode 2.0.0
ttp://www.unicode.org/versions/Unicode2.0.0/appA.pdf
ISO/IEC 10646としてはUTF-16もUTF-8も1996/10/15発行のAMD 1とAMD 2で策定
118デフォルトの名無しさん
2020/09/22(火) 15:35:18.08ID:6o8of7S0119デフォルトの名無しさん
2020/09/22(火) 15:37:16.35ID:6o8of7S0 > UTF8の方がUTF16より歴史が古いよ。
> ユニコードが国際規格になる前からある。
ユニコードってなにか知ってますか?
Unicode 1.0もユニコードなんですがw
> ユニコードが国際規格になる前からある。
ユニコードってなにか知ってますか?
Unicode 1.0もユニコードなんですがw
120デフォルトの名無しさん
2020/09/22(火) 15:37:46.01ID:6o8of7S0 さてユニコードが国際規格になる前とはいつのことでしょうかねw
121デフォルトの名無しさん
2020/09/22(火) 16:12:08.88ID:uF0JvJPV TkライブラリがいまだにUCS-2のままなのはなぜなんだぜ?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【子ども・子育て支援金】来年4月から徴収、月収50万円なら月600円程度…健保連試算 [蚤の市★]
- 【芸能】田中みな実 年始に実家に泊まらない理由明かす 「終わった感じがしちゃう。早く港区に戻らなきゃみたいな」 [冬月記者★]
- 高市首相告白「『なめられない服』を選ぶことに数時間を費やしました」「外交交渉でマウント取れる服、買わなくてはいかんかもなぁ」★4 [ぐれ★]
- なぜ立花孝志氏の言葉は信じられたのか…"異例の逮捕"が浮き彫りにした「SNSの危険な病理」 ★2 [ぐれ★]
- 【(・(ェ)・)】駆除数17倍、クマ1頭の焼却に灯油100㍑で今季7000㍑以上使用した施設も…処理に追われる自治体 [ぐれ★]
- 「加熱式たばこ」の受動喫煙、「紙巻き」同様の対策強化を検討へ…厚労省の専門委が議論スタート [蚤の市★]
- 【速報】高市早苗、G20サミット”社長出勤” [614650719]
- 【悲報】高校ラグビー、マジで終わる… 強豪校ですら部員集まらず廃部へ この国の若者ってほんとトライしなくなったよな [452836546]
- どうしておっとり系は「レズ感」が強いのか?
- 【📛専】とうふさんすこすこ😊👎スレッド【とうふゲームズ🏡】
- 【速報】高市、今度はロシアに喧嘩を売る [329271814]
- 竹中平蔵氏、万博を批判していた人たちにチクリ「反省の弁聞きたい」 [686538148]
