文字コード総合スレ part13

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2020/07/03(金) 20:53:47.08ID:elbfDzqw
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
14デフォルトの名無しさん
垢版 |
2020/07/05(日) 12:39:54.58ID:NbYPgepr
>>2 の結論は間違いだけど
>「コマンドプロンプトはcp932(SJIS)である」はウソ

ここだけは合ってる
2020/07/05(日) 21:04:42.33ID:M+BkbwUs
>>14

> >>2 の結論は間違いだけど

間違ってる「結論」とはどの部分?
2020/07/05(日) 21:05:40.27ID:M+BkbwUs
>>2の結論は一行目。つまりお前が合ってると言った部分だろう?

>「コマンドプロンプトはcp932(SJIS)である」はウソ
2020/07/05(日) 21:10:40.03ID:M+BkbwUs
>>13

> /A 内部コマンドの出力結果を ANSI でパイプまたはファイルに出力します。

では画面へは何コードで出力しているでしょうか?

答えはUincode。なぜならUnicode文字が文字化けせずに出力できているから
18デフォルトの名無しさん
垢版 |
2020/07/06(月) 01:17:06.10ID:lyDtf+5h
ウイーンがしゃ
19デフォルトの名無しさん
垢版 |
2020/07/06(月) 10:52:37.14ID:vjiPzzt6
普通に読んだら結論はこっち

>これは明らかにコマンドプロンプトがUnicodeで動作している証拠です。

圧倒的に国語力が無いか
論理思考が出来ない人なんだろう
2020/07/06(月) 15:20:25.67ID:9+hHOd2F
>>19
証拠があって、結論が出るんだろ?

大丈夫か?国語力の問題か?
2020/07/06(月) 15:21:22.15ID:9+hHOd2F
最初に結論を書くっていう有名な国語的テクニックを知らないのかな?
22デフォルトの名無しさん
垢版 |
2020/07/09(木) 06:07:26.69ID:uQo6bqoB
「絵文字 知られざる舞台裏」
私たちがスマホなどで日常的に使っている絵文字。
この絵文字は、“世界共通言語”として管理されており、絵文字の新規採用をめぐり、様々な団体がロビー活動を行っている。

“共通言語”として世界的に規格が統一されている絵文字。
アメリカの大手IT企業などからなる団体が、新たな絵文字の採用を決定しており、認定を求めて様々な団体がロビー活動を行っている。
番組では、白ワインの絵文字採用を求める醸造家などのロビー活動を取材。
絵文字は、どのようなプロセスで決定されてゆくのか、その知られざる世界を描く。
原題:Backlight: Beyond Emoji (オランダ 2019年)
https://www.nhk.jp/p/wdoc/ts/88Z7X45XZY/episode/te/2QGK3QN6JJ/
2020/07/09(木) 08:50:19.27ID:TKLTGhB7
>>22
>“世界共通言語”
>アメリカの大手IT企業などからなる団体

NHK的な物言い、いいねw
でも、「言語」 って?

これ、カリフォルニアのワイナリーの話かな?
そこのMLに登録するとサブジェクトに絵文字の入ったメールを送ってくるとかなんとかw
2020/07/09(木) 08:55:49.71ID:ah/SMoHN
ドレスデン・コデックス
マドリー・コデックス
パリ・コデックス
グロリア・コデックス
25デフォルトの名無しさん
垢版 |
2020/07/09(木) 09:04:12.23ID:vrNDocOm
本編観たけどつまらなさ過ぎて途中で寝てしまった
IBM Apple Microsoft Google Facebook あたりの名前はちゃんと言ってたと思う
26デフォルトの名無しさん
垢版 |
2020/07/09(木) 09:07:15.41ID:vrNDocOm
一部思い出した
NHKらしくほとんど黒人とLGBTの話ばかりだったんだが

私の造ったEmojiが登録されたって自慢気に中国人研究者っぽいおばさんが出て来て
チベットの旗は候補に出たけど登録は見送られた
チベットの旗が登録されることは今後も無いでしょう
って笑いながらインタビューに答えてた
2020/07/10(金) 17:30:08.40ID:4InogVIm
チベットの旗は日本の旭日旗がデザインのベース。
2020/07/11(土) 17:41:39.15ID:fgTDqbZy
いろんなところでポリコレの話が出てきて嫌になる
2020/07/11(土) 20:07:36.65ID:LiyD05XT
Unicodeはもうだいぶ前からそういう世界です
30デフォルトの名無しさん
垢版 |
2020/07/12(日) 10:45:57.27ID:NK7E+AG5
赤の▼が投稿禁止用語だとは知らなかったわ
31デフォルトの名無しさん
垢版 |
2020/07/12(日) 10:47:50.51ID:NK7E+AG5
https://ja.wikipedia.org/wiki/%E3%83%8A%E3%83%81%E5%BC%B7%E5%88%B6%E5%8F%8E%E5%AE%B9%E6%89%80%E3%81%AE%E3%83%90%E3%83%83%E3%82%B8
2020/07/12(日) 14:49:14.50ID:6LAoyHzZ
↑「ナチ強制収容所のバッジ」というページ。他に人が見なくていいように。
33デフォルトの名無しさん
垢版 |
2020/07/17(金) 17:49:02.99ID:zYg36R0O
世界絵文字Dayらしいぞ
知らんけど
2020/07/17(金) 18:21:35.43ID:p55TjBUs
そのうち絵文字が第2エスペラントになりそうな勢いだな
2020/07/17(金) 20:11:36.87ID:zXFMI6BU
言ってもThis is a pen.も表現できないぞ
2020/07/18(土) 00:37:29.47ID:wH8oKg8v
P(P.A.P)
2020/07/18(土) 00:47:07.96ID:/iWSRGfH
👇🖊
余裕だぜ
2020/07/18(土) 03:09:52.25ID:LPIx8Uu7
below pen
2020/07/18(土) 10:40:45.89ID:zDePOjuW
アイちゃんと会話できる絵文字ってそろってるのかな
40デフォルトの名無しさん
垢版 |
2020/07/18(土) 13:20:10.73ID:uRU3MGLx
架空発注繰り返してもらえるくらい強力なコネが欲しい
2020/07/18(土) 14:31:48.16ID:usxmbyTV
Part12先に使え
https://mevius.5ch.net/test/read.cgi/tech/1545032904/l50
42デフォルトの名無しさん
垢版 |
2020/08/10(月) 17:37:29.36ID:wInlBSoO
禁止文字なんか?
溢鎰螠塧縊謚搤
2020/08/10(月) 18:36:25.82ID:bk6is28U
>>42
(@u@ .:;)ノシ
44デフォルトの名無しさん
垢版 |
2020/08/11(火) 12:23:17.24ID:2c8mpoZg
うざったてーも30歳か
45デフォルトの名無しさん
垢版 |
2021/05/13(木) 16:58:46.99ID:0opMfQ+n
てすてすとと
2021/05/13(木) 17:13:23.87ID:bi8pzl4S
瓜皮帽を被った男
👲👲🏻👲🏼👲🏽👲🏾👲🏿👲
47デフォルトの名無しさん
垢版 |
2021/05/13(木) 21:29:00.08ID:39tz2cvT
ID:0pD51twu
イキってるねえ〜
2021/05/14(金) 08:07:05.15ID:ERw3EzI8
>>31
日本語がURLでエンコードされると長いよなあ
日本語1文字がアスキー9文字って... 誰だよこんなの考えたの
あともう一つなんだけ、ぷよぷよみたいな名前の
2021/05/14(金) 08:10:51.08ID:+o3KrcS5
>>48
punyCode
2021/05/14(金) 20:48:59.82ID:G+x0luD+
ここがよみがえったのか
2021/05/14(金) 22:48:47.46ID:XJlzr4U7
次スレはここでいいのかな?

>>48
文字コードが決まってない(なかった)んだから仕方ないじゃない
2021/05/15(土) 03:51:54.74ID:t/FYGves
決まってないならパーセントを使えばいいじゃない
2021/05/15(土) 11:08:47.44ID:zmWSHBKO
もともと ascii のみ。ascii の中でも一部使えない文字があるので、それは %エンコードする。
だったのが国際化にはUTF-8を使えに拡張された。
文字コードが決まってなかったわけではない。
あとURLにSJISとかUTF-16送ってくるやつは滅びろ。今すぐ滅びろ。
54デフォルトの名無しさん
垢版 |
2021/05/15(土) 12:50:09.97ID:eYtIld1h
URLにBOM導入してればよかったのにな
2021/05/15(土) 12:52:59.23ID:zmWSHBKO
>>54
滅びろ
2021/05/15(土) 16:27:48.48ID:JZCPEXPS
>>55
WWW
2021/05/24(月) 19:37:25.20ID:RWCB+vU8
文字コードの勉強中です
Windowsで使われている文字コードはCP932(Shift-JISの拡張版)ということまで分かりました。 IMEパッドで理解を深めようとしているのですが、分からないことがあるのでご教示お願いします。
・IMEパッドの「シフトJIS」はCP932のことを指していると思っていいですか?
・IMEパッドの「JIS X 0208」はCP932の文字集合だと思っていいですか?
・だとすると「JIS X 0208」と「シフトJIS」は一対一で対応すると思いますが、「シフトJIS」にあって「JIS X 0208」に無い文字(@やTなど)があるのはなぜですか?

過疎っているようですがご回答いただけると幸いです
2021/05/24(月) 22:17:38.35ID:VrK5qnvr
勉強してるなら、理由も考えてみなよ
他人に丸投げするのは勉強とはいわない
2021/05/24(月) 22:53:01.93ID:ZP3SRefF
>>58
お前も他人さまから教えてもろたくせにw
2021/05/25(火) 00:01:45.40ID:qVwcwRoW
仮定に対して反例が確認できたんだから仮定が誤ってたということだよ
2021/05/25(火) 08:37:04.98ID:6TyV4LYI
>>57
すごく大まかな説明をすると、
Windowsで使われているShiftJISの文字コードはMicroSoft版方言に侵されてて純正のShiftJISではない
「CP932」という言い方では純正ShiftJISなのかそれともMicroSoft版・Mac版・IBM版その他の方言なのか分からない
(まあ一般にはCP932という言い方をするとMS版のことを指す
明示的にMS版のCP932だということを示す際には、MS932とかWindows31Jとかいう呼び方をする)

なので
1つ目は、その「CP932」が指すものによる、純正ShiftJISを想定しているなら厳密には違う
2つ目は・・・・これもごくごく大まかに言ってしまうと「JIS X 0208」はシフトさせてないおおもとのJIS漢字コードのこと
(なのでShiftJISとはコード体系が違う。計算でシフトさせることで簡単にJIS⇔ShiftJISが導出できるけど)
3つ目のは、違ってる箇所の具体例がまさに丸数字とかの特殊文字に該当してる

というかこれは歴史的経緯によるものだからなあ、後世からみたら理不尽の塊でしかないだろう
理由を考えてみろと言われて分かるわけがないよ
2021/05/25(火) 09:29:36.84ID:lUfYCE+Z
文字集合のはなしと、符号化方式のはなしと、符号化文字集合のはなしと、文字コードのはなしを混同している人が多いな。
2021/05/25(火) 11:48:06.96ID:rDgveWWs
JIS X 0208/JIS X 0213の表はJISが決めたやつ
シフト JISの表はMicrosoftが決めたやつ
この二つは歴史的経緯で色々違いがあります
くらいの理解でいいんじゃないか
2021/05/25(火) 14:38:56.72ID:ZdUybFI8
そういえば、昔の*nixで日本語環境整えるのに、
このあたりが理解できないとまともな日本語表示すら出来なかったような
65デフォルトの名無しさん
垢版 |
2021/05/27(木) 14:53:45.70ID:U0nLnJgd
>>57
>「JIS X 0208」と「シフトJIS」は一対一で対応する

違う
2021/05/27(木) 22:18:14.67ID:ApJEbFpd
違わない
2021/05/28(金) 02:11:41.16ID:whTgKivm
違う
違わない
2021/06/01(火) 14:48:43.50ID:SuGQKf4C
行きつけのオシャレ美容院からのLINEの文末にいつも必ず絵文字の“うんち”が付いてて謎だったが、原因が判明したかもしれない「大事故じゃん…」 - Togetter
https://togetter.com/li/1721407

十年くらい前に同じ内容聞いた気がするけどまだ直ってないのかこれ
2021/06/01(火) 17:01:55.60ID:SY/ATIGy
どうなおしゃいいの
2021/06/01(火) 19:28:50.99ID:F3dBNOsH
いまだにどこかの段階でShiftJISでエンコードしてるの?

ってここ(5ch)も人のこと言えんけどw
2021/06/01(火) 20:53:16.19ID:4DGKxEbP
昔の〓〓〓のように外に出す絵文字〓全部〓に変換するのはどう〓〓
2021/06/02(水) 10:55:13.97ID:qtmfAhQ7
どうみても禿銀行が悪いのに
docomoの皆さん気を付けてくださいって
可笑しくないか?

どうみても武漢ウィルスなのに
世界中が迷惑受けてるのと同じ構図
73デフォルトの名無しさん
垢版 |
2021/06/02(水) 11:18:23.22ID:BmjFsUtA
アポーが悪いんじゃないのか
74デフォルトの名無しさん
垢版 |
2021/06/03(木) 10:44:27.32ID:9KAhsr64
💩
ほんとだ
75デフォルトの名無しさん
垢版 |
2021/06/05(土) 16:48:33.23ID:z5K2FV3a
キャリアメールならそれぞれの絵文字に変換出来るだろうけど
2021/06/05(土) 20:14:55.50ID:cYmj+3h7
はい
77デフォルトの名無しさん
垢版 |
2021/06/07(月) 02:14:41.67ID:aeSTySQn
はいじゃないが
2021/06/07(月) 19:10:55.29ID:u+Odt9Qf
..!
2021/06/09(水) 22:58:16.69ID:ke1p9j/w
UTN #43: Unihan Database Property “kStrange”
http://www.unicode.org/notes/tn43/

Ken先生の新作
2021/06/09(水) 23:56:37.41ID:LXY7VL2u
自由研究?
2021/06/10(木) 00:02:47.99ID:0lTREXCp
これは何の役に立ちますか
2021/06/11(金) 07:01:28.32ID:O0gX2lti
なんで小林?
83デフォルトの名無しさん
垢版 |
2021/06/24(木) 22:48:23.94ID:6wlB1k9u
文字コードにうんこの絵文字とか入れた奴らはタヒんで詫びて
2021/06/25(金) 03:57:48.28ID:2bfr31Ii
うんこは大事だぞ?
人にもよるが多くの人が毎日これと付きあうことになる
うんこを出したことない人間はいないのだ
うんこは君の健康状態を教えてくれる大切な友達だ
そしてもし君がうんこを出すことを拒否したら、君は死ぬことになる
85デフォルトの名無しさん
垢版 |
2021/06/25(金) 10:15:49.88ID:Wd+wOk9Z
うんこが分解されて植物や動物の栄養になって
また君らの口に入ってることを忘れてはならない
86デフォルトの名無しさん
垢版 |
2021/06/26(土) 14:07:44.37ID:RjjpcdnV
分解というのは要するに菌などの微生物がその生物にとっての栄養を吸収し不要になったものを
捨てるというのが繰り返された結果であり、要するに菌のウンコである。この菌のウンコが人間に
とって問題ない場合、それは腐敗とは呼ばれず発酵と呼ばれる。納豆やヨーグルト、またアルコール
などがそれである。人間は直接摂取できないが植物にとっては栄養となる場合は肥料として使われる。
87デフォルトの名無しさん
垢版 |
2021/06/26(土) 15:25:02.96ID:15vAhO8I
https://ja.wikipedia.org/wiki/%E4%BA%BA%E5%B7%A5%E8%82%9B%E9%96%80

コロストミーの場合、排泄方法は自然排便法と洗腸法がある。
自然排便法とは排泄口から自然に排泄される便をパウチで受けて処理する方法であり、
洗腸法とは一定量の微温水をストーマから注入し、強制的に排便を促進させる方法である。

自然排便法は、便意に従った排泄方法であり一般的に負担が少ないことが特長である。
パウチについては、不時の排泄に備えた常時装着が必要なためその使用量が増加し、
粘着剤によりストーマ周辺の皮膚にかぶれやただれを招き易い。
2021/06/26(土) 16:42:38.06ID:y4YsT4qE
クソスレになった
2021/06/26(土) 17:04:46.78ID:KFUgiKj4
マジ糞
2021/06/26(土) 17:12:11.91ID:+MI3rh96
イスラム教指導者、笑顔の絵文字に使用制限の宗教令 バングラデシュ:AFPBB News
https://www.afpbb.com/articles/-/3353309
2021年6月24日 19:03
91デフォルトの名無しさん
垢版 |
2021/06/26(土) 17:46:46.66ID:KFUgiKj4
>>90
ハハッ ってどれだ
2021/07/01(木) 01:41:01.03ID:Rr2ioLtp
8bitバイトなんて使ってるの人間くらいのもんだよな
地球生物は全て6bit(64値)でエンコードしてるわけだし、スタンダードに倣うべき
古き良きPDP、DEC SIXBIT
2021/07/01(木) 01:58:44.82ID:374nFu/f
もしDNAストレージが実用化&普及したらな
数十年と数億年の資産相互運用性を秤にかけるかもしれない
2021/07/02(金) 13:14:16.94ID:fx2NJKSC
SFはほっといて、生化学なら遺伝子記法のAmbiScriptのフォントをユニコに入れて欲しい
とても可読性が高いけど、今のところ専用フォント入れなきゃならんのでつらい
https://en.m.wikipedia.org/wiki/Nucleic_acid_notation
2021/07/02(金) 15:48:52.32ID:W+ea7FJa
>>92
64値ってコドンのこと? ヌクレオチドが基本単位だと思えば4値...
2021/07/02(金) 15:53:07.29ID:fx2NJKSC
素子はATGCの4値で、最小アドレス単位が3塩基コドンで1ワード=64bit(情報量の単位としてのビット)
ということでは
97デフォルトの名無しさん
垢版 |
2021/07/02(金) 16:24:19.38ID:xu7tv1xS
98デフォルトの名無しさん
垢版 |
2021/07/02(金) 16:26:27.71ID:xu7tv1xS
>3塩基コドンで1ワード

正解
っていうか実質使えないものもあるんやろ?
武漢コロナには人工物である証拠がーって言ってるのもそのあたりの痕跡が見付かってるから
2021/07/04(日) 11:53:43.14ID:9HrdtXiZ
インストラクションコードとして等価なのを数えなければ実質20くらいだけど、大体独自の制御コード、開始、終了、スプライシング(コメントアウト)、プリプロセッサマクロ的な役割を持っててフルに使ってるよ

そろそろスレチ…
2021/07/04(日) 17:25:18.33ID:wF1+vdjn
はじめは6bitで足りると思ったんですよ…
2021/07/04(日) 18:24:01.94ID:yK4SOtsp
あやふやな事柄をブーリアン型で定義するとだいたい後悔する
102デフォルトの名無しさん
垢版 |
2021/07/05(月) 11:41:14.25ID:c503ASju
未定義なのか未解明なのかはっきりさせてくれ
2021/07/14(水) 22:17:27.13ID:asWBFdS8
アップルの障害者絵文字に「知的障害者」がない理由
https://forbesjapan.com/articles/detail/33696
104デフォルトの名無しさん
垢版 |
2021/07/15(木) 13:41:16.83ID:he0y84gJ
あうあうあー
105デフォルトの名無しさん
垢版 |
2021/07/15(木) 15:07:41.94ID:ygp86UHP
>>103
鮮人で代用出来る罠
2021/07/15(木) 17:01:48.57ID:MIyHkZEB
精神障害者だけど精神障害者絵文字もないよね?
どういう図柄にすべきかと問われると困るけど

自治体からは
|+|
|♥|
みたいなキーホルダー貰ったけど誰も認知してないよねきっと

障害者用駐車場だけ空いてたりするけど停めていいか迷う、何故か必ず車椅子マークだし
2021/07/31(土) 19:00:19.06ID:EEJKP29r
ってかそのスイスみたいなの日本ローカルじゃないの
2021/08/01(日) 18:12:48.32ID:nJJHiJRu
入れて定着したら定着したで煽りに使われるだけになりそう
2021/08/01(日) 19:02:37.23ID:ABM/FRoD
サイケな柄でいいんじゃないの
2021/08/01(日) 21:04:58.30ID:X3xLRd5t
まあ虹色の旗も別に煽りに使われてる感じはないから杞憂かもしれん。
111デフォルトの名無しさん
垢版 |
2021/08/01(日) 21:24:22.96ID:z9C0zhgf
>>107
山手線の優先席でそのマークを見せつけて席を譲らせようとした白人がいたな。
2021/08/01(日) 23:07:28.11ID:FQePzLIs
相手が懐から2枚出したら負けたりするのかな
2021/08/03(火) 11:00:25.44ID:Ljn/RAt1
水戸黄門か
2021/08/03(火) 14:11:15.86ID:LNzOPWsE
倒したプレイヤーのカードを獲得できるから強いほどどんどん増えていく
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況