プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
探検
文字コード総合スレ Part11
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5971デフォルトの名無しさん
2018/12/15(土) 07:05:36.47ID:LC13wD1r >>966
紹介サイトのURLとか貼れます?
紹介サイトのURLとか貼れます?
972デフォルトの名無しさん
2018/12/15(土) 13:39:28.60ID:ciQUdpOi シラバス
https://www.ouj.ac.jp/hp/kamoku/2019/kyouyou/C/joho/index.html
この前見たのはこれだったかな
情報理論とデジタル表現(’19)
の 第11回 テキストの符号化
これもおすすめ
デジタル情報の処理と認識(’18)
通信概論(’14)
https://www.ouj.ac.jp/hp/bangumi/year_tv.html
公開番組もあり
https://vod.ouj.ac.jp/view/ouj/#/navi/vod?ca=489
https://www.youtube.com/channel/UCd8zAzjHkIcPbnTDyn-q50w/videos
https://www.ouj.ac.jp/hp/kamoku/2019/kyouyou/C/joho/index.html
この前見たのはこれだったかな
情報理論とデジタル表現(’19)
の 第11回 テキストの符号化
これもおすすめ
デジタル情報の処理と認識(’18)
通信概論(’14)
https://www.ouj.ac.jp/hp/bangumi/year_tv.html
公開番組もあり
https://vod.ouj.ac.jp/view/ouj/#/navi/vod?ca=489
https://www.youtube.com/channel/UCd8zAzjHkIcPbnTDyn-q50w/videos
973デフォルトの名無しさん
2018/12/15(土) 14:24:01.62ID:/xz8BzsC Windows 10 Insider Preview、メモ帳でBOMなしのUTF-8が選択可能に | スラド デベロッパー
https://developers.srad.jp/story/18/12/14/0345249/
ついに
https://developers.srad.jp/story/18/12/14/0345249/
ついに
974デフォルトの名無しさん
2018/12/15(土) 14:46:24.79ID:Sg9amITu BOMカットするのなんてマなら簡単だろ
975デフォルトの名無しさん
2018/12/15(土) 15:14:00.77ID:+6LwXb2C マジかよ圧倒的シェアのWindowsがBOM付きだからという理由で自分は全部BOM月にしてたのに梯子外されたのかよ
976デフォルトの名無しさん
2018/12/15(土) 15:21:32.65ID:Sg9amITu SJIS絶滅はよ
977デフォルトの名無しさん
2018/12/15(土) 15:27:12.87ID:EyhC0X8P >>975
わざとらしい。Windowsのネイティブ文字コードはUTF16なんだから普通はUTF16を使うだろ
メモ帳で保存するときに、Unicodeを選んだらUTF16になる
UnicodeといえばUTF16のこと
わざとらしい。Windowsのネイティブ文字コードはUTF16なんだから普通はUTF16を使うだろ
メモ帳で保存するときに、Unicodeを選んだらUTF16になる
UnicodeといえばUTF16のこと
>>975
そもそも Byte Order Mark の必要のない UTF-8 に BOM を付けていることが論理的に矛盾していますよね
そもそも Byte Order Mark の必要のない UTF-8 に BOM を付けていることが論理的に矛盾していますよね
979デフォルトの名無しさん
2018/12/15(土) 15:44:04.63ID:EyhC0X8P >>979
>UTF-8の仕様によると、BOMは文書がUnicodeであることを自動判定するためにも用いられる
>らしい
らしい、ですか…
本当にそうなのか確かめてみました。RFC3629 https://tools.ietf.org/html/rfc3629 の記述は
The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known
informally as "BYTE ORDER MARK" (abbreviated "BOM").
BOM は本来は「ゼロ長割り込みなしスペース」という意味らしいですね…
ながながとあれやこれは書いてあったのですが結論はよくわからないです、誰か英語のできる人、どこを読めばいいか教えてください…
>UTF-8の仕様によると、BOMは文書がUnicodeであることを自動判定するためにも用いられる
>らしい
らしい、ですか…
本当にそうなのか確かめてみました。RFC3629 https://tools.ietf.org/html/rfc3629 の記述は
The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known
informally as "BYTE ORDER MARK" (abbreviated "BOM").
BOM は本来は「ゼロ長割り込みなしスペース」という意味らしいですね…
ながながとあれやこれは書いてあったのですが結論はよくわからないです、誰か英語のできる人、どこを読めばいいか教えてください…
981デフォルトの名無しさん
2018/12/15(土) 21:51:17.49ID:px2y3yP7 ISO10646では誤解を受けそうなBOMという呼び名は使われていなくてSignatureと言うらしい。
現在ではU+FEFFは専らSignatureを表すものとして、もともとのゼロ幅ノーブレークスペースの意味で
使用することは推奨されていない。代わりにU+2060 WORD JOINERを使用することになっている。
現在ではU+FEFFは専らSignatureを表すものとして、もともとのゼロ幅ノーブレークスペースの意味で
使用することは推奨されていない。代わりにU+2060 WORD JOINERを使用することになっている。
982デフォルトの名無しさん
2018/12/15(土) 23:06:31.96ID:8aRCy95z やはり頭悪いのはunicodeと符号化を混同してる
文書は符号化されたunicodeということになる
2つ以上のオクテットを使う符号単位で
BOM入れないヤツは池沼だからな
文書は符号化されたunicodeということになる
2つ以上のオクテットを使う符号単位で
BOM入れないヤツは池沼だからな
983デフォルトの名無しさん
2018/12/16(日) 00:59:01.64ID:0WbTxJge WindowsがなぜUTF-16のことをUnicodeといっているかというと、
Windows NT 初代の3.1(1994年)当時は世界中の文字は16bitで
全て表現できると思われていたからだよ。
Windows NTは最初からUnicodeに対応したOSなのだが、
当時はUnicode = 16bit = UTF-16が成り立っていた
それが間違っているとわかってUnicodeが21bitに拡張されたのが
Unicode 2.0 (1996年7月)
メモ帳がUTF-16をUnicodeと表現するのはその名残りだよ
そういう歴史を知らないで語ると恥をかく
Windows NT 初代の3.1(1994年)当時は世界中の文字は16bitで
全て表現できると思われていたからだよ。
Windows NTは最初からUnicodeに対応したOSなのだが、
当時はUnicode = 16bit = UTF-16が成り立っていた
それが間違っているとわかってUnicodeが21bitに拡張されたのが
Unicode 2.0 (1996年7月)
メモ帳がUTF-16をUnicodeと表現するのはその名残りだよ
そういう歴史を知らないで語ると恥をかく
984デフォルトの名無しさん
2018/12/16(日) 02:37:42.34ID:/e3hQGaS その当時の話をするならUCS-2じゃないの?
985デフォルトの名無しさん
2018/12/16(日) 05:34:39.63ID:oz52hRFm 寿司と言えば江戸だったから江戸前って名前になった、まで読んだ。
986デフォルトの名無しさん
2018/12/16(日) 11:01:00.63ID:0qV7OEGg 時すでにお寿司
987デフォルトの名無しさん
2018/12/16(日) 12:33:16.52ID:GapmNYlr988デフォルトの名無しさん
2018/12/16(日) 12:35:57.48ID:VlX3xGEw 寿司と言えば江戸ではなかったから、
江戸の寿司と強調したいときは、わざわざ江戸前寿司というようになった
ではないのか?
江戸の寿司と強調したいときは、わざわざ江戸前寿司というようになった
ではないのか?
989デフォルトの名無しさん
2018/12/16(日) 13:50:47.39ID:52dtexo8 寿司食いねえ! 🍣
990デフォルトの名無しさん
2018/12/16(日) 15:02:40.57ID:/e3hQGaS 押し寿司とかなれ寿司が寿司だよな。
酢で酸っぱくした寿司なんかフェイク寿司もいいところ。
酢で酸っぱくした寿司なんかフェイク寿司もいいところ。
991デフォルトの名無しさん
2018/12/16(日) 18:49:12.48ID:A6SlBDUO 押し寿司も酢飯使ってるよ
992デフォルトの名無しさん
2018/12/16(日) 20:12:23.42ID:oz52hRFm 火縄銃といえば種子島だから種子島って名前になった、まで読んだ
993デフォルトの名無しさん
2018/12/16(日) 20:40:53.56ID:Ux2imWCY 違うぞ。種子島の種とは、
子種のことだぞ。
種子島=子種島=ザーメン島
子種のことだぞ。
種子島=子種島=ザーメン島
994デフォルトの名無しさん
2018/12/16(日) 21:01:19.88ID:/e3hQGaS だから鉄砲はぴゅぴゅっと出るんですね
995デフォルトの名無しさん
2018/12/16(日) 21:10:12.52ID:oz52hRFm >>987
日本語でok
日本語でok
996デフォルトの名無しさん
2018/12/17(月) 16:59:55.19ID:Pfqpaohb997デフォルトの名無しさん
2018/12/17(月) 21:10:45.75ID:ncIi/eoH ドイツ語だと植物の種子も同じだからどうでもいい。
998デフォルトの名無しさん
2018/12/17(月) 21:18:37.04ID:lO+98ZHR999デフォルトの名無しさん
2018/12/17(月) 22:43:33.00ID:iPWzsOu1 >>996
thanx
thanx
1000デフォルトの名無しさん
2018/12/18(火) 01:01:53.52ID:dCapM8E2 次スレなぜか分裂
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 329日 2時間 3分 30秒
新しいスレッドを立ててください。
life time: 329日 2時間 3分 30秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 俳優 高岡蒼佑「エジプト出身とかナイジェリア出身とかの人が、日本の代表顔して移民の事とか話してるの見るとなんか違う気がする」★2 [Anonymous★]
- 「稼ぐのよ!」高市総理が電話ガチャ切りで伝えたこと 鈴木憲和農林水産大臣が国政報告会に出席 自身が目指す農政の方針語る [煮卵★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 『しんちゃんと岸田さん』 [175344491]
- 【高市デイリー】 久しぶりにヤマザキデイリー行ったら 店内焼き立てパンの値段がバカ高くてワロタ。 晋さん、もう買えないよ…… [485983549]
- 自民「高市の一言でこれまで積み上げてきた関係が駄目になる。言葉の重みを分かっていない。自分でまいた種は自分で刈り取ってもらう」 [256556981]
- 中国発日本行の航空券、491,000件(全体の32%)がキャンセルされたと判明。高市どうすんのこれ [603416639]
- 日本株、大暴落!!! [252835186]
- 識者「『フリーパレスチナ』とかイキってる連中が台湾の話になると『中国を怒らせるな!』ってなる。ほんと左翼の正義って薄っぺらい」 [279254606]
