Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
探検
文字コード総合スレ part13
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2020/07/03(金) 20:53:47.08ID:elbfDzqw782デフォルトの名無しさん
2023/02/24(金) 01:46:20.35ID:MU0HtYsa783デフォルトの名無しさん
2023/02/24(金) 03:29:22.76ID:zsYMclLz 今後はファイルや外部通信はUTF-8がデフォルトになる
逆にいうとBOMついてないのは全てUTF-8とみなされる
よってUTF-8にBOMは不要
この単純なロジックが理解できないやつはかわいそう
逆にいうとBOMついてないのは全てUTF-8とみなされる
よってUTF-8にBOMは不要
この単純なロジックが理解できないやつはかわいそう
784デフォルトの名無しさん
2023/02/24(金) 06:23:20.57ID:BmT/WJ86 >>783
> 今後はファイルや外部通信はUTF-8がデフォルトになる
ならないよ。
誤った認識を前提に議論するのは意味がない。
スレのレベルが低下して無駄な書き込みが増えるだけなので、この話題はもうやめてくれ。
> 今後はファイルや外部通信はUTF-8がデフォルトになる
ならないよ。
誤った認識を前提に議論するのは意味がない。
スレのレベルが低下して無駄な書き込みが増えるだけなので、この話題はもうやめてくれ。
785デフォルトの名無しさん
2023/02/24(金) 08:06:25.11ID:liuYehNm 文字コードを自動判別するためにBOMを使うってのがダメだな
BOMと思ったコードが違うエンコーディングの可能性があるんだから
Windows だけで閉じておいてほしいから、通信回線には流さないで
BOMと思ったコードが違うエンコーディングの可能性があるんだから
Windows だけで閉じておいてほしいから、通信回線には流さないで
786デフォルトの名無しさん
2023/02/24(金) 08:34:34.48ID:b+y25Gbd >>777
> Windowsは内部的にはUTF16で統一されてるよ
ワイドキャラクタがUTF-16で統一されているという意味なら
Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ
ワイドキャラクタ以外アプリ等が独自に他の符号化方式を
採用している場合があるのも同じ
> Windowsは内部的にはUTF16で統一されてるよ
ワイドキャラクタがUTF-16で統一されているという意味なら
Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ
ワイドキャラクタ以外アプリ等が独自に他の符号化方式を
採用している場合があるのも同じ
787デフォルトの名無しさん
2023/02/24(金) 08:58:55.21ID:BmT/WJ86 >>785
そもそも誰も自動判別の正確性を担保できないからBOMがあるんだろ
Windowsを除外したビジネスで成り立つならそれでいいが、現実はそうじゃない。
他人が対応するのを待つのは無能な人のすることだよ。
そもそも誰も自動判別の正確性を担保できないからBOMがあるんだろ
Windowsを除外したビジネスで成り立つならそれでいいが、現実はそうじゃない。
他人が対応するのを待つのは無能な人のすることだよ。
788デフォルトの名無しさん
2023/02/24(金) 09:04:15.26ID:BmT/WJ86 過去にプログラミングやったことない人が急にスマホ開発に配属されて、自分が対応するのではなく他人が対応するのを待ってるあたりに頭悪いのが伝わってくる。
プログラミングの才能ないし、むいてないからプログラミングから離れたほうがいいと思う。
プログラミングの才能ないし、むいてないからプログラミングから離れたほうがいいと思う。
789デフォルトの名無しさん
2023/02/24(金) 12:43:37.42ID:8I4EMiY9 逆だね。BOMなんかじゃ判別できない
だって,FEってソーンのコードだもの
だって,FEってソーンのコードだもの
790デフォルトの名無しさん
2023/02/24(金) 12:49:37.23ID:8I4EMiY9 Windows プログラマってほんとどうしてこんなに喧嘩を売るの?
世の中の文字コードがCP932 とUTF-16しかないと思っているよね
世の中の文字コードがCP932 とUTF-16しかないと思っているよね
791デフォルトの名無しさん
2023/02/24(金) 13:06:47.37ID:8I4EMiY9 もう少し正確にいうと,テキストファイルから
文字のエンコーディングを推測することはほとんど不可能
文字のエンコーディングはアウトオブバンドで送る必要がある
ISO2022 はエスケープシーケンスというアウトオブバンド転送を定義していた
ちゃんと定義するなら,UTF-8も Byte order mark ではなく
エンコーディングを指定するアウトオブバンドシーケンスを定義すべきという話
なんか議論が噛み合ってなかったので
文字のエンコーディングを推測することはほとんど不可能
文字のエンコーディングはアウトオブバンドで送る必要がある
ISO2022 はエスケープシーケンスというアウトオブバンド転送を定義していた
ちゃんと定義するなら,UTF-8も Byte order mark ではなく
エンコーディングを指定するアウトオブバンドシーケンスを定義すべきという話
なんか議論が噛み合ってなかったので
792デフォルトの名無しさん
2023/02/24(金) 13:10:51.59ID:8I4EMiY9 それで,Windows は先頭にBOM を入れるというのをアウトオブバンドで決めてる訳
だから,Windows で勝手にしてね。Windows 以外には送らないでって話
だから,Windows で勝手にしてね。Windows 以外には送らないでって話
793デフォルトの名無しさん
2023/02/24(金) 13:23:55.49ID:BmT/WJ86 「べき」論はよそでやってくれ。
794デフォルトの名無しさん
2023/02/24(金) 13:24:26.82ID:5Y5XlszR もうさ、結論出ないからこうしたら?
今後新たに作成するテキストファイルはBOM無しUTF-8で書く
今後のソフトはBOM有りBOM無し両方のUTF-8を読めるように作る
今後新たに作成するテキストファイルはBOM無しUTF-8で書く
今後のソフトはBOM有りBOM無し両方のUTF-8を読めるように作る
795デフォルトの名無しさん
2023/02/24(金) 13:53:37.06ID:BmT/WJ86 急にスレのレベルが下がった感じ。同じ人がID変えて書き込んでるんだろうか。
このスレに独り善がりな理想論を書き込む人は、プログラマ適性がないから転職しなさい。
このスレに独り善がりな理想論を書き込む人は、プログラマ適性がないから転職しなさい。
796デフォルトの名無しさん
2023/02/24(金) 13:59:12.56ID:zsYMclLz >>792
Windowsではとか言ってる時点で国際化とか文字コードのこと全く知らない無知だろ。単に「日本語Windows」で使われてたCP932がUTF-8のBOMとかぶってなかっただけ。
英語Windowsで使われてたCP1252とかは EF BB BF にもそれぞれ文字が割当れらてるのでBOMとかあっても区別できばない。他の多くの文字コードもそうだし、CP932/SJIS なんかより断然現有の資産も多い。
おま国事情でたまたまうまくいってるだけなんて、一般化や標準化されるわけないだろ
Windowsではとか言ってる時点で国際化とか文字コードのこと全く知らない無知だろ。単に「日本語Windows」で使われてたCP932がUTF-8のBOMとかぶってなかっただけ。
英語Windowsで使われてたCP1252とかは EF BB BF にもそれぞれ文字が割当れらてるのでBOMとかあっても区別できばない。他の多くの文字コードもそうだし、CP932/SJIS なんかより断然現有の資産も多い。
おま国事情でたまたまうまくいってるだけなんて、一般化や標準化されるわけないだろ
797デフォルトの名無しさん
2023/02/24(金) 14:02:43.91ID:zsYMclLz798デフォルトの名無しさん
2023/02/24(金) 14:02:58.25ID:BmT/WJ86 「ぼくのかんがえたさいきょうの文字コード処理パッチ適用」を自腹で開発して、自腹ですべての顧客のデバイスに入れればいいだけ。
すべてはカネ次第。カネを出す人が仕様を決めればいい。それだけ。
すべてはカネ次第。カネを出す人が仕様を決めればいい。それだけ。
799デフォルトの名無しさん
2023/02/24(金) 14:42:29.80ID:dKpgt1DZ 海外ではこうとか、本来こうあるべきとか、どうでも良いんだよ
日本語のテキストファイルを読み込むプログラムの仕様としてSJIS/UTF8自動判別にした場合、
確実に文字化けしないのはBOM付きUTF-8だけという事実は考慮すべき
日本語のテキストファイルを読み込むプログラムの仕様としてSJIS/UTF8自動判別にした場合、
確実に文字化けしないのはBOM付きUTF-8だけという事実は考慮すべき
800デフォルトの名無しさん
2023/02/24(金) 15:02:03.28ID:xSIwGcb9 >>796
CP1252でEF BB BFって文字はあっても意味を成さない謎の文字列だし、極稀なパターン
完璧ではなくとも、実用上ほぼ問題ない精度で判別出来るでしょ
とうのWindowsがそういう風に利用してるのだし
CP1252でEF BB BFって文字はあっても意味を成さない謎の文字列だし、極稀なパターン
完璧ではなくとも、実用上ほぼ問題ない精度で判別出来るでしょ
とうのWindowsがそういう風に利用してるのだし
801デフォルトの名無しさん
2023/02/24(金) 15:30:37.37ID:BmT/WJ86 ïÿ¿を有意な先頭文字列とする利点と欠点を考えて決断すればいいだけのこと
802デフォルトの名無しさん
2023/02/24(金) 16:49:11.30ID:3Zj7Ci+m WindowsやエクセルとBOMは関係ないとおもうんだが
とくにマイクロソフトが開発したり、始めたわけではなく
採用前からBOMありのユニコードがあってたまたまBOMありフォーマットを使っただけでは?
ちがうのか?
とくにマイクロソフトが開発したり、始めたわけではなく
採用前からBOMありのユニコードがあってたまたまBOMありフォーマットを使っただけでは?
ちがうのか?
803デフォルトの名無しさん
2023/02/24(金) 18:05:09.63ID:zsYMclLz >>799
そもそも自動判別は悪という流れになってることすら知らないんだな。
セキュリティホールやバグの温床になるので文字コードの自動判別はなくすのが世界の流れ。特に確実性のない自動判別は害悪でしかない。
そもそも自動判別は悪という流れになってることすら知らないんだな。
セキュリティホールやバグの温床になるので文字コードの自動判別はなくすのが世界の流れ。特に確実性のない自動判別は害悪でしかない。
804デフォルトの名無しさん
2023/02/24(金) 18:22:32.64ID:BmT/WJ86 BOMを信じた時点でもはや自動判別ではないだろ。
805デフォルトの名無しさん
2023/02/24(金) 19:12:21.37ID:/JDec9CR806デフォルトの名無しさん
2023/02/24(金) 19:13:09.21ID:/JDec9CR807デフォルトの名無しさん
2023/02/24(金) 19:20:45.75ID:/JDec9CR808デフォルトの名無しさん
2023/02/24(金) 19:22:18.48ID:/JDec9CR809デフォルトの名無しさん
2023/02/24(金) 19:23:31.95ID:vCNNlHyw まだunicode以外の文字コードを使う気かよ
化石なん?
化石なん?
810デフォルトの名無しさん
2023/02/24(金) 19:23:32.40ID:/JDec9CR811デフォルトの名無しさん
2023/02/24(金) 19:24:26.90ID:/JDec9CR >>809
今すぐこれまでの資産をUnicodeに変換してみせろよw
今すぐこれまでの資産をUnicodeに変換してみせろよw
812デフォルトの名無しさん
2023/02/24(金) 19:28:28.37ID:3Zj7Ci+m UTF-8はPlan 9かららしい
Linuxに勝てなかったPlan 9 2009/02/09
「Plan 9」はUNIXが生まれたベル研究所で、次世代UNIXとして開発されていた分散OSだ。
UNIXやC言語を生み出したケン・トンプソン、デニス・リッチー、ロブ・パイクらのチームが、当時UNIXが抱えていた限界を打ち破るために、ネットワークやGUIを最初からUNIXの設計思想に基づいて取り入れた先進的なOSだった。
UNIXの大きな特徴として、デバイスをファイルにマッピングして抽象化するというものがある。ところが、こうした初期設計時の抽象化から漏れるAPIが増えた。
そうして漏れつつあった各種リソースを、再びUNIX的なファイルシステムのツリーにマップし、抽象度と統一性の高いインターフェイスを用意したのがPlan 9だった。
ファイルとして扱えるのは一般に想像するようなハードウェアデバイスだけではなく、あらゆるリソースが対象となった。
TCP/IPなどのネットワーク関連の操作も「/net」というディレクトリを使って行うなど徹底していた。
Plan 9はなぜ失敗したのか?
マーケティングに熱心でなかったからとか、さまざまな理由付けが可能だが、Plan 9が普及しなかった理由は結局のところ、旧来のUNIXを置き換えるほどには先進的ではなかったからだ、というのがレイモンド氏の答えだ。
Plan 9に比べれば、確かにUNIXはきしみ音が聞こえてガタピシいうし、明らかにさび付いたところもあるのだが、そのポジションを維持するために必要な仕事はちゃんとこなせていた、という。
LinuxやBSD系UNIXには、Plan 9由来の機能がいくつか取り込まれている。
稼働中のプロセスをモニタしたり操作するための「/proc」と呼ばれるファイルシステムは、Plan 9のものだし、
Linuxでスレッドを生成するシステムコール「clone」は、レイモンド氏によればPlan 9の「rfork」をモデルにしているという。
すべてをファイルのように扱うという意味でいえば、LinuxのFUSEもPlan 9の影響下にある。
現在、FUSEを使ったファイルシステムには、ftpfsはもちろん、flickrfsやBloggerFS、TracFSなどさまざまな実装がある。
今やOSばかりかインターネット全体にも利用範囲を広げた感があるUTF-8も、Plan 9のために考案されたエンコーディングだという。
https://atmarkit.itmedia.co.jp/news/analysis/200902/09/future.html
Linuxに勝てなかったPlan 9 2009/02/09
「Plan 9」はUNIXが生まれたベル研究所で、次世代UNIXとして開発されていた分散OSだ。
UNIXやC言語を生み出したケン・トンプソン、デニス・リッチー、ロブ・パイクらのチームが、当時UNIXが抱えていた限界を打ち破るために、ネットワークやGUIを最初からUNIXの設計思想に基づいて取り入れた先進的なOSだった。
UNIXの大きな特徴として、デバイスをファイルにマッピングして抽象化するというものがある。ところが、こうした初期設計時の抽象化から漏れるAPIが増えた。
そうして漏れつつあった各種リソースを、再びUNIX的なファイルシステムのツリーにマップし、抽象度と統一性の高いインターフェイスを用意したのがPlan 9だった。
ファイルとして扱えるのは一般に想像するようなハードウェアデバイスだけではなく、あらゆるリソースが対象となった。
TCP/IPなどのネットワーク関連の操作も「/net」というディレクトリを使って行うなど徹底していた。
Plan 9はなぜ失敗したのか?
マーケティングに熱心でなかったからとか、さまざまな理由付けが可能だが、Plan 9が普及しなかった理由は結局のところ、旧来のUNIXを置き換えるほどには先進的ではなかったからだ、というのがレイモンド氏の答えだ。
Plan 9に比べれば、確かにUNIXはきしみ音が聞こえてガタピシいうし、明らかにさび付いたところもあるのだが、そのポジションを維持するために必要な仕事はちゃんとこなせていた、という。
LinuxやBSD系UNIXには、Plan 9由来の機能がいくつか取り込まれている。
稼働中のプロセスをモニタしたり操作するための「/proc」と呼ばれるファイルシステムは、Plan 9のものだし、
Linuxでスレッドを生成するシステムコール「clone」は、レイモンド氏によればPlan 9の「rfork」をモデルにしているという。
すべてをファイルのように扱うという意味でいえば、LinuxのFUSEもPlan 9の影響下にある。
現在、FUSEを使ったファイルシステムには、ftpfsはもちろん、flickrfsやBloggerFS、TracFSなどさまざまな実装がある。
今やOSばかりかインターネット全体にも利用範囲を広げた感があるUTF-8も、Plan 9のために考案されたエンコーディングだという。
https://atmarkit.itmedia.co.jp/news/analysis/200902/09/future.html
813デフォルトの名無しさん
2023/02/24(金) 19:28:34.50ID:/JDec9CR814デフォルトの名無しさん
2023/02/24(金) 19:30:00.43ID:/JDec9CR 間違えた
echo あいうえお | cut -c 4-
いうえお
echo あいうえお | cut -c 4-
いうえお
815デフォルトの名無しさん
2023/02/24(金) 19:36:38.85ID:EbaJyZ/f 業界人ですら認識ちがいのある文字コード。素人に説明するの超絶に面倒。
816デフォルトの名無しさん
2023/02/24(金) 19:46:01.57ID:liuYehNm エンコーディングの話をしているのに Unicode とは?
817デフォルトの名無しさん
2023/02/24(金) 21:08:47.90ID:Ww2YDdfR 誰も>>794はスルーするんだな?w
818デフォルトの名無しさん
2023/02/24(金) 21:53:46.51ID:h0ZFyNU2 流れからしてピントのずれたレスに反応するほどのことでもないかなって
819デフォルトの名無しさん
2023/02/24(金) 22:24:35.19ID:zsYMclLz820デフォルトの名無しさん
2023/02/24(金) 22:30:50.23ID:zsYMclLz821デフォルトの名無しさん
2023/02/24(金) 23:16:35.23ID:/JDec9CR822デフォルトの名無しさん
2023/02/24(金) 23:18:05.18ID:/JDec9CR >>819
どこにも同じ動きとは書いていない
https://pubs.opengroup.org/onlinepubs/9699919799/utilities/cut.html
-b list
Cut based on a list of bytes. Each selected byte shall be output unless the -n option is also specified.
It shall not be an error to select bytes not present in the input line.
-c list
Cut based on a list of characters. Each selected character shall be output.
It shall not be an error to select characters not present in the input line.
どこにも同じ動きとは書いていない
https://pubs.opengroup.org/onlinepubs/9699919799/utilities/cut.html
-b list
Cut based on a list of bytes. Each selected byte shall be output unless the -n option is also specified.
It shall not be an error to select bytes not present in the input line.
-c list
Cut based on a list of characters. Each selected character shall be output.
It shall not be an error to select characters not present in the input line.
823デフォルトの名無しさん
2023/02/24(金) 23:31:32.12ID:zsYMclLz >>822
linux なら linux のマニュアル嫁。
linux なら linux のマニュアル嫁。
824デフォルトの名無しさん
2023/02/25(土) 00:00:07.97ID:dveJDxzx >>823
お前か誰かしらんが、どのディストリでUnicodeに
対応してないって聞かれたから
Linuxは全て対応してないと答えたんだが?
Linuxは対応してないといった俺の指摘に対して
Linuxは対応してないのが仕様だと答えるアホ
macOSのcutはちゃんとUnicodeに対応してる
対応してないディストリを聞かれたから答えただけだ
お前か誰かしらんが、どのディストリでUnicodeに
対応してないって聞かれたから
Linuxは全て対応してないと答えたんだが?
Linuxは対応してないといった俺の指摘に対して
Linuxは対応してないのが仕様だと答えるアホ
macOSのcutはちゃんとUnicodeに対応してる
対応してないディストリを聞かれたから答えただけだ
825デフォルトの名無しさん
2023/02/25(土) 00:01:38.57ID:dveJDxzx それにmawkやdashが対応してないという話からも逃げてるな
Unicodeに完全対応してねーんだよ
Unicodeに完全対応してねーんだよ
826デフォルトの名無しさん
2023/02/25(土) 01:08:13.97ID:IGzyIaR2 >>825
話の流れを見る限り、お前が内部コードと外部コードの区別がついてないんじゃないか?
話の流れを見る限り、お前が内部コードと外部コードの区別がついてないんじゃないか?
827デフォルトの名無しさん
2023/02/25(土) 01:34:53.03ID:pcyV0/Fb macOSはUNIXといってるからawkもちゃんとロケール対応してるべき? SUSのバージョンにもよる?
gawkは対応してるみたいね
gawkは対応してるみたいね
828デフォルトの名無しさん
2023/02/25(土) 06:59:37.00ID:dveJDxzx >>826
付いているし、そんな質問されても意味がない
付いているし、そんな質問されても意味がない
829デフォルトの名無しさん
2023/02/25(土) 08:46:26.36ID:Rl2aLkT8 >>821
現実的で一番良い結論だと思うw
現実的で一番良い結論だと思うw
830デフォルトの名無しさん
2023/02/25(土) 08:48:27.98ID:dveJDxzx 現実的っていうのはEUC-JPで書かれた
ウェブサイトが見れなくなるってこと?
ウェブサイトが見れなくなるってこと?
831デフォルトの名無しさん
2023/02/25(土) 10:28:54.79ID:+wSAdwQP 文字のエンコーディングは通信相手同士で取り決めろということ
相手がEUC-JPで送ってくるならこっちもEUC-JPで受け取れば良いこと
相手がEUC-JPで送ってくるならこっちもEUC-JPで受け取れば良いこと
832デフォルトの名無しさん
2023/02/25(土) 10:44:41.98ID:IGzyIaR2 今後はファイルや外部通信はUTF-8がデフォルトになる
デフォルトの意味が理解できないド素人がいるみたいなので書いておくと
「アプリは特に文字コードの指定が無かった場合はUTF-8で出力するべき、指定が無かった場合はUTF-8として読み込むべきである」ということ
つまりBOMが無くてもUTF-8とみなすべきなので、UTF-8にBOMは不要
デフォルトの意味が理解できないド素人がいるみたいなので書いておくと
「アプリは特に文字コードの指定が無かった場合はUTF-8で出力するべき、指定が無かった場合はUTF-8として読み込むべきである」ということ
つまりBOMが無くてもUTF-8とみなすべきなので、UTF-8にBOMは不要
833デフォルトの名無しさん
2023/02/25(土) 12:47:05.63ID:PU7vc6R3834デフォルトの名無しさん
2023/02/25(土) 14:33:50.87ID:mpikKEOw 通信はともかく、問題は過去に作成された膨大な数のUTF-8以外のファイルだ
とりあえず開いてみて、文字化けしたらエンコードを指定して開き直してみろ?
そんな対応じゃクレームが大量に来るし、PC苦手な人じゃ教わっても対応出来ないだろ
とりあえず開いてみて、文字化けしたらエンコードを指定して開き直してみろ?
そんな対応じゃクレームが大量に来るし、PC苦手な人じゃ教わっても対応出来ないだろ
835デフォルトの名無しさん
2023/02/25(土) 15:16:11.43ID:k0PvGKB9 ロバストネス原則(ポステルの法則)
https://makitani.net/shimauma/robustness-principle
ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others.)」というシステムやソフトウェアの開発における考え方、開発指針のこと。「送信は厳密に、受信は寛容に」とも言い換えられる。「堅牢性原則」。
他のシステムとの間で通信を行う際、処理をして送信する側は厳格なデータの仕様に準拠するべきだが、利用するユーザー側には入力データの多様性を許容して使い勝手を損なわないようにするべきである、というものである。
アメリカのコンピューター科学者でインターネットの創始者の1人であるジョン・ポステル(Jonathan Bruce Postel)が初期のTCPを規定したRFC 793において示した一節であり、それが一般化され知られるようになったものである。ジョン・ポステルにちなんで「ポステルの法則 (Postel’s law)」とも呼ばれる。
https://makitani.net/shimauma/robustness-principle
ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others.)」というシステムやソフトウェアの開発における考え方、開発指針のこと。「送信は厳密に、受信は寛容に」とも言い換えられる。「堅牢性原則」。
他のシステムとの間で通信を行う際、処理をして送信する側は厳格なデータの仕様に準拠するべきだが、利用するユーザー側には入力データの多様性を許容して使い勝手を損なわないようにするべきである、というものである。
アメリカのコンピューター科学者でインターネットの創始者の1人であるジョン・ポステル(Jonathan Bruce Postel)が初期のTCPを規定したRFC 793において示した一節であり、それが一般化され知られるようになったものである。ジョン・ポステルにちなんで「ポステルの法則 (Postel’s law)」とも呼ばれる。
836デフォルトの名無しさん
2023/02/25(土) 15:34:51.75ID:+JwPKi/T 禿丸最強でFA
837デフォルトの名無しさん
2023/02/25(土) 16:51:45.73ID:dveJDxzx >>831
だからUTF-8を前提にできないってことだろ
だからUTF-8を前提にできないってことだろ
838デフォルトの名無しさん
2023/02/25(土) 16:52:21.29ID:dveJDxzx839デフォルトの名無しさん
2023/02/25(土) 18:25:42.81ID:p5DpNAy5 アップデートされずEUC-JPのまま捨て置かれたドキュメントの価値などもはや「歴史的な」価値しかない
Webブラウザで閲覧できれば十分、新しく作るシステムでいまさら対応する必要性など皆無
2000年前後の知識しか持ち合わせていない老害がいくらギャーギャー騒ごうとも
時代遅れなエンコーディングに対応するような愚を犯してはならない
毅然としてUTF-8以外を切り捨てるべし
Webブラウザで閲覧できれば十分、新しく作るシステムでいまさら対応する必要性など皆無
2000年前後の知識しか持ち合わせていない老害がいくらギャーギャー騒ごうとも
時代遅れなエンコーディングに対応するような愚を犯してはならない
毅然としてUTF-8以外を切り捨てるべし
840デフォルトの名無しさん
2023/02/25(土) 19:05:12.59ID:PU7vc6R3 >>839みたいに「切り捨てる」とか強い表現を使う人は、既得権からあぶれた失うものがない負け組が好んで使う言葉。
ネットでは威勢が良く見えても現実世界では切り捨てる側ではなく切り捨てられる側。ルサンチマンを抱えている。
ネットでは威勢が良く見えても現実世界では切り捨てる側ではなく切り捨てられる側。ルサンチマンを抱えている。
841デフォルトの名無しさん
2023/02/25(土) 19:12:22.66ID:PU7vc6R3 「~べき」とか語っていいのはカネを出す側であって、「~べき」はカネで雇われる側にすぎない技術者が使っていい表現ではない。
842デフォルトの名無しさん
2023/02/25(土) 19:43:50.59ID:pcyV0/Fb >>835
そういう歴史的なコンテクストでいうならRFC 793じゃなくて761を引用すべきでしょ
そういう歴史的なコンテクストでいうならRFC 793じゃなくて761を引用すべきでしょ
843デフォルトの名無しさん
2023/02/25(土) 21:32:29.38ID:bBUOoOco よりによってShift_JISの5chでイキってて笑っちゃうんすよね
844デフォルトの名無しさん
2023/02/25(土) 21:46:01.53ID:vjs83zv7 🤔
845デフォルトの名無しさん
2023/02/25(土) 22:09:35.17ID:SbO0y0c6 ユニコード規格 Unicode Standard にも UTF-8 の BOM は付けても良い(may)けど、非推奨(not recommended)って明記されてるのに、どうしても付けさせたいや奴がいるのはわかった
846デフォルトの名無しさん
2023/02/25(土) 22:43:56.85ID:dveJDxzx >>839
だから歴史的な価値が高いものをお前は捨てるのかって言ってるんだよ
だから歴史的な価値が高いものをお前は捨てるのかって言ってるんだよ
847デフォルトの名無しさん
2023/02/25(土) 22:44:39.12ID:dveJDxzx >>845
非推奨だけど付けて良いわけで何の問題もないだろ
非推奨だけど付けて良いわけで何の問題もないだろ
848デフォルトの名無しさん
2023/02/25(土) 22:52:11.76ID:IGzyIaR2849デフォルトの名無しさん
2023/02/25(土) 23:48:54.66ID:m4LfFP+9 つけたいじゃなくて、対応できないと困ると言ってるだけでしょう
850デフォルトの名無しさん
2023/02/26(日) 01:34:30.84ID:cEWS884H つまり入力をどするかは置いといて、出力にがBOMはつけるなでFA?
851デフォルトの名無しさん
2023/02/26(日) 05:45:33.47ID:6avgaEJx852デフォルトの名無しさん
2023/02/26(日) 06:00:29.38ID:5w3etrkl ドレスコードを守らない客を門前払いするかを判断するのは雇われコックではない。経営者や管理人だ。
853デフォルトの名無しさん
2023/02/26(日) 06:40:37.52ID:O/DM2Am7 UTF-8にBOMは付けるなでFA
付いてるやつ受け取ったらドンマイ
付いてるやつ受け取ったらドンマイ
854デフォルトの名無しさん
2023/02/26(日) 15:37:46.70ID:iPWFNko4 付けるなと規定されているところなら付けないし
付けろと規定されているところならつける
指定が無ければ俺は付ける
付けろと規定されているところならつける
指定が無ければ俺は付ける
855デフォルトの名無しさん
2023/02/26(日) 16:12:00.59ID:5w3etrkl コロナ禍でマスクするのは世間体のためばかりとは限らない。
マスクしてないと入店拒否されかねないからね。
マスクしている人を入店拒否するのは反ワクチンかな。
マスクしてないと入店拒否されかねないからね。
マスクしている人を入店拒否するのは反ワクチンかな。
856デフォルトの名無しさん
2023/02/26(日) 16:23:35.39ID:5w3etrkl >>853みたいにクライアントとサーバーの切り分けできてない人、頭悪そうに見えてしまうから良く考えてから書き込んだほうがいい
BOMのせいで挙動がおかしくなることはないので、みなBOMをつけるようになる。それが現実。
BOMのせいで挙動がおかしくなることはないので、みなBOMをつけるようになる。それが現実。
857デフォルトの名無しさん
2023/02/26(日) 19:04:25.66ID:cEWS884H >>856
ねえよ。規格で非推奨ってなってるの出力して誤動作したら出力した方の責任。業務プログラムなら非推奨を理由に改修要求や損害賠償請求できる。規格の非推奨にはそれだけの効力がある。
趣味でやる分に好きにすれば良いけど、実務にはかかわるな。
ねえよ。規格で非推奨ってなってるの出力して誤動作したら出力した方の責任。業務プログラムなら非推奨を理由に改修要求や損害賠償請求できる。規格の非推奨にはそれだけの効力がある。
趣味でやる分に好きにすれば良いけど、実務にはかかわるな。
858デフォルトの名無しさん
2023/02/26(日) 19:13:28.86ID:CWs9xgaU まさか禁止と非推奨の違いを知らないのか?
859デフォルトの名無しさん
2023/02/26(日) 20:41:34.15ID:BRhyzl+u860デフォルトの名無しさん
2023/02/26(日) 22:10:02.37ID:5w3etrkl Windows環境はどんどんBOMつきが当たり前になっていくから、サービス提供者はBOM対応が事実上必須になる
非推奨だからとかつけるなとか、およそ現実を見てないね
非推奨だからとかつけるなとか、およそ現実を見てないね
861デフォルトの名無しさん
2023/02/26(日) 22:12:16.04ID:cEWS884H862デフォルトの名無しさん
2023/02/26(日) 22:18:29.81ID:5w3etrkl863デフォルトの名無しさん
2023/02/26(日) 23:13:02.63ID:cEWS884H864デフォルトの名無しさん
2023/02/26(日) 23:31:02.55ID:K7TElpTY >>863
Windows Subsystem for Linuxのためじゃないかな?
上にもあるとおりunix系のアプリの中にはutf8のBOM未対応のまま(というか今更いじれない?)の状態になっているからな
良くも悪しくも歴史的にメモ帳は機能がしょぼすぎてその他の一般業務向けでの影響力はほとんどない状態だから、
Excelとかに比べれば変更しやすいという後ろ向きな理由もあるだろう
Windows Subsystem for Linuxのためじゃないかな?
上にもあるとおりunix系のアプリの中にはutf8のBOM未対応のまま(というか今更いじれない?)の状態になっているからな
良くも悪しくも歴史的にメモ帳は機能がしょぼすぎてその他の一般業務向けでの影響力はほとんどない状態だから、
Excelとかに比べれば変更しやすいという後ろ向きな理由もあるだろう
865デフォルトの名無しさん
2023/02/26(日) 23:35:43.20ID:GmFx8zoR866デフォルトの名無しさん
2023/02/26(日) 23:40:56.18ID:K7TElpTY ていうかあれか、パイプを使ったテキストのやりとり等とBOMの相性が悪そうだから、コンソール系のアプリでBOM対応は面倒だわな
867デフォルトの名無しさん
2023/02/26(日) 23:42:12.69ID:K7TElpTY >>865
いや、webの標準はunix系のコンソールアプリでしょ?
いや、webの標準はunix系のコンソールアプリでしょ?
868デフォルトの名無しさん
2023/02/27(月) 00:05:34.15ID:Y3EgytEI リンク貼った人がいるので正解は
Microsoft の主張は「WEBの標準はASCIIと互換性のある BOM 無しの UTF-8 だから、それに合わせるため変更した。これは重要な改善である。後方互換性のためにBOMつきも可能にしといた」
BOMなしは改善、BOMつき後方互換性って明言してる。
Microsoft の主張は「WEBの標準はASCIIと互換性のある BOM 無しの UTF-8 だから、それに合わせるため変更した。これは重要な改善である。後方互換性のためにBOMつきも可能にしといた」
BOMなしは改善、BOMつき後方互換性って明言してる。
869デフォルトの名無しさん
2023/02/27(月) 00:50:48.43ID:gqYK4M5Z ASCIIのような化石との互換性は要らない。UTF16以上を推奨し、UTF8はASCII文字出現率が
99.5%以上のファイルに限り許容するのが良い。
99.5%以上のファイルに限り許容するのが良い。
870デフォルトの名無しさん
2023/02/27(月) 01:16:54.16ID:ILzwYPjj Windows10では、デバッグ機能で別のエディタを起動してるから
メモ帳を使ったことないというか、どんなだったかも思い出せない
メモ帳を使ったことないというか、どんなだったかも思い出せない
871デフォルトの名無しさん
2023/02/27(月) 01:28:41.06ID:JGGw5pJY MSはデフォルトを変更しただけで
BOMにも対応している
つまり完璧にUnicodeに対応している
BOMにも対応している
つまり完璧にUnicodeに対応している
872デフォルトの名無しさん
2023/02/27(月) 02:25:37.58ID:mqhAvYzW 大正義じゃないか
873デフォルトの名無しさん
2023/02/27(月) 02:59:07.83ID:BI+QMK6X もうUTF−16にはWindowsの内部コード以外の役割はないんだ
文字コード戦争はとっくにUTF-8の勝利で終結したんだ ネットの普及が決め手だった
残念ながら負け犬がどんだけ吠えても現実は変わらないんだ
ほら、どんどん吠えて、(愉悦
文字コード戦争はとっくにUTF-8の勝利で終結したんだ ネットの普及が決め手だった
残念ながら負け犬がどんだけ吠えても現実は変わらないんだ
ほら、どんどん吠えて、(愉悦
874デフォルトの名無しさん
2023/02/27(月) 03:10:49.85ID:WKLLShCH 恥ずかしい無知野郎だなぁw
JavaもJavaScriptも内部コードはUTF-16だってーのに
JavaもJavaScriptも内部コードはUTF-16だってーのに
875デフォルトの名無しさん
2023/02/27(月) 05:48:11.01ID:FhIHw4p1876デフォルトの名無しさん
2023/02/27(月) 06:23:41.06ID:WKLLShCH 無知二匹目w
877デフォルトの名無しさん
2023/02/27(月) 06:45:46.85ID:FhIHw4p1 >>868
>これは重要な改善である。
甘いなあ
文字コードの自動判定を入れた、ということは、今後はUTF-8と認識できない可能性が生じる事を意味する
皮肉な話だが、文字コード自動判定のせいで事実上、BOM必須になる
>これは重要な改善である。
甘いなあ
文字コードの自動判定を入れた、ということは、今後はUTF-8と認識できない可能性が生じる事を意味する
皮肉な話だが、文字コード自動判定のせいで事実上、BOM必須になる
878デフォルトの名無しさん
2023/02/27(月) 06:46:52.69ID:jlyK/+pC JavaのStringとか、もう開き直っちゃってる感じで「文字とはUTF-16のバイトのことでーす」
って感じじゃん。ただの16ビットの配列と何が違うんだっけあれ
まともな文字列処理をするには別途ライブラリが確実にいる。面倒じゃのう
って感じじゃん。ただの16ビットの配列と何が違うんだっけあれ
まともな文字列処理をするには別途ライブラリが確実にいる。面倒じゃのう
879デフォルトの名無しさん
2023/02/27(月) 06:48:51.24ID:FhIHw4p1 BOMは文字コード自動判定をスキップする顔パスのようなもの。BOMを無くしたいという意向とは裏腹に、今後BOMは益々増える。
それが現実。
それが現実。
880デフォルトの名無しさん
2023/02/27(月) 06:51:35.24ID:FhIHw4p1 関所を沢山作ったせいで、ますます関所破りのバッドノウハウが普及する
881デフォルトの名無しさん
2023/02/27(月) 08:02:36.27ID:71jbPN3e >>874
通りすがりだが、お前は論外
ググってトップに「Java/Javascriptは内部コードでUTF-16が使われています」と書かれていたのを読んだのだろうが、BOMつけるか論争をしている人達割り込むツッコミ方じゃねぇw
他人を煽る前に自身の読解力と理解力を見直して出直してこいw
通りすがりだが、お前は論外
ググってトップに「Java/Javascriptは内部コードでUTF-16が使われています」と書かれていたのを読んだのだろうが、BOMつけるか論争をしている人達割り込むツッコミ方じゃねぇw
他人を煽る前に自身の読解力と理解力を見直して出直してこいw
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- NHK、受信料の未払い世帯に督促強化へ 民事手続きの新組織を設置 差し押さえなどの強制執行も ★2 [1ゲットロボ★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」★2 [冬月記者★]
- 日本人、歴史も経済も分からず貧乏に耐えかねて第二次日中戦争を求めてしまう…ヤバイよ [819729701]
- お前らは今年の冬何回くらいカニバスツアー行くんだ? この国の冬の味覚と言えばカニだろ [452836546]
- んなっても良いお🏡
- 【悲報】高市早苗を妄信している今の日本人見ると80年前も市民は進んで戦争協力してたんだって理解出来るよね🥺 [616817505]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
