X

文字コード総合スレ part13

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2020/07/03(金) 20:53:47.08ID:elbfDzqw
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
2023/02/21(火) 22:10:48.02ID:6Lh94JJt
おそらくだけど>743は知識が古すぎて
>>746が挙げてる用語がそれぞれどういう意味を持ってるのか何一つ理解できていないだろう
これでは会話が成立しない
もしくは知識があるうえで>748や>749みたいなことを言い出してる可能性もないわけではないが
仮にそうであったとすれば頭が悪すぎてなおのこと会話が成立しないと思われる
2023/02/22(水) 07:57:15.15ID:NZkCD/9S
正直、UTF-8にBOMつけるんなら
ISO2022 でいいやんと思う
753730
垢版 |
2023/02/22(水) 09:59:50.26ID:xbNdqyen
>>750
わかった、あなたとマイクロソフトのメモ帳を信じることにするw
2023/02/22(水) 20:25:50.37ID:yP74xxqg
BOMはほしい
2023/02/22(水) 21:44:23.38ID:Z5Yb2D9Z
>>754
そのこころは?
2023/02/23(木) 02:06:56.75ID:CN6TeDKs
あって損はない
2023/02/23(木) 03:19:42.48ID:sj7+9G1y
これからは UTF−8 に統一されるんだから BOM は不要
過去の遺物になることが確定してるんだがら、可能な限り早く BOM 無しに移行せよ
2023/02/23(木) 08:50:00.45ID:2/POnIZR
>>757
わかった、俺もあなたとマイクロソフトのメモ帳を信じることにするw
759デフォルトの名無しさん
垢版 |
2023/02/23(木) 10:27:37.47ID:4H8fy78d
UTF-8にBOMは要らんし付けてはいけない
未だにBOM言うてるのは老害ゴミ
異体字セレクタとか観たら卒倒して死んじゃうんじゃないか
2023/02/23(木) 10:39:46.94ID:A0wb20Dk
いまだにBOM言ってるのはたしかに老害だな。signatureって言え。
2023/02/23(木) 11:04:10.21ID:9YiKsc0f
Excelにutf8食わすときに必要だし、Windows Searchもutf-8はBOM付き前提で、この状況は未だにかわってない
BOMなし教の人はWindow使ってないんじゃないの?w
2023/02/23(木) 12:50:39.71ID:WqT6xFqM
最終的にはBOM無しUTF-8に統一されるべきだと思うけど
移行期の今はまだBOM付きの方が現実的で無難
まずはWindowsやOffice等主要ツールがBOM無しUTF-8前提になってくれないと
2023/02/23(木) 13:56:15.28ID:QgGws+lN
>>762
天下のMicrosoft様がメモ帳の初期値をBOM無しUTF-8になさっておられる
ExcelとかWindows Searchとかもいずれ追随するんじゃねーの?
2023/02/23(木) 14:40:49.03ID:9YiKsc0f
>>763
世の中から既存のものを含めた全てのSJISテキストファイルが消えてなくなればBOMなし対応になるだろうが、果たして何年かかるかな
2023/02/23(木) 14:42:16.10ID:TD+FtAmO
レジストリスクリプトなど、windowsのユニコードが未だutf16leという現状で
utf8w/obomに統一とか時期尚早でしょ
2023/02/23(木) 16:34:16.53ID:GQ/uFi0l
BOMはSJISと関係なく作られたとおもうが?
2023/02/23(木) 17:00:14.57ID:sj7+9G1y
Windows のシステムロケールをUTF8に設定すればExcellとかOffice系もBOM無しでいけるんじゃないの?
2023/02/23(木) 17:55:58.87ID:PPu7W9/5
Excel の先頭BOMとかいう愚かな仕様も早く無くなってほしい
テキスト開くときにエンコーディングを指定できればいいだけだよね
2023/02/23(木) 19:31:24.94ID:sj7+9G1y
>>768
だからシステム・ロケール UTF8 に変更すれば BOM いらない。
お前らがシステム・ローケルをSJISに設定してSJIS優先にしてるから、それに従ってBOM無しをSJISとみなしてるだけ。
単に設定の問題。エクセルは悪くない
770デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:06:54.24ID:lGgWFFZW
BOMがあって困った経験はJavaしかないなあ
BOM付きを標準していいくらいじゃないかな
771デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:09:58.66ID:lGgWFFZW
Windowsの古い資源と共存するためにもUTF-8/16/32はBOM付きを必須にしたほうがいい
BOMを廃止して良いことなど何もないのが現実。今どきにBOMに対応してないほうがおかしい
2023/02/23(木) 22:30:34.98ID:sj7+9G1y
そもそもネットの通信でも、MacでもLinuxでもUTF-8にBOMつけたりしない。
UTF-8にBOMつけたのは過去のWindowsだけって時点でゴミなのわかるだろ。そのWindowsだってデフォルトでは付けない方向に舵を切った。
今時BOM必要って言ってるのは時代の変化についてこれなくて、過去の環境に生き続けたいロートルだけ。
773デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:59:31.84ID:lGgWFFZW
>>772
BOMがついているファイルを扱えないと機会損失にしかならない。
これは純粋なビジネス上の問題。LinuxとMacが少数派であることの理由のひとつにもなってる
774デフォルトの名無しさん
垢版 |
2023/02/23(木) 23:04:51.37ID:SB4P+kzn
>>772
UTF-8なんて使っているのが過去の環境に生き続けたい(ASCIIが素通しになる)ロートルだけだろ。
775デフォルトの名無しさん
垢版 |
2023/02/23(木) 23:09:41.34ID:lGgWFFZW
エンジン開発での競争に敗れた国がこぞってEV化を推進しようとするのと似た構図。
シェアを持っているWindowsには業務アプリケーション遺産に対する責任がある。負け組のLinuxとMacにはそれがない。
2023/02/23(木) 23:55:53.12ID:DZ2N6cRC
うわあ頭がおかしいのが複数湧いてる(ひょっとして同一人物の別IDだったりして)
意図的に間違ったことをあえて逆張りで言ってるのか本気で信じてるのかどっちなんだろう

UTF8を使うのがロートルって、こいつの言ってる「過去」ってまさかWindows以前のMS-DOSの時代のことか

あとUTF-16やUTF-32のテキストファイルなんて
規格上定義されてることは知ってるけど現物にお目にかかったことなんかないし
そもそもUTF-16やUTF-32なんて元々BOM必須だろうよ
過去の負の遺産がある以上アプリケーションとしてはBOMありファイルの読み込みには対応しなきゃダメだろうけどさ
今後作成するファイルでUTF-16/32を選ぶのは論外だし、UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
2023/02/24(金) 00:16:53.98ID:/JDec9CR
>>700
Windowsは内部的にはUTF16で統一されてるよ
そこはLinuxよりも優れた設計
2023/02/24(金) 00:17:46.23ID:/JDec9CR
> UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
BOMをつけないと他の文字コードとの区別ができなくて
文字化けしてしまう
2023/02/24(金) 00:19:03.22ID:/JDec9CR
だいたいUTF-8のBOMはUnicodeの正式な仕様なのだから
対応してないほうが悪い
2023/02/24(金) 00:22:30.88ID:/JDec9CR
LinuxとかmacOSとかUnixはUnicodeの対応が遅れていて
LANG=C.UTF-8でさえPOSIXで標準化されていない
Unicodeを正しく扱えないコマンドがある
2023/02/24(金) 00:50:08.17ID:rqUoHIRk
>>780
いったいいつの時代の話をしてるんだ
具体的なコマンド名とディストリビューションを挙げてみろや
2023/02/24(金) 01:46:20.35ID:MU0HtYsa
>>768 >>769
Mac上のExcelは、どうするのが正解?
以前「CSVで日本語が化けるぞ」と言われて、よくわからなかったからググったら「UTF-16なら
大丈夫」とあったので、そうしたら文句を言われなくなったのでよかったらしいw
Excel以外でCSVを使うとき、例えばpandasとかUTF-16でも大丈夫なんだっけ?
2023/02/24(金) 03:29:22.76ID:zsYMclLz
今後はファイルや外部通信はUTF-8がデフォルトになる
逆にいうとBOMついてないのは全てUTF-8とみなされる
よってUTF-8にBOMは不要
この単純なロジックが理解できないやつはかわいそう
2023/02/24(金) 06:23:20.57ID:BmT/WJ86
>>783
> 今後はファイルや外部通信はUTF-8がデフォルトになる

ならないよ。
誤った認識を前提に議論するのは意味がない。
スレのレベルが低下して無駄な書き込みが増えるだけなので、この話題はもうやめてくれ。
2023/02/24(金) 08:06:25.11ID:liuYehNm
文字コードを自動判別するためにBOMを使うってのがダメだな
BOMと思ったコードが違うエンコーディングの可能性があるんだから
Windows だけで閉じておいてほしいから、通信回線には流さないで
2023/02/24(金) 08:34:34.48ID:b+y25Gbd
>>777
> Windowsは内部的にはUTF16で統一されてるよ
ワイドキャラクタがUTF-16で統一されているという意味なら
Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ

ワイドキャラクタ以外アプリ等が独自に他の符号化方式を
採用している場合があるのも同じ
2023/02/24(金) 08:58:55.21ID:BmT/WJ86
>>785
そもそも誰も自動判別の正確性を担保できないからBOMがあるんだろ
Windowsを除外したビジネスで成り立つならそれでいいが、現実はそうじゃない。
他人が対応するのを待つのは無能な人のすることだよ。
2023/02/24(金) 09:04:15.26ID:BmT/WJ86
過去にプログラミングやったことない人が急にスマホ開発に配属されて、自分が対応するのではなく他人が対応するのを待ってるあたりに頭悪いのが伝わってくる。
プログラミングの才能ないし、むいてないからプログラミングから離れたほうがいいと思う。
2023/02/24(金) 12:43:37.42ID:8I4EMiY9
逆だね。BOMなんかじゃ判別できない
だって,FEってソーンのコードだもの
2023/02/24(金) 12:49:37.23ID:8I4EMiY9
Windows プログラマってほんとどうしてこんなに喧嘩を売るの?
世の中の文字コードがCP932 とUTF-16しかないと思っているよね
2023/02/24(金) 13:06:47.37ID:8I4EMiY9
もう少し正確にいうと,テキストファイルから
文字のエンコーディングを推測することはほとんど不可能
文字のエンコーディングはアウトオブバンドで送る必要がある
ISO2022 はエスケープシーケンスというアウトオブバンド転送を定義していた
ちゃんと定義するなら,UTF-8も Byte order mark ではなく
エンコーディングを指定するアウトオブバンドシーケンスを定義すべきという話
なんか議論が噛み合ってなかったので
2023/02/24(金) 13:10:51.59ID:8I4EMiY9
それで,Windows は先頭にBOM を入れるというのをアウトオブバンドで決めてる訳
だから,Windows で勝手にしてね。Windows 以外には送らないでって話
2023/02/24(金) 13:23:55.49ID:BmT/WJ86
「べき」論はよそでやってくれ。
2023/02/24(金) 13:24:26.82ID:5Y5XlszR
もうさ、結論出ないからこうしたら?

今後新たに作成するテキストファイルはBOM無しUTF-8で書く
今後のソフトはBOM有りBOM無し両方のUTF-8を読めるように作る
795デフォルトの名無しさん
垢版 |
2023/02/24(金) 13:53:37.06ID:BmT/WJ86
急にスレのレベルが下がった感じ。同じ人がID変えて書き込んでるんだろうか。
このスレに独り善がりな理想論を書き込む人は、プログラマ適性がないから転職しなさい。
2023/02/24(金) 13:59:12.56ID:zsYMclLz
>>792
Windowsではとか言ってる時点で国際化とか文字コードのこと全く知らない無知だろ。単に「日本語Windows」で使われてたCP932がUTF-8のBOMとかぶってなかっただけ。
英語Windowsで使われてたCP1252とかは EF BB BF にもそれぞれ文字が割当れらてるのでBOMとかあっても区別できばない。他の多くの文字コードもそうだし、CP932/SJIS なんかより断然現有の資産も多い。
おま国事情でたまたまうまくいってるだけなんて、一般化や標準化されるわけないだろ
2023/02/24(金) 14:02:43.91ID:zsYMclLz
>>796
792の返信にしたけど、792を批判したいわけではなくて、WindowsではBOMが便利という一般論を否定したかっただけ。
それは単なる日本しか知らない蛙仕草。
798デフォルトの名無しさん
垢版 |
2023/02/24(金) 14:02:58.25ID:BmT/WJ86
「ぼくのかんがえたさいきょうの文字コード処理パッチ適用」を自腹で開発して、自腹ですべての顧客のデバイスに入れればいいだけ。
すべてはカネ次第。カネを出す人が仕様を決めればいい。それだけ。
2023/02/24(金) 14:42:29.80ID:dKpgt1DZ
海外ではこうとか、本来こうあるべきとか、どうでも良いんだよ
日本語のテキストファイルを読み込むプログラムの仕様としてSJIS/UTF8自動判別にした場合、
確実に文字化けしないのはBOM付きUTF-8だけという事実は考慮すべき
2023/02/24(金) 15:02:03.28ID:xSIwGcb9
>>796
CP1252でEF BB BFって文字はあっても意味を成さない謎の文字列だし、極稀なパターン
完璧ではなくとも、実用上ほぼ問題ない精度で判別出来るでしょ
とうのWindowsがそういう風に利用してるのだし
2023/02/24(金) 15:30:37.37ID:BmT/WJ86
ïÿ¿を有意な先頭文字列とする利点と欠点を考えて決断すればいいだけのこと
2023/02/24(金) 16:49:11.30ID:3Zj7Ci+m
WindowsやエクセルとBOMは関係ないとおもうんだが
とくにマイクロソフトが開発したり、始めたわけではなく
採用前からBOMありのユニコードがあってたまたまBOMありフォーマットを使っただけでは?
ちがうのか?
2023/02/24(金) 18:05:09.63ID:zsYMclLz
>>799
そもそも自動判別は悪という流れになってることすら知らないんだな。
セキュリティホールやバグの温床になるので文字コードの自動判別はなくすのが世界の流れ。特に確実性のない自動判別は害悪でしかない。
2023/02/24(金) 18:22:32.64ID:BmT/WJ86
BOMを信じた時点でもはや自動判別ではないだろ。
2023/02/24(金) 19:12:21.37ID:/JDec9CR
>>786
> Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ
それでマウントとったつもりだろうが
Windows NTがUnicodeに対応したのは30年前だ
2023/02/24(金) 19:13:09.21ID:/JDec9CR
>>804
世界には多数の文字コードがあるわけで
完全な自動判別は不可能だって知らないの?
2023/02/24(金) 19:20:45.75ID:/JDec9CR
>>783
> 逆にいうとBOMついてないのは全てUTF-8とみなされる
> よってUTF-8にBOMは不要
あのー、Unicode以外の全ての文字コードにはBOMがついてないんですけど?
2023/02/24(金) 19:22:18.48ID:/JDec9CR
>>781
> 具体的なコマンド名とディストリビューションを挙げてみろや

echo あいうえお | mawk '{ print length($0) }'
15
2023/02/24(金) 19:23:31.95ID:vCNNlHyw
まだunicode以外の文字コードを使う気かよ
化石なん?
2023/02/24(金) 19:23:32.40ID:/JDec9CR
>>781
echo あいうえお | dash -c 'read line; echo ${#line}'
15
2023/02/24(金) 19:24:26.90ID:/JDec9CR
>>809
今すぐこれまでの資産をUnicodeに変換してみせろよw
2023/02/24(金) 19:28:28.37ID:3Zj7Ci+m
UTF-8はPlan 9かららしい

Linuxに勝てなかったPlan 9 2009/02/09
「Plan 9」はUNIXが生まれたベル研究所で、次世代UNIXとして開発されていた分散OSだ。
UNIXやC言語を生み出したケン・トンプソン、デニス・リッチー、ロブ・パイクらのチームが、当時UNIXが抱えていた限界を打ち破るために、ネットワークやGUIを最初からUNIXの設計思想に基づいて取り入れた先進的なOSだった。

UNIXの大きな特徴として、デバイスをファイルにマッピングして抽象化するというものがある。ところが、こうした初期設計時の抽象化から漏れるAPIが増えた。
そうして漏れつつあった各種リソースを、再びUNIX的なファイルシステムのツリーにマップし、抽象度と統一性の高いインターフェイスを用意したのがPlan 9だった。

ファイルとして扱えるのは一般に想像するようなハードウェアデバイスだけではなく、あらゆるリソースが対象となった。
TCP/IPなどのネットワーク関連の操作も「/net」というディレクトリを使って行うなど徹底していた。

Plan 9はなぜ失敗したのか?
マーケティングに熱心でなかったからとか、さまざまな理由付けが可能だが、Plan 9が普及しなかった理由は結局のところ、旧来のUNIXを置き換えるほどには先進的ではなかったからだ、というのがレイモンド氏の答えだ。
Plan 9に比べれば、確かにUNIXはきしみ音が聞こえてガタピシいうし、明らかにさび付いたところもあるのだが、そのポジションを維持するために必要な仕事はちゃんとこなせていた、という。

LinuxやBSD系UNIXには、Plan 9由来の機能がいくつか取り込まれている。
稼働中のプロセスをモニタしたり操作するための「/proc」と呼ばれるファイルシステムは、Plan 9のものだし、
Linuxでスレッドを生成するシステムコール「clone」は、レイモンド氏によればPlan 9の「rfork」をモデルにしているという。
すべてをファイルのように扱うという意味でいえば、LinuxのFUSEもPlan 9の影響下にある。
現在、FUSEを使ったファイルシステムには、ftpfsはもちろん、flickrfsやBloggerFS、TracFSなどさまざまな実装がある。
今やOSばかりかインターネット全体にも利用範囲を広げた感があるUTF-8も、Plan 9のために考案されたエンコーディングだという。
https://atmarkit.itmedia.co.jp/news/analysis/200902/09/future.html
2023/02/24(金) 19:28:34.50ID:/JDec9CR
>>781
echo あいうえお | cut -b 4-
いうえお
2023/02/24(金) 19:30:00.43ID:/JDec9CR
間違えた

echo あいうえお | cut -c 4-
いうえお
2023/02/24(金) 19:36:38.85ID:EbaJyZ/f
業界人ですら認識ちがいのある文字コード。素人に説明するの超絶に面倒。
2023/02/24(金) 19:46:01.57ID:liuYehNm
エンコーディングの話をしているのに Unicode とは?
2023/02/24(金) 21:08:47.90ID:Ww2YDdfR
誰も>>794はスルーするんだな?w
2023/02/24(金) 21:53:46.51ID:h0ZFyNU2
流れからしてピントのずれたレスに反応するほどのことでもないかなって
2023/02/24(金) 22:24:35.19ID:zsYMclLz
>>814
そもそも -c オプションは現在 -b (バイト指定)と同じ動きというのが仕様なので文字コードもくそもない。
マニュアル嫁。
2023/02/24(金) 22:30:50.23ID:zsYMclLz
>>815
いや、このスレは素人が跋扈してるだけに過ぎないと思うが。
文字コードやネット・プロトコルの専門家で、「今後は外部は UTF-8 がデフォルト」って以外の意見は聞いたことがない。
2023/02/24(金) 23:16:35.23ID:/JDec9CR
>>817
スルーしてないだろ
ちゃんと読めよ
わざとか?
2023/02/24(金) 23:18:05.18ID:/JDec9CR
>>819
どこにも同じ動きとは書いていない

https://pubs.opengroup.org/onlinepubs/9699919799/utilities/cut.html

-b list
Cut based on a list of bytes. Each selected byte shall be output unless the -n option is also specified.
It shall not be an error to select bytes not present in the input line.

-c list
Cut based on a list of characters. Each selected character shall be output.
It shall not be an error to select characters not present in the input line.
2023/02/24(金) 23:31:32.12ID:zsYMclLz
>>822
linux なら linux のマニュアル嫁。
2023/02/25(土) 00:00:07.97ID:dveJDxzx
>>823
お前か誰かしらんが、どのディストリでUnicodeに
対応してないって聞かれたから
Linuxは全て対応してないと答えたんだが?

Linuxは対応してないといった俺の指摘に対して
Linuxは対応してないのが仕様だと答えるアホ

macOSのcutはちゃんとUnicodeに対応してる
対応してないディストリを聞かれたから答えただけだ
2023/02/25(土) 00:01:38.57ID:dveJDxzx
それにmawkやdashが対応してないという話からも逃げてるな
Unicodeに完全対応してねーんだよ
2023/02/25(土) 01:08:13.97ID:IGzyIaR2
>>825
話の流れを見る限り、お前が内部コードと外部コードの区別がついてないんじゃないか?
2023/02/25(土) 01:34:53.03ID:pcyV0/Fb
macOSはUNIXといってるからawkもちゃんとロケール対応してるべき? SUSのバージョンにもよる?
gawkは対応してるみたいね
2023/02/25(土) 06:59:37.00ID:dveJDxzx
>>826
付いているし、そんな質問されても意味がない
2023/02/25(土) 08:46:26.36ID:Rl2aLkT8
>>821
現実的で一番良い結論だと思うw
2023/02/25(土) 08:48:27.98ID:dveJDxzx
現実的っていうのはEUC-JPで書かれた
ウェブサイトが見れなくなるってこと?
2023/02/25(土) 10:28:54.79ID:+wSAdwQP
文字のエンコーディングは通信相手同士で取り決めろということ
相手がEUC-JPで送ってくるならこっちもEUC-JPで受け取れば良いこと
2023/02/25(土) 10:44:41.98ID:IGzyIaR2
今後はファイルや外部通信はUTF-8がデフォルトになる
デフォルトの意味が理解できないド素人がいるみたいなので書いておくと
「アプリは特に文字コードの指定が無かった場合はUTF-8で出力するべき、指定が無かった場合はUTF-8として読み込むべきである」ということ

つまりBOMが無くてもUTF-8とみなすべきなので、UTF-8にBOMは不要
833デフォルトの名無しさん
垢版 |
2023/02/25(土) 12:47:05.63ID:PU7vc6R3
>>832
お前が気まぐれに「不要」と宣言したら、他人は良きように計らってくれるとでも思っているのか?
BOM付き文字列が送り込まれた時にどのように処理するかを決めないことには、なにも進まないぞ
2023/02/25(土) 14:33:50.87ID:mpikKEOw
通信はともかく、問題は過去に作成された膨大な数のUTF-8以外のファイルだ
とりあえず開いてみて、文字化けしたらエンコードを指定して開き直してみろ?
そんな対応じゃクレームが大量に来るし、PC苦手な人じゃ教わっても対応出来ないだろ
2023/02/25(土) 15:16:11.43ID:k0PvGKB9
ロバストネス原則(ポステルの法則)
https://makitani.net/shimauma/robustness-principle

ロバストネス原則(robustness principle)とは、「あなたがすることは厳密に、あなたが他人から受けることには寛容に (be conservative in what you do, be liberal in what you accept from others.)」というシステムやソフトウェアの開発における考え方、開発指針のこと。「送信は厳密に、受信は寛容に」とも言い換えられる。「堅牢性原則」。

他のシステムとの間で通信を行う際、処理をして送信する側は厳格なデータの仕様に準拠するべきだが、利用するユーザー側には入力データの多様性を許容して使い勝手を損なわないようにするべきである、というものである。

アメリカのコンピューター科学者でインターネットの創始者の1人であるジョン・ポステル(Jonathan Bruce Postel)が初期のTCPを規定したRFC 793において示した一節であり、それが一般化され知られるようになったものである。ジョン・ポステルにちなんで「ポステルの法則 (Postel’s law)」とも呼ばれる。
836デフォルトの名無しさん
垢版 |
2023/02/25(土) 15:34:51.75ID:+JwPKi/T
禿丸最強でFA
2023/02/25(土) 16:51:45.73ID:dveJDxzx
>>831
だからUTF-8を前提にできないってことだろ
2023/02/25(土) 16:52:21.29ID:dveJDxzx
>>832
> 今後はファイルや外部通信はUTF-8がデフォルトになる

だーかーら、既存のHTMLとかでEUC-JPとかが使われてるから
UTF-8以外を切り捨てられないっての
2023/02/25(土) 18:25:42.81ID:p5DpNAy5
アップデートされずEUC-JPのまま捨て置かれたドキュメントの価値などもはや「歴史的な」価値しかない
Webブラウザで閲覧できれば十分、新しく作るシステムでいまさら対応する必要性など皆無

2000年前後の知識しか持ち合わせていない老害がいくらギャーギャー騒ごうとも
時代遅れなエンコーディングに対応するような愚を犯してはならない
毅然としてUTF-8以外を切り捨てるべし
840デフォルトの名無しさん
垢版 |
2023/02/25(土) 19:05:12.59ID:PU7vc6R3
>>839みたいに「切り捨てる」とか強い表現を使う人は、既得権からあぶれた失うものがない負け組が好んで使う言葉。
ネットでは威勢が良く見えても現実世界では切り捨てる側ではなく切り捨てられる側。ルサンチマンを抱えている。
841デフォルトの名無しさん
垢版 |
2023/02/25(土) 19:12:22.66ID:PU7vc6R3
「~べき」とか語っていいのはカネを出す側であって、「~べき」はカネで雇われる側にすぎない技術者が使っていい表現ではない。
2023/02/25(土) 19:43:50.59ID:pcyV0/Fb
>>835
そういう歴史的なコンテクストでいうならRFC 793じゃなくて761を引用すべきでしょ
2023/02/25(土) 21:32:29.38ID:bBUOoOco
よりによってShift_JISの5chでイキってて笑っちゃうんすよね
2023/02/25(土) 21:46:01.53ID:vjs83zv7
🤔
2023/02/25(土) 22:09:35.17ID:SbO0y0c6
ユニコード規格 Unicode Standard にも UTF-8 の BOM は付けても良い(may)けど、非推奨(not recommended)って明記されてるのに、どうしても付けさせたいや奴がいるのはわかった
2023/02/25(土) 22:43:56.85ID:dveJDxzx
>>839
だから歴史的な価値が高いものをお前は捨てるのかって言ってるんだよ
2023/02/25(土) 22:44:39.12ID:dveJDxzx
>>845
非推奨だけど付けて良いわけで何の問題もないだろ
2023/02/25(土) 22:52:11.76ID:IGzyIaR2
>>847
だから、お前が一人でつける分には勝手にしろ
つけるべきか聞かれたら、「非推奨なのでつけるな」が正解。
2023/02/25(土) 23:48:54.66ID:m4LfFP+9
つけたいじゃなくて、対応できないと困ると言ってるだけでしょう
2023/02/26(日) 01:34:30.84ID:cEWS884H
つまり入力をどするかは置いといて、出力にがBOMはつけるなでFA?
■ このスレッドは過去ログ倉庫に格納されています