文字コード総合スレ part15
1デフォルトの名無しさん
2024/08/17(土) 11:18:00.01ID:VHa7+i59 文字コードについて語り合うスレです
474デフォルトの名無しさん
2025/11/19(水) 19:08:44.33ID:ZdmqM0ve475デフォルトの名無しさん
2025/11/27(木) 22:04:02.60ID:GJJrzAsD AIにテキストが読み取られるのを防ぐために目に見えないUnicode文字を挿入する「Gibberifier」
https://gigazine.net/news/20251126-gibberifier-stun-llm-random-unicode/
文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。
Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です
https://gigazine.net/news/20251126-gibberifier-stun-llm-random-unicode/
文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。
Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です
476デフォルトの名無しさん
2025/11/27(木) 22:14:49.16ID:iCPj88WE HTMLや画像でも文章認識できるのは前処理してるからで
こんなもん瞬で対策されておわりでしょ
こんなもん瞬で対策されておわりでしょ
477デフォルトの名無しさん
2025/12/10(水) 11:51:06.42ID:yiGhfSNm 皆さんUTF-8 code pageでのテストしましょう
Fix corrupted file loading on Windows system using the full UTF-8 code page. (Fix #17234)
https://github.com/notepad-plus-plus/notepad-plus-plus/issues/17234
Fix corrupted file loading on Windows system using the full UTF-8 code page. (Fix #17234)
https://github.com/notepad-plus-plus/notepad-plus-plus/issues/17234
478デフォルトの名無しさん
2025/12/10(水) 12:14:52.51ID:bincyYU2 Windows で BOM 付き UTF-8 使った時にバグるのか。
ちゃんと実装できないんなら滅んでしまえ
ちゃんと実装できないんなら滅んでしまえ
479デフォルトの名無しさん
2025/12/10(水) 21:28:59.81ID:iFFXWT3a NPP v8.8.6 32bitでは再現出来なかった
480デフォルトの名無しさん
2025/12/11(木) 00:51:43.45ID:Y1AYgkFO >>479
多分英語版の Windows のバグ
日本語版の Windows ならデフォルトロケールを英語 codepage 1252 に変更しないと再現しないと思う
SJISにはSJISで別の文字で類似バグがあったりするかもしれないけど
多分英語版の Windows のバグ
日本語版の Windows ならデフォルトロケールを英語 codepage 1252 に変更しないと再現しないと思う
SJISにはSJISで別の文字で類似バグがあったりするかもしれないけど
481デフォルトの名無しさん
2025/12/11(木) 04:34:26.04ID:m6irsJON そういえば少し前ベンダーから送られてくるログがやたら文字化けしていて
うんざりしたが、ちゃんと見てないが関係あるのかなあ
データ的にWindows上でSJISとUTF-8を混ぜこぜにしてる感じだったが
しかしいつまでこの手の問題が続くんだろ
うんざりしたが、ちゃんと見てないが関係あるのかなあ
データ的にWindows上でSJISとUTF-8を混ぜこぜにしてる感じだったが
しかしいつまでこの手の問題が続くんだろ
482デフォルトの名無しさん
2025/12/11(木) 06:20:41.73ID:Dn+T9u5Z ちゃんと見て原因を特定しないお前のような奴がいる限り無理だろ
レスを投稿する
ニュース
- 青森 緊急地震速報 [ぐれ★]
- 「偽サッチャー」「自滅的」「時代遅れ」 高市首相の経済政策を海外メディアが酷評 ★3 [蚤の市★]
- ミス・ユニバース フィンランド代表の「つり目」写真が波紋… 本人釈明も批判やまず 協会謝罪「徹底的に検証」へ★2 [冬月記者★]
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★4 [蚤の市★]
- 東京都「都民の税金1.5兆円が国に奪われている」「全国に分配されている」に地方民ブチギレ ★2 [Hitzeschleier★]
- 【速報】衆院議員定数削減法案、自民・維新が今国会成立見送りで調整 [Hitzeschleier★]
- 地蔵 [268244553]
- 日本、高市が辞任しても日中関係を改善させられそうな首相候補がいなくて詰む [329271814]
- 中国「台湾は一つの中国」日本「台湾は一つの中国」高市「中国が武力により台湾を併合したら武力介入する」なにこれ? [472617201]
- 【速報】エピック無料配布、ホグワーツレガシーWWWWWWWWWWWWWWW🏡
- 12/12 12:12:12.12に12レス目を狙うスレ
- 「ごま油」👈何に使うんだこれ [394133584]
