探検
文字コード総合スレ part15
1デフォルトの名無しさん
2024/08/17(土) 11:18:00.01ID:VHa7+i59 文字コードについて語り合うスレです
475デフォルトの名無しさん
2025/11/27(木) 22:04:02.60ID:GJJrzAsD AIにテキストが読み取られるのを防ぐために目に見えないUnicode文字を挿入する「Gibberifier」
https://gigazine.net/news/20251126-gibberifier-stun-llm-random-unicode/
文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。
Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です
https://gigazine.net/news/20251126-gibberifier-stun-llm-random-unicode/
文字コードの標準規格であるUnicodeには世界中で使われるさまざまな文字が登録されていますが、中には「目に見えないUnicode文字」も多数含まれています。また、そのうちの一部は目に見えない「ゼロ幅文字」となっています。
Gibberifierは入力したテキストの文字間に、ゼロ幅文字を挿入するツールです。目には見えないもののコンピューター上では存在しているゼロ幅文字を挿入することで、テキストの見た目はそのままに文字数が大幅に増加し、難読化されることでAIによる読み取りを防ぐとのこと。また、実際の文字数が見かけより大幅に増えるため、AIユーザーのトークンを無駄遣いさせることも可能です
476デフォルトの名無しさん
2025/11/27(木) 22:14:49.16ID:iCPj88WE HTMLや画像でも文章認識できるのは前処理してるからで
こんなもん瞬で対策されておわりでしょ
こんなもん瞬で対策されておわりでしょ
477デフォルトの名無しさん
2025/12/10(水) 11:51:06.42ID:yiGhfSNm 皆さんUTF-8 code pageでのテストしましょう
Fix corrupted file loading on Windows system using the full UTF-8 code page. (Fix #17234)
https://github.com/notepad-plus-plus/notepad-plus-plus/issues/17234
Fix corrupted file loading on Windows system using the full UTF-8 code page. (Fix #17234)
https://github.com/notepad-plus-plus/notepad-plus-plus/issues/17234
478デフォルトの名無しさん
2025/12/10(水) 12:14:52.51ID:bincyYU2 Windows で BOM 付き UTF-8 使った時にバグるのか。
ちゃんと実装できないんなら滅んでしまえ
ちゃんと実装できないんなら滅んでしまえ
479デフォルトの名無しさん
2025/12/10(水) 21:28:59.81ID:iFFXWT3a NPP v8.8.6 32bitでは再現出来なかった
480デフォルトの名無しさん
2025/12/11(木) 00:51:43.45ID:Y1AYgkFO >>479
多分英語版の Windows のバグ
日本語版の Windows ならデフォルトロケールを英語 codepage 1252 に変更しないと再現しないと思う
SJISにはSJISで別の文字で類似バグがあったりするかもしれないけど
多分英語版の Windows のバグ
日本語版の Windows ならデフォルトロケールを英語 codepage 1252 に変更しないと再現しないと思う
SJISにはSJISで別の文字で類似バグがあったりするかもしれないけど
481デフォルトの名無しさん
2025/12/11(木) 04:34:26.04ID:m6irsJON そういえば少し前ベンダーから送られてくるログがやたら文字化けしていて
うんざりしたが、ちゃんと見てないが関係あるのかなあ
データ的にWindows上でSJISとUTF-8を混ぜこぜにしてる感じだったが
しかしいつまでこの手の問題が続くんだろ
うんざりしたが、ちゃんと見てないが関係あるのかなあ
データ的にWindows上でSJISとUTF-8を混ぜこぜにしてる感じだったが
しかしいつまでこの手の問題が続くんだろ
482デフォルトの名無しさん
2025/12/11(木) 06:20:41.73ID:Dn+T9u5Z ちゃんと見て原因を特定しないお前のような奴がいる限り無理だろ
レスを投稿する
ニュース
- 【STARTO ENTERTAINMENT】SUPER EIGHTの横山裕、フジ『ドッキリGP』ロケで全治2ヶ月の重傷 [Ailuropoda melanoleuca★]
- 【食】「シャウエッセンは焼くべからず」暗黙のルールを破り売上高過去最高…日本ハム社員たちが「夜味」にかけた情熱 [ぐれ★]
- 【おこめ券】物価高対策の“おこめ券”全米販は1枚477円で販売へ 鈴木農水大臣「国民の皆様に活用いただきやすいよう工夫いただいた」★2 [ぐれ★]
- 【話題】好きな鍋は?! 「寄せ鍋」「キムチ鍋」「水炊き」「もつ鍋」「豆乳鍋」「ちゃんこ鍋」「ごま坦々鍋」「トマト鍋」 [ひぃぃ★]
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★5 [蚤の市★]
- 「偽サッチャー」「自滅的」「時代遅れ」 高市首相の経済政策を海外メディアが酷評 ★5 [蚤の市★]
- SBI新生銀行「預金が1兆円集まったら預金金利を4%にします。1超超えたらエントリー締め切るよ?」 [784715804]
- ムミィ🥺いる❓🏡
- 鈴木農水大臣「物価高対策でお米券1枚477円で販売します☺」 [931948549]
- Pornhub「米国内で最もシコられたキャラはチュンリー、2B、そして…」 [347751896]
- 人生で初めてキャラメルラテ飲んだ
- 【悲報】Z世代気く「東京に住むより横浜市や千葉市とか田舎に住んだ方がコスパいい」「千葉市なら3~4000万円で新築一戸建てが買える [483447288]
