HTMLや画像でも文章認識できるのは前処理してるからで
こんなもん瞬で対策されておわりでしょ