WEB上のHTMLやらXMLを読み込んで自動でデータ収集するソフトを作ってるけど
ちゃんとタグで閉じてなかったりへんな文字が入ってたりするページが多すぎ。
結局手動で処理する部分は必要だね。