>>826
特定の決まったサイトなら必要なところだけ取り出して比べたら?

対象サイトが多すぎて(アフィ?)一個一個書いてられないなら汎用的な記事抽出系のライブラリを使うといい
FirefoxやSafariで使われてるReadabilityが有名