C++ HTMLパーサーおじさんのはどんな機能があるの?
入力がHTML文字列で出力がDOMツリー?
HTMLって一部のタグを省略できたりするじゃん?
出力されるDOMツリーが正規化される(省略されたタグが適切に構成される)ならちょっと興味がある
あと入力されるHTML文字列自体がおかしい場合はどうなる?