まだ作っていないんだけど、DOM木のテキストノードだけを選択的に巡回し、逆参照が文字を返すイテレータもアイデアとしては考えてる。
これで、木に対してstd::regexが使えるんじゃないかと。
作ってないから知らんけど。

どや?べんりやろ?