暇つぶしに論文漁ったらこんなのが。
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.108.9959&rep=rep1&type=pdf
http://www.tei-c.org/release/doc/tei-p5-doc/en/html/NH.html

Overlap(上記の下線と太線の例の様なケース)をどのようにSGMLや
XMLで表現するか、「技」の事例が揃ってます。

いや、苦労しているなぁ、皆さん(笑)。
個人的には次のようなアプローチが一番面白かった。

HTML is <U_start/>precisely <B_start/>what<U_end/> we were trying to PREVENT.<B_end/>