>>387
むかしむかしトライデントのパーサーが糞すぎて
IEでしか読めないhtmlが出回りだしたころNNがHTMLの正規化という方法を考案してな。
1)必ず必要なものはパース前に存在すると仮定する
2)パース中に必要になったものはとりあえず付け足してみる
3)エラーでパースを止めずに無視して進める
とりあえずこれやれば多少は読めるよ。
まあこれだけだといわゆるお尻pの処理がめんどくさいんだが。
HotJavaのパーサーですら実装してるからJDKのソース読んでみ。
ちなみにHTMLの正規化という単語はもう死語だからググっても出てこないよ。
実装して当たり前くらいに浸透してるからソース読んだ方が早い。
<XML総合 part="3"/>
■ このスレッドは過去ログ倉庫に格納されています
396デフォルトの名無しさん
2009/09/12(土) 03:33:34■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 「おこめ券は米以外の食品も買える。効果的な活用を」 地元で農水相 [山形県] [少考さん★]
- 【速報】「女芸人No.1決定戦 THE W」9代目女王にニッチェ! 7年ぶり3度目で悲願の優勝 [牛丼★]
- 【芸能】『女芸人No.1決定戦THE W』 粗品が最後にバッサリ「優勝賞金1000万円にしてはレベル低い大会」 [冬月記者★]
- 今年の流行語大賞 『働いて働いて働いてまいります』が受賞で不快感… 過労自殺の遺族らが会見「家族にむち打つような行為だ」 [冬月記者★]
- 【東京】「家族で話題にして」 “世田谷一家殺害から25年 警視庁が呼びかけ [煮卵★]
- 【広島】ペルー女性の国保加入を誤って認め、福山市が医療費484万円を肩代わりするミス…入院して手術を受ける [ぐれ★]
