在python裡了HTMLParser 不會從錯誤中 recover回來

也就是說 parse 到了一個不合法的 HTML語法

它就會直接丟出exception了

然後就不會繼續parse下去了

但對於這個世界存在著一大堆不喜歡照規定的網頁

jpsix 發表在 痞客邦 留言(0) 人氣()