在python裡了HTMLParser 不會從錯誤中 recover回來
也就是說 parse 到了一個不合法的 HTML語法
它就會直接丟出exception了
然後就不會繼續parse下去了
但對於這個世界存在著一大堆不喜歡照規定的網頁
目前分類:Python (1)
- Nov 07 Sun 2010 09:15
HTMLParser using python on Google App Engine
在python裡了HTMLParser 不會從錯誤中 recover回來
也就是說 parse 到了一個不合法的 HTML語法
它就會直接丟出exception了
然後就不會繼續parse下去了
但對於這個世界存在著一大堆不喜歡照規定的網頁