Bystroushaak / pyDHTMLParser

Lightweight HTML/XML parser for quick and dirty web scraping.
MIT License
6 stars 3 forks source link

Add some way how to recover from miswritten tags #16

Closed Bystroushaak closed 9 years ago

Bystroushaak commented 9 years ago
<code>Já vím... je to příliž krátké a chybí diakritika - je to můj první
 článek kterej jsem kdy o Linux psal.</code
<!-- -->
<div class="rating">here is the rating</div>

This breaks also the <div> after the broken </code tag.