kawazrepos / Kawaz3rd

All your game are belong to us
http://www.kawaz.org/
12 stars 9 forks source link

Use lxml parsing XML #1165

Closed giginet closed 7 years ago

giginet commented 7 years ago

BeautifulSoup 4.6.0でテストが落ちていたのを修正した。

ものすごく辛い問題だった。

  1. BeautifulSoup 4.6.0でHTMLパーサーのバグが直った。 その結果、HTML5から追加されたlinkタグの扱いが変わった

http://bazaar.launchpad.net/~leonardr/beautifulsoup/bs4/view/head:/NEWS.txt#L13

  1. はてなブログのRSSがlinkという値を持っている
  2. Kawazポータルのコードがクソで、XMLのパースをHTMLパーサーで行っていた
  3. そのため、1の仕様変更により、RSSフィードが正常にパースできずにテストが落ちていた

対策として、lxmlをインストールして、そちらを使ってXMLをパースするようにした。

https://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-a-parser

@lambdalisue レビューお願いします

coveralls commented 7 years ago

Coverage Status

Coverage remained the same at 97.696% when pulling 3d7a5c9f8e34abffd716710440feb994a7f23c6a on fix-hatenablog-parser into 289857ce84713d4d35e25a5e445ac867d89db653 on develop.

coveralls commented 7 years ago

Coverage Status

Coverage remained the same at 97.696% when pulling 3d7a5c9f8e34abffd716710440feb994a7f23c6a on fix-hatenablog-parser into 289857ce84713d4d35e25a5e445ac867d89db653 on develop.