cdhigh / KindleEar

Aggregates RSS and web content(Calibre recipe), sends to Kindle, and includes an e-ink optimized online reader.
http://cdhigh.github.io/KindleEar/
MIT License
2.73k stars 630 forks source link

網頁文章沒有圖片 #623

Closed ksc4313 closed 3 years ago

ksc4313 commented 3 years ago

我建立一個py檔來抓取多個RSS網站的文章,文章內容都正常但就是都沒有圖片,請問有辦法解決嗎?

cdhigh commented 3 years ago

可能被自动过滤了,可以将 fulltext_by_readability 设置为false,然后使用keep_only_tags,remove_tags_after,remove_tags_before,remove_tags等属性定制

或如果图像有特定的tag,可以在positive_classes属性里添加,也可以保留图片。