IshtarTang / lofterSpider

lofter的爬虫,爬所有点过的喜欢/推荐/tag、爬取个人主页。
148 stars 17 forks source link

使用 html2text 库修复正文黑体不能正常显示的情况 #5

Closed lyc8503 closed 2 years ago

lyc8503 commented 2 years ago

原程序在爬取正文含有特殊格式的字体(下划线, 黑体, 斜体)时, 会直接忽略这些文字. 可使用 html2text 库完整地将 html 转为文本格式 (markdown-style).