Open jay1803 opened 6 years ago
https://github.com/pirate/bookmark-archiver
之前看到这个,是个本地服务,在保存网页的时候可以缓存一份原始的 HTML 文件,网页截图,PDF。
不过这个的问题其实也不太好搞,因为如果是文章的话,我可能更需要类似于 Read it later 那样的服务,把文章内容爬取下来。如果是 YouTube 的话,难道要保存视频?储存是个问题。
而且如何识别是否是文章 URL 也是个问题。
Zotero 好像也用过两天,太过于复杂了。现在就是 Instapaper 结合 群晖 自带的 Notes 来做网页保存。
Bookmark-archiver 不知道对于微信公众号文章这种需要预先加载 JS 的页面效果如何。
Mercury 对公众号的爬取还算可以,昨天试了个 f43 感觉效果比 Mercury 要好。
还有一个是 https://github.com/codelucas/newspaper ,我之前是用 Newspaper 和 Mercury 互补。
缓存页面还有个问题,就是这个页面如果需要登录,那就还需要处理认证的问题。
缓存页面还有个问题,就是这个页面如果需要登录,那就还需要处理认证的问题。
Evernote Cliper 就不需要,因为是直接现场获取网页信息,实现比较复杂
这种缓存页面有两个比较优秀的功能产品: