howie6879 / liuli

一站式构建多源、干净、个性化的阅读环境(Build a multi-source, clean and personalized reading environment in one stop.)
https://liuli.io
Apache License 2.0
889 stars 108 forks source link

希望能在RSS订阅里面包含~原始文章链接 #53

Closed CenBoMin closed 2 years ago

CenBoMin commented 2 years ago

image

目前打算写一个脚本,通过全文获取API来去获取全文,在根据自定义的格式寄给我的gmail...这样除了newsletter之外,一些RSS订阅和微信公众号都可以直接在spark阅读...

然而我找到的全文获取的付费api要求有些高,RSS里面的link格式不行,就算经过decodeURIComponent函数转换也还是格式不正确。

如果RSS订阅有原始网页的连接,就可以抓取用原始链接来获取全文而不会出错!

希望作者可以给与支持!感谢:)

howie6879 commented 2 years ago

mongodb已经存储了全文,你直接拿就行,没必要那么麻烦自己重新抓取。

CenBoMin commented 2 years ago

谢谢!我在研究研究!

YsMox commented 2 years ago

mongodb已经存储了全文,你直接拿就行,没必要那么麻烦自己重新抓取。

<feed xmlns="http://www.w3.org/2005/Atom">
<id>腾讯技术</id>
<title>腾讯技术</title>
<updated>2022-05-16T17:54:22.438329+00:00</updated>
<author>
<name>Liuli</name>
</author>
<generator uri="https://github.com/liuli-io/liuli" version="v0.2.4">Liuli</generator>
<entry>
<id>liuli_wechat - 腾讯技术 - 遇到困难,你可以喊“救命”</id>
<title>遇到困难,你可以喊“救命” </title>
<updated>2022-05-16T17:54:22.438643+00:00</updated>
<author>
<name>liuli_wechat - 鹅厂程序员</name>
</author>
<content/>
<link href="/liuli_wechat/腾讯技术/%E9%81%87%E5%88%B0%E5%9B%B0%E9%9A%BE%EF%BC%8C%E4%BD%A0%E5%8F%AF%E4%BB%A5%E5%96%8A%E2%80%9C%E6%95%91%E5%91%BD%E2%80%9D.html" rel="alternate"/>
<published>2022-05-13T13:18:27+08:00</published>
</entry>
</feed>

@howie6879 以上是我使用该项目生成的rss信息。 请问要如何才能获得原始文章链接?希望在中能显示原始文章的链接?请问要如何设置?谢谢

howie6879 commented 2 years ago

@YsMox

可以在配置文件rss处理器部分修改参数如下:

{
            "func": "to_rss",
            "doc_source_list": ["liuli_wechat"],
            "link_source": "self"

        }

注意:如果你的来源是搜狗微信,那么链接有效期只有2h,所以建议用备份链接,不会失效

YsMox commented 2 years ago

您发给我的信件已经收到。Your letter to me has been received.