Closed Spaiol closed 5 months ago
如果是这个错误的话,
此页面使用的picture 是html5新标签,可能kindle 不支持,待升级kindleear 将其转换为img
谢谢,期待升级
推送错误的原因是kindle不支持svg内嵌的title标签。 不过我发现svg在kindle上真的很烦人,因为网站上的svg大多数是图标,在kindle上会自动放大,占满一屏,特别丑的同时对阅读也是没有价值的。 所以除了修改这个bug,我干脆默认将svg去掉了。 如果有某些rss需要svg图像,可以在网页的calibre选项中填写 {"keep_svg":true}
代码已更新,如果是GAE部署,可以直接部署即可使用新代码。
如果是Docker,可以等我之后更新Docker镜像,因为昨天才更新了一个大版本,支持在Kindle上在线阅读而不用推送到Kindle。
更新:Docker也已更新,还是使用3.1.0标签
这个bug更改后south china morning post可以接收到了,不过还是有问题,标题前面会有一些无关的信息,看起来有点乱。另一个问题是有些print edition的recipe文章标题抓不到,标题不在正文中显示,只能在功能框下面显示,在此次更新前是没有这种问题的
是的,我修改了title的正则表达式,因为之前有些标题提取不出来
你出问题的是哪个源,我看一下
我订了washington post 和the hindu两个的print edition,里面多数标题是正常的,有的标题有问题。再就是south china morning post 的问题。the economist虽然文章不缺,但都不是全文,只有两三段。另外有些recipe没有推送内容,推出来是0,例如南方周末,这种挺多的
这几个我都测试了,没有明显问题,你说的有的标题有问题,我没有找到,可以给出有问题的文章和文章的url吗?
至于文章不全的问题,KindleEar算是一个通用爬虫项目,面对着复杂的网络条件,具有非常大的挑战。
总的来说,只能碰到一个问题解决一个问题,估计一行一旦AI成熟和足够便宜,使用AI提取正文应该是一个趋势。 现在的AI要不太贵,要不上下文长度不够,所以很多事情还需要等等。
结论就是,KindleEar做为一个业余项目,我会尽力,但最终用户也不能不切实际的寄予太高的期望,一个问题一个问题的解决就好。
今天的华盛顿邮报所有front page的文章,目录中的标题都在工具栏下边显示,文章正文的标题更类似于小标题。the hindu的第一篇文章,也是同样的,只不过正文标题只写了today's paper news,breaking news,top headlines-the hindu businessline,这就显然不是小标题了。
其实我觉得不改也没什么的,并不影响阅读,既然已经知道标题了,也没必要纠结在哪个位置
你能给我rss地址和截图吗,我测试发现没你所说的问题,不管在电脑上看还是在kindle上看,我怀疑我们所说的不是同一个rss。 https://feedx.net/rss/washingtonpost.xml
谢谢,问题已解决,辛苦您了!
咱们说的确实不是一个,feedx的源没有任何问题。我说的是recipe里面的源。 能看出区别吧,目录里面的标题和功能框下面的标题是一致的,但是和正文中的标题是不一致的。截图为,the hindu的目录第一篇文章,washington post的目录第二篇文章
你查看recipe的源代码就可以知道了,这个排版是recipe代码中故意这样写的(体现这个recipe作者的某种意图吧),你完全可以将这个源码下载下来,改成你需要的排版,然后再上传就好。
如果recipe有问题,反馈给我没什么用,建议给calibre提一个pull request,calibre的recipe好像也不是其作者亲自维护的,都是其他人发现问题而pull request到github的。
好的,多谢解答
作者您好,该RSS源:https://www.archdaily.com/feeds/rss 电子书可能正常生成,下载到本地也能阅读,但自动推送不能成功。单独或是合并成册均如此。
使用Sigil检查,提示:This EPUB has HTML files that are not well formed or are missing a DOCTYPE, html, head or body elements. Sigil can automatically fix these files, although this may very rarely result in minor data loss in extreme circumstances.
使用kindlegen转换生成的epub,提示如下:
不知是否是压缩图片后导致的异常,烦请您帮忙查看,是否在calibrek中设置什么参数能够解决? 谢谢~