反馈问题：69书吧书源一些正文第一行没有章节名导致第一行正文内容被删除

XIU2 / Yuedu

📚「阅读」APP 自用书源（网络小说）

https://yuedu.xiu2.xyz

GNU General Public License v3.0

8.38k stars 567 forks source link

反馈问题：69书吧书源一些正文第一行没有章节名导致第一行正文内容被删除 #89

Closed f7time closed 1 year ago

f7time commented 1 year ago

阅读版本

3.23.062623

书源名称

69书吧

问题描述

读取内容删减问题。这网站没统一，每一话文章内容时有标题时没有。为了美观把重复标题删了，造成没标题的少了第一段句子。

附加截图

Screenshot_20230728_113101_com microsoft emmx Screenshot_20230728_113106_io legado app release Screenshot_20230728_105036_com microsoft emmx Screenshot_20230728_105216_io legado app release

XIU2 commented 1 year ago

那这个就难解决了，因为我之所以是直接移除第一行而不是匹配第一行的第X章再移除，是因为一些章节正文第一行并不是第X章格式的，有些甚至是乱七八糟的毫无规律，因此无法通过正则匹配来完美净化第一行。

XIU2 commented 1 year ago

你要是想要自行通过净化规则解决，那么你可以修改书源，把正文的替换规则改为：##($本章完$$)

XIU2 commented 1 year ago

突然想起来阅读是有内置变量的，我查了查，改了改，这回应该可以完美净化了。

把正文的替换规则改为：

##(^　　{{book.durChapterTitle}}.*)|(\(本章完\)$)

这样就只会屏蔽正文开头的第一行的当前章节名称，对于正文第一行不是章节名称的则不会有影响。

你可以用这两个目录页调试一下看看效果：

# 正文第一行 有 当前章节名称
++https://d34xj6zzll2cc7.cloudfront.net/A43616/

# 正文第一行 无 当前章节名称
++https://d34xj6zzll2cc7.cloudfront.net/10046534/

注意，不能直接用正文页调试，因为这样的话阅读是不知道当前章节名称的，必须要用目录页、详情页、搜索页等调试才行。

XIU2 commented 1 year ago

另外，我也注意到你截图里的 www.69shuba.com，看了下以为是镜像站，又好像是官方的镜像站，但测了下好像有些地方比较奇怪，单纯替换域名的话，一些书籍详情页会提示 404（而一些书籍的又会被重定向到该域名），搞不明白，但因为这个原因也无法完全替代 www.69shu.com 主域名使用，所以我的书源也就不改动了。

另外，上面这个正文净化规则的改动，我已经更新书源了。

XIU2 / Yuedu

反馈问题：69书吧 书源一些正文第一行没有章节名导致第一行正文内容被删除 #89

阅读版本

书源名称

问题描述

附加截图

反馈问题：69书吧书源一些正文第一行没有章节名导致第一行正文内容被删除 #89