Closed kslr closed 6 years ago
@howie6879 目前看起来是目录页直接返回HTML打印,这导致了结构不可控制。 比如“赤色黎明”返回的content
<table bgcolor="#E4E4E4" cellpadding="0" cellspacing="1" id="at">
<tbody>
<tr>
<td class="L"><a href="15117707.html">第一章</a></td>
<td class="L"><a href="15117710.html">第二章</a></td>
<td class="L"><a href="15117712.html">第三章</a></td>
<td class="L"><a href="15117715.html">第四章</a></td>
</tr>
more tr...
</tbody>
</table>
看起来只能解析标题列表然后在渲染。
对的 结构不可控
@howie6879 我看了下要改不少东西,估计只能针对每个站做采集规则。这边你是怎么考虑的呢?
没必要吧 我目前对每个选择器都写了样式。你如果要改就改这些样式就好 我只是没对移动端做详细适配 其实只是对这些选择器写一些移动适配就好。没那么复杂
取章节这里,我是取选择器下面的所有a链接,统一格式化成一种风格,这样移动端就一样了
选择器下面的a标签不一定都是目录
是的 ,需要过滤一些。 大体分三种: 一:dl dt dd 二:ul li 三:table 第一种章节目录可以完美搞过来,第二、三种我只要了正文章节,有的小标题没要了
很早前就写了不用选择器直接提取章节的一个接口 没切过来用
@howie6879 @serical 我的想法的话还是要做数据清洗,为了支持提供给移动端的API等等。 但是不知道howie6879如何考虑这个项目发展的。
其实我已经做了api 我初始目的想做小说推荐系统 现在这样有版权问题的
对于项目你们有什么意见呢 都可以提
如果同时提供盲人阅读就不需要版权许可。 我只是想要一个简单的小说阅读器不需要登录注册什么并支持移动端网页。
为什么提供盲人阅读就无需版权呢?
在移动端下体验非常差,想要优化下这部分结构。