请问有函数能只爬取漫画数据而不下载漫画吗？

hect0x7 / JMComic-Crawler-Python

Python API for JMComic | 提供Python API访问禁漫天堂，同时支持网页端和移动端 | 禁漫天堂GitHub Actions下载器🚀

https://jmcomic.readthedocs.io/zh-cn/latest/option_file_syntax/#

MIT License

791 stars 1.85k forks source link

请问有函数能只爬取漫画数据而不下载漫画吗？ #203

Closed Yunxi-awa closed 8 months ago

Yunxi-awa commented 8 months ago

期望功能如题。看了源代码，postman没有搞懂，只能过来提问了......

hect0x7 commented 8 months ago

from jmcomic import *

op = JmOption.default()
client: JmcomicClient = op.new_jm_client()
# 看看client有哪些方法就知道啦

hect0x7 commented 8 months ago

也可以参考这个文档，里面有使用client的示例 https://jmcomic.readthedocs.io/en/latest/tutorial/3_demo/

Yunxi-awa commented 8 months ago

class superDownloader(jmcomic.JmDownloader):
    def __init__(self, option: jmcomic.JmOption):
        super().__init__(option)
        self.photoPage: list = []

    def after_photo(self, photo: jmcomic.JmPhotoDetail):
        super().after_photo(photo)
        self.photoPage.append(len(photo))
        jmcomic.default_jm_logging("photo.after.q", "刷新成功")
        self.option.call_all_plugin(
            'after_photo',
            photo=photo,
            downloader=self,
        )

向神犇请安，这是我重写的JmDownloader类，可以在下载的时候自动记录每一个photo的页数请问如果不用JmDownloader，而是用client.get_album_detail()，能达到以上效果吗？（ps不想用get_photo_detail()是因为觉得对于章节多的开销有点大，不过没有其他方法的话也行......）

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

OK，妥协了

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问，能不获取数据而只下载漫画吗🤔

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问，能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律，理论上可能还真行。

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问，能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律，理论上可能还真行。

但图片有混淆，要获取到scramble_id才能解密。不过scramble_id也有一定规律...🤣

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的，这个开销没法避免，因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问，能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律，理论上可能还真行。

但图片有混淆，要获取到scramble_id才能解密。不过scramble_id也有一定规律...🤣

那就等着大佬继续更新了！🙏

hect0x7 commented 8 months ago

我其实没有什么要更新的了，下载+本地离线浏览插件已经能满足我个人的需求了😇

Yunxi-awa commented 8 months ago

我其实没有什么要更新的了，下载+本地离线浏览插件已经能满足我个人的需求了😇

我这个项目做完了会开源，到时候如果你愿意的话这个项目也可以和jmcomic合并（三十年河东，三十年河西