hect0x7 / JMComic-Crawler-Python

Python API for JMComic | 提供Python API访问禁漫天堂,同时支持网页端和移动端 | 禁漫天堂GitHub Actions下载器🚀
https://jmcomic.readthedocs.io/zh-cn/latest/option_file_syntax/#
MIT License
791 stars 1.85k forks source link

请问有函数能只爬取漫画数据而不下载漫画吗? #203

Closed Yunxi-awa closed 8 months ago

Yunxi-awa commented 8 months ago

期望功能如题。看了源代码,postman没有搞懂,只能过来提问了......

hect0x7 commented 8 months ago
from jmcomic import *

op = JmOption.default()
client: JmcomicClient = op.new_jm_client()
# 看看client有哪些方法就知道啦
hect0x7 commented 8 months ago

也可以参考这个文档,里面有使用client的示例 https://jmcomic.readthedocs.io/en/latest/tutorial/3_demo/

Yunxi-awa commented 8 months ago
class superDownloader(jmcomic.JmDownloader):
    def __init__(self, option: jmcomic.JmOption):
        super().__init__(option)
        self.photoPage: list = []

    def after_photo(self, photo: jmcomic.JmPhotoDetail):
        super().after_photo(photo)
        self.photoPage.append(len(photo))
        jmcomic.default_jm_logging("photo.after.q", "刷新成功")
        self.option.call_all_plugin(
            'after_photo',
            photo=photo,
            downloader=self,
        )

向神犇请安,这是我重写的JmDownloader类,可以在下载的时候自动记录每一个photo的页数 请问如果不用JmDownloader,而是用client.get_album_detail(),能达到以上效果吗? (ps不想用get_photo_detail()是因为觉得对于章节多的开销有点大,不过没有其他方法的话也行......)

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

OK,妥协了

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问,能不获取数据而只下载漫画吗🤔

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问,能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律,理论上可能还真行。

hect0x7 commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问,能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律,理论上可能还真行。

但图片有混淆,要获取到scramble_id才能解密。不过scramble_id也有一定规律...🤣

Yunxi-awa commented 8 months ago

其实downloader也是用get_photo_detail的,这个开销没法避免,因为禁漫只有在章节详情页会返章节图片数这一数据。

还有一个疑问,能不获取数据而只下载漫画吗🤔

扫图片cdn。因为图片url有规律,理论上可能还真行。

但图片有混淆,要获取到scramble_id才能解密。不过scramble_id也有一定规律...🤣

那就等着大佬继续更新了!🙏

hect0x7 commented 8 months ago

我其实没有什么要更新的了,下载+本地离线浏览插件 已经能满足我个人的需求了😇

Yunxi-awa commented 8 months ago

我其实没有什么要更新的了,下载+本地离线浏览插件 已经能满足我个人的需求了😇

我这个项目做完了会开源,到时候如果你愿意的话这个项目也可以和jmcomic合并(三十年河东,三十年河西