7325156 / jjwxcNovelCrawler

使用python3爬虫下载晋江小说(可下载VIP章节,app源下载)【此项目仅供学习交流使用,严禁用于商业用途,请在24小时之内删除。】
298 stars 50 forks source link

众筹字体反爬虫文件…… #6

Closed 7325156 closed 3 years ago

7325156 commented 3 years ago

(由于该楼太高,故于2021/2/6新开一楼,此楼不再更改。) 晋江使用的是字体反爬虫,如果出现什么新的字体没有列出来,可以在这里输入章节网址,或者直接传一个字体文件(把文件拖拽到输入框即可)。 如何更快地完成对照表 目前已有字体文件: jjwxcfont_0004v jjwxcfont_00070 jjwxcfont_00091 jjwxcfont_000bl jjwxcfont_000dz jjwxcfont_000ib jjwxcfont_000m4 jjwxcfont_000mn jjwxcfont_000qt jjwxcfont_000t5 jjwxcfont_000wi jjwxcfont_000xw jjwxcfont_0012a jjwxcfont_00147 jjwxcfont_0015q jjwxcfont_001ac jjwxcfont_001d3 jjwxcfont_001fl jjwxcfont_001i5 jjwxcfont_001ks jjwxcfont_001n4 jjwxcfont_001qb jjwxcfont_001u8 jjwxcfont_001wb jjwxcfont_001yu jjwxcfont_00210 jjwxcfont_0023v jjwxcfont_0026b jjwxcfont_00294 jjwxcfont_002e2 jjwxcfont_002em jjwxcfont_002h0 jjwxcfont_002kt jjwxcfont_002nb jjwxcfont_002pr jjwxcfont_002ue jjwxcfont_002vc jjwxcfont_002zh jjwxcfont_00317 jjwxcfont_00355 jjwxcfont_0038d jjwxcfont_003am jjwxcfont_003ce jjwxcfont_003fx jjwxcfont_003jp jjwxcfont_003kl jjwxcfont_003o0 jjwxcfont_003s0 jjwxcfont_003tk jjwxcfont_003wv jjwxcfont_003zu jjwxcfont_0041e jjwxcfont_0043t jjwxcfont_00484 jjwxcfont_0049b jjwxcfont_004di jjwxcfont_004gl jjwxcfont_004hu jjwxcfont_004kc jjwxcfont_004np jjwxcfont_004q9 jjwxcfont_004t9 jjwxcfont_004v9 jjwxcfont_004z1 jjwxcfont_0052c jjwxcfont_0055y jjwxcfont_0057c jjwxcfont_005aa jjwxcfont_005dc jjwxcfont_005gr jjwxcfont_005jc jjwxcfont_005ml jjwxcfont_005nm jjwxcfont_005s0 jjwxcfont_005u3 jjwxcfont_005xn jjwxcfont_005yg jjwxcfont_0063d jjwxcfont_0065q jjwxcfont_0067u jjwxcfont_006as jjwxcfont_006dp jjwxcfont_006ge jjwxcfont_006jq jjwxcfont_006l4 jjwxcfont_006p4 jjwxcfont_006s5 jjwxcfont_006uw jjwxcfont_006x3 jjwxcfont_006yy jjwxcfont_00725 jjwxcfont_0073m jjwxcfont_0078d jjwxcfont_007ax jjwxcfont_007cx jjwxcfont_007f3 jjwxcfont_007ib jjwxcfont_007kc jjwxcfont_007p4 jjwxcfont_007qa jjwxcfont_007tj jjwxcfont_007x1 jjwxcfont_007yi jjwxcfont_0082v jjwxcfont_00844 jjwxcfont_0088f jjwxcfont_008ab jjwxcfont_008g9(来自 @8starcrystal8)

众筹反爬虫对照表,已完成对照表如下: jjwxcfont_0004v jjwxcfont_00070 jjwxcfont_00091 jjwxcfont_000bl jjwxcfont_000dz jjwxcfont_000ib jjwxcfont_000m4 jjwxcfont_000mn jjwxcfont_000qt jjwxcfont_000t5 jjwxcfont_000wi jjwxcfont_000xw jjwxcfont_0012a jjwxcfont_00147 jjwxcfont_0015q jjwxcfont_001ac jjwxcfont_001d3 jjwxcfont_001fl( @8starcrystal8完成) jjwxcfont_0082v jjwxcfont_00844( @113000完成)

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...头痛...这么多woff2真的需要大家众筹了...

freesialee commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

freesialee commented 3 years ago

PS.我个人认为还会增加,因为92个,是我弄好57个后,重新下载发现的,就是今早上增加的orz

update:每个ttf和之前的数量是一样的,11*9=99个(卧槽不对 仔细一看,有两页多!!!!!!200个

113000 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...头痛...这么多woff2真的需要大家众筹了...

一人做几个,应该做得完吧,一个woff2大约就是打几十个中文字。 是上传到https://font.qqe2.com/ 然后对着编码在txt文件输入中文字,对吧?

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

Ttf我试开了一个,可以开。但是txt我开的时候,只看到“命令语法不正确”这一句。

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...头痛...这么多woff2真的需要大家众筹了...

一人做几个,应该做得完吧,一个woff2大约就是打几十个中文字。 是上传到https://font.qqe2.com/,然后对着编码在txt文件输入中文字,对吧?

是的。不过一个woff2里面有200个字...

freesialee commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

Ttf我试开了一个,可以开。但是txt我开的时候,只看到“命令语法不正确”这一句。

txt我没加内容,是直接批量新建的文档,我不是很清楚里面需要什么内容>< 是要编码吗?编码从哪儿来?

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

Ttf我试开了一个,可以开。但是txt我开的时候,只看到“命令语法不正确”这一句。

txt我没加内容,是直接批量新建的文档,我不是很清楚里面需要什么内容>< 是要编码吗?编码从哪儿来?

这个我也不是很清楚。不过好像可以从xml里面收集(记得我开过以前的几个xml,看到过编码)。

freesialee commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

Ttf我试开了一个,可以开。但是txt我开的时候,只看到“命令语法不正确”这一句。

txt我没加内容,是直接批量新建的文档,我不是很清楚里面需要什么内容>< 是要编码吗?编码从哪儿来?

这个我也不是很清楚。不过好像可以从xml里面收集(记得我开过以前的几个xml,看到过编码)。

那我就没办法啦,没有弄过……

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...头痛...这么多woff2真的需要大家众筹了...

一人做几个,应该做得完吧,一个woff2大约就是打几十个中文字。 是上传到https://font.qqe2.com/,然后对着编码在txt文件输入中文字,对吧?

是的。加油!但是编码好像有点不同的,以前显示是0xe---,现在不知道有没有变。暂时材料还不足(还需要txt)...

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

Ttf我试开了一个,可以开。但是txt我开的时候,只看到“命令语法不正确”这一句。

txt我没加内容,是直接批量新建的文档,我不是很清楚里面需要什么内容>< 是要编码吗?编码从哪儿来?

这个我也不是很清楚。不过好像可以从xml里面收集(记得我开过以前的几个xml,看到过编码)。

那我就没办法啦,没有弄过……

没事,谢谢你发的ttf。

freesialee commented 3 years ago

我看了xml文件确实有编码,但是我不会获取xml……跪了 我去查一下好像是可以从woff转换的,知识盲区,等我吃个饭来看看

8starcrystal8 commented 3 years ago

我看了xml文件确实有编码,但是我不会获取xml……跪了

我也不会,唯一能想到的就是人工手动 (笑哭.jpg)。编码应该是map code那一边的,以前是0xe---,不知道现在有没有变。

因为我现在用的手机,要看xml只能今晚回家后再试试了。

freesialee commented 3 years ago

我看了xml文件确实有编码,但是我不会获取xml……跪了

我也不会,唯一能想到的就是人工手动 (笑哭.jpg)。编码应该是map code那一边的,以前是0xe---,不知道现在有没有变。

因为我现在用的手机,要看xml只能今晚回家后再试试了。

这个好像没有变,还是这样的: 这一看不&#xea0d了,这片&#xee26章写&#xea0d鞭辟入里加之证据详实,

8starcrystal8 commented 3 years ago

我看了xml文件确实有编码,但是我不会获取xml……跪了

我也不会,唯一能想到的就是人工手动 (笑哭.jpg)。编码应该是map code那一边的,以前是0xe---,不知道现在有没有变。 因为我现在用的手机,要看xml只能今晚回家后再试试了。

这个好像没有变,还是这样的: 这一看不&#xea0d了,这片&#xee26章写&#xea0d鞭辟入里加之证据详实,

哎!那还好,编码拉出来后把0xe---换成&#xe---就行了。

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

对了!@freesialee能问下你是怎么转换woff2成ttf的吗?我在试着使用python转换,但是完全不知道怎么弄啊(头大.jpg)

7325156 commented 3 years ago

人在外地,忙到失智,差点被送走。 感谢 @freesialee 提供的压缩包,我把TXT弄出来了,过会儿再放上来。 有请诸位肝帝大佬们大展身手,我上传完就先睡一觉,明天……明天看看有没有空吧。 @8starcrystal8 (PS:这楼是不是太高了?要不重开一个?) (PPS:宾馆的网速还是可以的)

8starcrystal8 commented 3 years ago

人在外地,忙到失智,差点被送走。 感谢 @freesialee 提供的压缩包,我把TXT弄出来了,过会儿再放上来。 有请诸位肝帝大佬们大展身手,我上传完就先睡一觉,明天……明天看看有没有空吧。 @8starcrystal8 (PS:这楼是不是太高了?要不重开一个?) (PPS:宾馆的网速还是可以的)

大大加油 (大大那么忙是因为春节要到了?)!就等txt了。

freesialee commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

对了!@freesialee能问下你是怎么转换woff2成ttf的吗?我在试着使用python转换,但是完全不知道怎么弄啊(头大.jpg)

我不是转换的哦,我是知道jjwxcfont的对应代码之后,一个一个从网上下载的。

PS.既然大大待会可以提供txt咱几个能弄的要不先分一下,不要集中一起弄,浪费人力。

8starcrystal8 commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

对了!@freesialee能问下你是怎么转换woff2成ttf的吗?我在试着使用python转换,但是完全不知道怎么弄啊(头大.jpg)

我不是转换的哦,我是知道jjwxcfont的对应代码之后,一个一个从网上下载的。

PS.既然大大待会可以提供txt咱几个能弄的要不先分一下,不要集中一起弄,浪费人力。

哇!怎样下载的?

可以,要怎么分(我等下就开始了。哈哈)?

freesialee commented 3 years ago

不止 现在有80多个了……我的天

吐血,又增加了?我想知道新的woff2,一个woff2里面有多少字...

@8starcrystal8 不知道您要的ttf和txt是不是这些,我试着弄了下,是目前92个对应的ttf和我新建的txt文档,我之前没对照过字体,下一步就不知道怎么做了。 Fonts_new.zip

对了!@freesialee能问下你是怎么转换woff2成ttf的吗?我在试着使用python转换,但是完全不知道怎么弄啊(头大.jpg)

我不是转换的哦,我是知道jjwxcfont的对应代码之后,一个一个从网上下载的。 PS.既然大大待会可以提供txt咱几个能弄的要不先分一下,不要集中一起弄,浪费人力。

哇!怎样下载的?

可以,要怎么分(我等下就开始了。哈哈)?

不知道是不是有更好的方法,我的下载方法是这样的:打开jjwxc的任意VIP章节,F12查看源码,ctrl+F查找“jjwxcfont”,会查找到一些结果,其中就包括“ttf”“woff”“woff2”“eot”等字体文件的链接地址,比如“static.jjwxc.net/tmp/fonts/jjwxcfont_005u3.ttf?h=my.jjwxc.net”,这个地址就是字体文件的下载地址。然后再配合excel+批处理的方法,弄好所有的woff2对应的ttf下载链接,再下载下来。 我感觉这个方法挺傻瓜的,可能可以通过什么方法自动导出ttf文件,不过没接触过所以就按自己的来了。

至于字体对照,按文件名升序排列,每个人领取多少个,先记录一下(或者直接把认领的字体名称发上来),省得大家做重,提高效率,这样可行吗?

levi330 commented 3 years ago

太太您好,用静读天下确实可以看到文字,但是需要每章都一个一个试导入的16个tff文件,请问这个有什么解决方法吗( •̥́ ˍ •̀)

  1. 建立一个 /sdcard/fonts 文件夹(也可自定义位置),放入16个tff文件进fonts文件夹
  2. 静读天下 -> 打开任意文件 -> 可视选项 -> 字体选择 ->看看最下面位置是不是 /sdcard/fonts (不是就选择点击文件夹icon,然后转换成 /sdcard/fonts )

然后就自动转换乱码了

我照您说的做了,然后还是得每一章更换一种字体才能正常观看啊QAQ。

8starcrystal8 commented 3 years ago

不知道是不是有更好的方法,我的下载方法是这样的:打开jjwxc的任意VIP章节,F12查看源码,ctrl+F查找“jjwxcfont”,会查找到一些结果,其中就包括“ttf”“woff”“woff2”“eot”等字体文件的链接地址,比如“static.jjwxc.net/tmp/fonts/jjwxcfont_005u3.ttf?h=my.jjwxc.net”,这个地址就是字体文件的下载地址。然后再配合excel+批处理的方法,弄好所有的woff2对应的ttf下载链接,再下载下来。 我感觉这个方法挺傻瓜的,可能可以通过什么方法自动导出ttf文件,不过没接触过所以就按自己的来了。

至于字体对照,按文件名升序排列,每个人领取多少个,先记录一下(或者直接把认领的字体名称发上来),省得大家做重,提高效率,这样可行吗?

哇!这个我下次试试 (虽然我不知道怎么弄excel+批处理方法,只能单个下了 擦汗.jpg)!

可以啊!就按文件名升序排列(等等,升序排列头个文件是jjwxcfont_001d3吧?)。我先领10个?做完了发上来,之后再领(领的时候得说领多少,不管是第一次领还是再次领的)。

freesialee commented 3 years ago

不知道是不是有更好的方法,我的下载方法是这样的:打开jjwxc的任意VIP章节,F12查看源码,ctrl+F查找“jjwxcfont”,会查找到一些结果,其中就包括“ttf”“woff”“woff2”“eot”等字体文件的链接地址,比如“static.jjwxc.net/tmp/fonts/jjwxcfont_005u3.ttf?h=my.jjwxc.net”,这个地址就是字体文件的下载地址。然后再配合excel+批处理的方法,弄好所有的woff2对应的ttf下载链接,再下载下来。 我感觉这个方法挺傻瓜的,可能可以通过什么方法自动导出ttf文件,不过没接触过所以就按自己的来了。 至于字体对照,按文件名升序排列,每个人领取多少个,先记录一下(或者直接把认领的字体名称发上来),省得大家做重,提高效率,这样可行吗?

哇!这个我下次试试 (虽然我不知道怎么弄excel+批处理方法,只能单个下了 擦汗.jpg)!

可以啊!就按文件名升序排列(等等,升序排列头个文件是jjwxcfont_001d3吧?)。我先领10个?做完了发上来,之后再领(领的时候得说领多少,不管是第一次领还是再次领的)。

对~升序第一是“jjwxcfont_001d3”,我之前没搞过,我也先领10个吧,从“jjwxcfont_002em”到“jjwxcfont_003ce”。等拿到txt就开始肝><

8starcrystal8 commented 3 years ago

不知道是不是有更好的方法,我的下载方法是这样的:打开jjwxc的任意VIP章节,F12查看源码,ctrl+F查找“jjwxcfont”,会查找到一些结果,其中就包括“ttf”“woff”“woff2”“eot”等字体文件的链接地址,比如“static.jjwxc.net/tmp/fonts/jjwxcfont_005u3.ttf?h=my.jjwxc.net”,这个地址就是字体文件的下载地址。然后再配合excel+批处理的方法,弄好所有的woff2对应的ttf下载链接,再下载下来。 我感觉这个方法挺傻瓜的,可能可以通过什么方法自动导出ttf文件,不过没接触过所以就按自己的来了。 至于字体对照,按文件名升序排列,每个人领取多少个,先记录一下(或者直接把认领的字体名称发上来),省得大家做重,提高效率,这样可行吗?

哇!这个我下次试试 (虽然我不知道怎么弄excel+批处理方法,只能单个下了 擦汗.jpg)! 可以啊!就按文件名升序排列(等等,升序排列头个文件是jjwxcfont_001d3吧?)。我先领10个?做完了发上来,之后再领(领的时候得说领多少,不管是第一次领还是再次领的)。

对~升序第一是“jjwxcfont_001d3”,我之前没搞过,我也先领10个吧,从“jjwxcfont_002em”到“jjwxcfont_003ce”。等拿到txt就开始肝><

txt大大已发了。在对照表那里。

levi330 commented 3 years ago

内个,打断一下大家。我想问一下用静音天下看的时候是不是需要每一章换一种字体才能正常观看吗?我导入tff文件后每看新一章都要新试一种字体,请问有什么解决方案咩?

freesialee commented 3 years ago

不知道是不是有更好的方法,我的下载方法是这样的:打开jjwxc的任意VIP章节,F12查看源码,ctrl+F查找“jjwxcfont”,会查找到一些结果,其中就包括“ttf”“woff”“woff2”“eot”等字体文件的链接地址,比如“static.jjwxc.net/tmp/fonts/jjwxcfont_005u3.ttf?h=my.jjwxc.net”,这个地址就是字体文件的下载地址。然后再配合excel+批处理的方法,弄好所有的woff2对应的ttf下载链接,再下载下来。 我感觉这个方法挺傻瓜的,可能可以通过什么方法自动导出ttf文件,不过没接触过所以就按自己的来了。 至于字体对照,按文件名升序排列,每个人领取多少个,先记录一下(或者直接把认领的字体名称发上来),省得大家做重,提高效率,这样可行吗?

哇!这个我下次试试 (虽然我不知道怎么弄excel+批处理方法,只能单个下了 擦汗.jpg)! 可以啊!就按文件名升序排列(等等,升序排列头个文件是jjwxcfont_001d3吧?)。我先领10个?做完了发上来,之后再领(领的时候得说领多少,不管是第一次领还是再次领的)。

对~升序第一是“jjwxcfont_001d3”,我之前没搞过,我也先领10个吧,从“jjwxcfont_002em”到“jjwxcfont_003ce”。等拿到txt就开始肝><

txt大大已发了。在对照表那里。

啊不是你说我都没发现,谢谢,这就去下:)

@levi330 现在讨论方法没什么用啦,因为晋江字体更新了,不管你用什么方法,目前都没办法的。而且我没只用过txt,帮不上忙哦。

113000 commented 3 years ago

我比较喜欢做一个领一个 已完成: jjwxcfont_0082v.txt jjwxcfont_00844.txt jjwxcfont_0088f.txt jjwxcfont_008ab.txt jjwxcfont_008g9.txt

已领:

天若OCR是我不会用吗?说百度OCR查不到 下载个ABBYY Screenshot Reader试用版吧,然后可以导入EXCEL,有半年试用期,就是不买FineReader OCR效果一般,会缺10-30%的字,不过 FineReader 超级贵啊!

8starcrystal8 commented 3 years ago

已完成: jjwxcfont_001fl.txt jjwxcfont_001d3.txt

已领: jjwxcfont_001i5 jjwxcfont_001ks jjwxcfont_001n4 jjwxcfont_001qb jjwxcfont_001u8 jjwxcfont_001wb jjwxcfont_001yu jjwxcfont_002e2

再领5个: jjwxcfont_003fx jjwxcfont_003jp jjwxcfont_003kl jjwxcfont_003o0 jjwxcfont_003s0

等下要出门,路上整整。

levi330 commented 3 years ago

领一个jjwxcfont_484 (还是没搞清楚天若怎么用orz)我还是手打吧

freesialee commented 3 years ago

——以下搬到新楼了——

已完成: jjwxcfont_002em.txt jjwxcfont_002h0.txt jjwxcfont_002kt.txt jjwxcfont_002nb.txt jjwxcfont_002pr.txt jjwxcfont_002ue.txt jjwxcfont_002vc.txt jjwxcfont_002zh.txt jjwxcfont_003am.txt jjwxcfont_003ce.txt