你好，请问ssl故障是什么原因，依赖已全部安装 Ubuntu16

Neod0Matrix / PixivCrawlerIII

A python3 crawler for crawling Pixiv ranking top and any illustrator all artworks

MIT License

36 stars 9 forks source link

你好，请问ssl故障是什么原因，依赖已全部安装 Ubuntu16 #1

Open bigaha opened 5 years ago

bigaha commented 5 years ago

s81006-15371662

Neod0Matrix commented 5 years ago

Duplicate of #1 可以将你的整个爬取过程完整截图放出来么，看上去是POST KEY请求不成功，你所在的网络可以正常登录P站么，如果你的网络环境是P站DNS被污染的环境，那么就需要开代理服务器并设置为全局代理，保证在命令行下可以正常查询到P站的DNS

bigaha commented 5 years ago

您好，对不起，抱歉没有及时回复。造成这样的原因可能是我没有填写dataload.py里的文件保存folder,但我高中的英语水平实在抵不上您专业的英文readme,Google翻译也半懂不懂。如图，请问此处如何填写？ s81006-20464709 对于您针对我能否联通pixiv的疑问，我是肯定的，因为这个VPS就是我的代理服务器，我接上它可以成功上pixiv， s81006-20421813 最后是我的操作截图 s81006-20461414

Neod0Matrix commented 5 years ago

关于文件保存路径这一点，我的设计是自行创建一个保存位置，通过os模块获取系统的HOME目录路径，在其中建立一个文件夹存放下载的图片和日志。如果是Linux系统会直接在您的用户目录的Pictures目录内建立Crawler文件夹保存。比方说您的登录用户名是abc，那么文件保存路径就是/home/abc/Pictures/Crawler 如果您需要更换保存目录则修改这个位置通过您的截图我猜测您是在手机上利用SSH工具远程执行Ubuntu服务器上的爬虫，请问您是否有赋予爬虫sudo权限？

bigaha commented 5 years ago

实在不好意思，即使给了sudo权限也依旧如上

bigaha commented 5 years ago

对了，我使用的username是我的邮箱，请问这样会导致问题吗？

Neod0Matrix commented 5 years ago

P站ID就是注册邮箱。这个错误是由于网站本身验证SSL证书引起的，在我的环境中没有出现过这个异常您不妨试一下CSDN的这个解决方法https://blog.csdn.net/hudeyu777/article/details/76021573/ URL请求头封装在privmatrix.py的317行，POST key请求头则在privmatrix.py的363行

bigaha commented 5 years ago

我取消了自动验证，已经成功，非常谢谢，正在继续测试！本来已经查找到过您推荐的文章，但是我并不知道因此引起，下次我会仔细实践后再问问题的 s81006-22070932

bigaha commented 5 years ago

貌似忘了打码。。

bigaha commented 5 years ago

虽说如此，但请问有没有有关mode选择的文档？

Neod0Matrix commented 5 years ago

您指的是关于rtn和ira两种模式的功能实现文档还是解释说明文档？

bigaha commented 5 years ago

我指的是解释说明文档，现已在程序开头找到

Neod0Matrix commented 5 years ago

嗯，我在类的docstring里做了简单的说明

bigaha commented 5 years ago

请问您许可我将您的成果转帖到我的个人blog上吗？我将会注明您的GitHub链接并增加star推荐，再加以排错过程（可能需要一段时间完成，完成会会通知您）我的blog：https://www.jvruozhan.com

Neod0Matrix commented 5 years ago

可以的，只要注明出处就可以转载引用