get可以绕过cloudflare，download无法成功 - Githubissues

g1879 / DrissionPage

基于python的网页自动化工具。既能控制浏览器，也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大，内置无数人性化设计和便捷功能。语法简洁而优雅，代码量少。

https://drissionpage.cn

BSD 3-Clause "New" or "Revised" License

6.84k stars 663 forks source link

get可以绕过cloudflare，download无法成功 #84

Open sunnypandas opened 7 months ago

sunnypandas commented 7 months ago

如题所示： page = ChromiumPage() page.download_set.save_path(download_folder) page.get('https://projects.propublica.org/nonprofits/download-filing?path=05_2021_prefixes_13-13/132947386_202006_990_2021051818124406.pdf') 可以成功打开，但是： page = ChromiumPage() page.download_set.save_path(download_folder) page.download('https://projects.propublica.org/nonprofits/download-filing?path=05_2021_prefixes_13-13/132947386_202006_990_2021051818124406.pdf') 无法下载，报出了403错误

想咨询下download的实现逻辑是没有饶过cloudflare吗？

谢谢。

g1879 commented 7 months ago

download()功能是用requests封装的，如果需要headers等参数，需要自己写进去。

sunnypandas commented 7 months ago

download()功能是用requests封装的，如果需要headers等参数，需要自己写进去。

您好，感谢回复，绕过CF的话需要什么样的headers呢，谢谢