g1879 / DrissionPage

基于python的网页自动化工具。既能控制浏览器,也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大,内置无数人性化设计和便捷功能。语法简洁而优雅,代码量少。
https://drissionpage.cn
BSD 3-Clause "New" or "Revised" License
6.84k stars 663 forks source link

get可以绕过cloudflare,download无法成功 #84

Open sunnypandas opened 7 months ago

sunnypandas commented 7 months ago

如题所示: page = ChromiumPage() page.download_set.save_path(download_folder) page.get('https://projects.propublica.org/nonprofits/download-filing?path=05_2021_prefixes_13-13/132947386_202006_990_2021051818124406.pdf') 可以成功打开,但是: page = ChromiumPage() page.download_set.save_path(download_folder) page.download('https://projects.propublica.org/nonprofits/download-filing?path=05_2021_prefixes_13-13/132947386_202006_990_2021051818124406.pdf') 无法下载,报出了403错误

想咨询下download的实现逻辑是没有饶过cloudflare吗?

谢谢。

g1879 commented 7 months ago

download()功能是用requests封装的,如果需要headers等参数,需要自己写进去。

sunnypandas commented 7 months ago

download()功能是用requests封装的,如果需要headers等参数,需要自己写进去。

您好,感谢回复,绕过CF的话需要什么样的headers呢,谢谢