Python3Spiders / AllNewsSpider

澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!
Apache License 2.0
349 stars 62 forks source link

请问两个问题 #13

Open yangxg opened 2 years ago

yangxg commented 2 years ago

一、澎湃新闻等spider可以设置关键字搜索吗?

二、百度新闻能否获取新闻全文?

谢谢!

inspurer commented 2 years ago

澎湃的搜索还没做,百度新闻获取全文也还没做(需要很多 req,容易 ban

yangxg commented 2 years ago

好的,谢谢,辛苦~

qiwangye1988 commented 2 years ago

百度那个时间xpath获取的 最新的新闻 没有时间 需要做下判断 不然会报错