owner888 / phpspider

《我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言 》所使用的程序
3.49k stars 1.17k forks source link

这个项目是不是凉了,没人了吗【已回复,作者在维护】 #131

Open rustxj opened 5 years ago

rustxj commented 5 years ago

QQ群全是僵尸,项目好像有没有人了, 如何实现多个不同域名URL内容 中 h1 (XXXXXX) h1 采集?

必须得有是 一个域名,一个首页,一个列表,一个内容,只能采集内容和列表的东西吗。

owner888 commented 5 years ago

有人有人,不同域名只需要在入口处添加即可啊,比如这样:

$configs = array( 'name' => '糗事百科和今日头条', 'domains' => array( 'www.qiushibaike.com', // 糗事百科域名 'www.toutiao.com' // 今日头条域名 ), 'scan_urls' => array( 'http://www.qiushibaike.com/', // 糗事百科采集入口 'https://www.toutiao.com/' // 今日头条采集入口 ),

rustxj commented 5 years ago

晓得晓得,已做笔记,感谢

owner888 commented 5 years ago

感谢支持