ChangxingJiang / CxSpider

长行的爬虫集合:微博、Twitter、玩加、知网、虎牙、斗鱼、B站、WeGame、猫眼、豆瓣、安居客、居理新房
367 stars 106 forks source link

老哥能发一下json的配置文件吗 #1

Open master-lzh opened 4 years ago

ChangxingJiang commented 4 years ago

json的配置文件涉及我数据库、代理IP和项目内容的信息,我大概发一个结构吧(手打的就用缩进表示层级吧)。

{
  MySQL:
    项目名:
      Host:
      User:
      Password:
      Database:
  Proxy Ip:
    Ajax Url: 代理IP的API的Url
  ChromeDriver:
    Executable Path: Chromedriver可执行文件位置
    Chomre Location: Chrome浏览器可执行文件位置
    Chrome User Data Path: Chrome用户数据文件路径
    Download Path: 程序下载文件路径
  Path: 存通用路径的地方
  Data: 存通用数据的地方
}
master-lzh commented 4 years ago

请问twitter里面Huabang和Media List应该分别填什么啊

ChangxingJiang commented 4 years ago

Huabang填你自己的项目名就可以,我是为了区分不同项目写的;Media List是需要采集的账户列表,格式大概是这个样子

"Media List":[
  [账号ID(和爬虫无关,业务需要),账号名字(和爬虫无关,业务需要),账号的唯一名字(@里面的名字,也就是url里的名字),Twitter账号的个人主页]
]
master-lzh commented 4 years ago

感谢,可以用了,终于知道川普一年来发了多少推特了😄

ChangxingJiang commented 4 years ago

哈哈~