CMTLJPROJECT / CMTBS

本科毕设
0 stars 0 forks source link

百度百科数据爬取 #1

Open JA1lE1 opened 4 years ago

JA1lE1 commented 4 years ago

内容

1.定好百度百科爬取的内容范围 2.爬取的工具 3.从简单的爬取内容开始 比如就爬取厦门大学的有关机构,学科,人员等 4.将数据存在mysql 5.使用scrapy

报告

1.将工作的步骤详细记录下上传到git(方便后期可维护)

JA1lE1 commented 4 years ago

工具使用

python环境

在线环境

JA1lE1 commented 4 years ago

爬虫参考

JA1lE1 commented 4 years ago

git(win)

  1. git官网安装
  2. 使用vscode 安装git插件(或者使用github win-desktop) 注:如果你使用git bash 也可以