You must start the Powershell with Administrative privileges.
Using Windows 8 or later, it's possible to install with one simple Powershell command. Start up Powershell and paste this command:
可能会出现error: Setup script exited with error: Unable to find vcvarsall.bat, 需要安装Visual Studio。
如果安装了VS2010或是VS2012可以使用下面的方法解决:
If you have Visual Studio 2010 installed, execute >
SET VS90COMNTOOLS=%VS100COMNTOOLS%
or with Visual Studio 2012 installed >
SET VS90COMNTOOLS=%VS110COMNTOOLS%
python 2.7在setup的时候查找的是VS2008编译的。
For Windows installations: While running setup.py for for package installations Python 2.7 searches for an installed Visual Studio 2008. You can trick Python to use newer Visual Studio by setting correct path in VS90COMNTOOLS environment variable before calling setup.py.
有人说VS2010无效。
建议还是用vs vs2008 c++ ,如果使用的是64位,一定要装pro版vs,因为express版没有64位编译器
或者 :
Scrapy 搞起篇(2014年8月30日-8月31日)
0. 环境
如果接下来用pip安装或者直接安装出现:
需要在
Python27\Lib\site-packages
建一个文件sitecustomize.py
。原因是pip安装python包会加载用户目录,用户目录恰好是中文的,ascii不能编码。python会自动运行这个文件。1. Install pip
a. setuptools:
b. python setup.py install :
去官网,傻瓜安装。
3. 安装w3lib
官方主页:http://pypi.python.org/pypi/w3lib
Github:https://github.com/scrapy/w3lib
4. 安装Zope.Interface (必须)
官网:https://pypi.python.org/pypi/zope.interface/4.1.1#downloads
5. 安装OpenSSL(未成功,但仍然安装了Scrapy)
官网:https://pypi.python.org/pypi/pyOpenSSL
有人说VS2010无效。
以下亲测无效
官网:https://pypi.python.org/simple/lxml/
下载:
lxml-3.3.6.win-amd64-py2.7.exe
7. 安装service_identity
下载:https://pypi.python.org/pypi/service_identity#downloads
8. 安装 Scrapy
下载源码安装,或者:
9. 创建工程
参考官方文档:http://doc.scrapy.org/en/latest/intro/tutorial.html
结果如下:
并在tutorial目录生成文件:Books和Resources
11. 部署到Scrapyd
文档:http://scrapyd.readthedocs.org/en/latest/overview.html
注意:scrapyd最好在bash环境下安装和使用,否则在cmd下发布不了,出现以下错误:
使用方法:
启动.
bash $
下执行命令scrapyd
:如果没有执行这一步,直接发布,会出现以下错误:
发布.
cmd定位到工程目录,执行以下命令启动目录下所有工程:
也可以加参数,控制启动工程,这些参数需要在
scrapy.cfg
文件实现定义,比如:启动成功后,出现:
在url中可以看到当前的监控:
启动爬虫.
For more information about the API, see the Scrapyd documentation。
11. 常见问题
问题:
解决方法:
问题:
解决方法:
问题:
解决方法:
建议还是用vs vs2008 c++ ,如果使用的是64位,一定要装pro版vs,因为express版没有64位编译器.
问题:
解决方法:
windows下用任务计划定时执行批处理文件,或者Linux系统定时任务(比如crond)定时执行抓取。
参考:
http://doc.scrapy.org/en/latest/intro/install.html#intro-install
http://www.cnblogs.com/txw1958/archive/2012/07/12/scrapy_installation_introduce.html
http://my.oschina.net/zhangdapeng89/blog/54407
http://www.crifan.com/while_install_scrapy_error_unable_to_find_vcvarsall_bat/
http://blog.csdn.net/changdejie/article/details/18407979
http://www.kankanews.com/ICkengine/archives/94817.shtml
http://blog.chinaunix.net/uid-24567872-id-3925118.html
http://blog.csdn.net/iefreer/article/details/20677943
http://www.oschina.net/translate/build-website-crawler-based-upon-scrapy
http://blog.jobbole.com/73115/
http://www.itdiffer.com/doc-view-727.html