Scrapy 是用纯 Python 实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用户只需要定制开发几个模块就可以实现一个网络爬虫,其采用了异步通讯的方式可以很快的进行数据爬取,另外还可以使用中间件轻松完成各种需求。
本次写作主要包含三个部分:
- Scrapy 框架介绍,包含 Spiders、Item Pipeline、Scrapy Shell、CrawlSpiders、Downloader middleware、Setting 等相关组件使用
- Scrapy 实战项目
- Scrapy-Redis 分布式数据爬取
阅读全文: http://gitbook.cn/gitchat/activity/5d581cbf41426d6aef467d3e
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。