本书将详细介绍数据采集的全过程及相关技术,涵盖爬虫基础、HTTP协议、Requests库的应用、Xpath解析器、MongoDB与MySQL数据库比较、多线程爬虫实现、Scrapy及其扩展Scrapy-redis的使用,以及使用docker和nomad管理部署的技巧。目标是帮助读者深入理解数据采集的实际应用。