基于 Python 的工商信息采集工具 v11.0

Hadoop 13

42.31MB 2024-05-15

#工商信息采集 #Python #Scrapy #代理IP #验证码识别 #MySQL #数据导出

利用 Scrapy 爬虫框架、代理 IP 池、请求模拟和验证码识别技术，该工具可每日更新采集全国工商信息。数据存储在 MySQL 数据库中，可导出 1.8 亿条工商基本信息和 36 维度详细信息，支持 SQL 和 Excel 格式。