Colly：用于 Go 语言的优雅刮取和爬取框架

数据挖掘 13

110.1KB 2024-05-15

#Go语言 #框架 #爬取 #刮取 #提取数据 #数据挖掘 #数据处理 #归档

清晰易懂的 API
高效快速（单内核每秒可处理 1k 以上请求）
管理请求延迟和域最大并发数
自动处理 Cookie 和会话
支持同步、异步和并行抓取
自动缓存和自动编码非 Unicode 响应
支持 Robots.txt
可通过环境变量配置分布式刮取
提供扩展