Project Name | Stars | Downloads | Repos Using This | Packages Using This | Most Recent Commit | Total Releases | Latest Release | Open Issues | License | Language |
---|---|---|---|---|---|---|---|---|---|---|
Python Spider | 680 | 2 years ago | apache-2.0 | Python | ||||||
豆瓣电影top250、斗鱼爬取json数据以及爬取美女图片、淘宝、有缘、CrawlSpider爬取红娘网相亲人的部分基本信息以及红娘网分布式爬取和存储redis、爬虫小demo、Selenium、爬取多点、django开发接口、爬取有缘网信息、模拟知乎登录、模拟github登录、模拟图虫网登录、爬取多点商城整站数据、爬取微信公众号历史文章、爬取微信群或者微信好友分享的文章、itchat监听指定微信公众号分享的文章 | ||||||||||
Javacrawling | 252 | 7 years ago | 10 | Java | ||||||
"奇伢爬虫"是基于sprint boot 、 WebMagic 实现 微信公众号文章、新闻、csdn、info等网站文章爬取,可以动态设置文章爬取规则、清洗规则,基本实现了爬取大部分网站的文章。 | ||||||||||
Crawlerproject | 147 | 2 years ago | 20 | Python | ||||||
爬虫项目:链家网(普通/scrapy)、虎扑、维基百科、百度地图api、房天下(分布式爬虫)、微信公众号(代理池爬取) | ||||||||||
Python Notes | 103 | 5 years ago | n,ull | mit | Python | |||||
Python related technologies used in work: crawler, data analysis, timing tasks, RPC, page parsing, decorator, built-in functions, Python objects, multi-threading, multi-process, asynchronous, redis, mongodb, mysql, openstack, etc. | ||||||||||
Docs | 102 | 5 years ago | 3 | |||||||
《数据采集从入门到放弃》源码。内容简介:爬虫介绍、就业情况、爬虫工程师面试题 ;HTTP协议介绍; Requests使用 ;解析器Xpath介绍; MongoDB与MySQL; 多线程爬虫; Scrapy介绍 ;Scrapy-redis介绍; 使用docker部署; 使用nomad管理docker集群; 使用EFK查询docker日志 | ||||||||||
Xpathfeed | 13 | 7 years ago | 2 | other | CSS | |||||
generate feed from xpath | ||||||||||
Proxypool | 9 | 7 years ago | mit | Python | ||||||
A ProxyPool based on Scrapy and Redis(基于Scrapy和Redis的代理池) | ||||||||||
Redisxmlconcept | 5 | 10 years ago | 1 | C | ||||||
Proof of concept for Xml2Redis project |