Weibosearch Alternatives

Name: tpeng/weibosearch
Brand: tpeng/weibosearch
SKU: project/tpeng/weibosearch
Rating: 4.47 (144 reviews)

A distributed Sina Weibo Search spider base on Scrapy and Redis.

Categories > Data Storage > Search

Suggest Alternative

Stars

144

Alternatives

License

No license specified

Open Issues

Most Recent Commit

about 13 years ago

Programming Language

Python

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Python

Computer Science > Search

Data Storage > Redis

Security > Password

Data Processing > Spider

Data Processing > Scrapy

Social Media > Weibo

Companies > Sina

Repo

Alternatives To tpeng/weibosearch

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
crawlab-team/crawlab	10,521	0	0	over 2 years ago	1	March 03, 2019	58	bsd-3-clause	Go
Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台，支持任何语言和框架
rmax/scrapy-redis	5,392	176	21	over 2 years ago	18	July 26, 2022	29	mit	Python
Redis-based components for Scrapy.
SpiderClub/haipproxy	5,329	1	0	over 3 years ago	7	June 18, 2018	44	mit	Python
:sparkling_heart: High available distributed ip proxy pool, powerd by Scrapy and Redis
gnemoug/distribute_crawler	3,176	0	0	about 9 years ago	0		26		Python
使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现
istresearch/scrapy-cluster	1,137	18	2	over 2 years ago	15	December 23, 2020	17	mit	Python
This Scrapy project uses Redis and Kafka to create a distributed on demand scraping cluster.
mtianyan/FunpySpiderSearchEngine	862	0	0	over 4 years ago	0		3	mit	Python
Word2vec 千人千面个性化搜索 + Scrapy2.3.0(爬取数据) + ElasticSearch7.9.1(存储数据并提供对外Restful API) + Django3.1.1 搜索
lb2281075105/Python-Spider	680	0	0	almost 4 years ago	0		0	apache-2.0	Python
豆瓣电影top250、斗鱼爬取json数据以及爬取美女图片、淘宝、有缘、CrawlSpider爬取红娘网相亲人的部分基本信息以及红娘网分布式爬取和存储redis、爬虫小demo、Selenium、爬取多点、django开发接口、爬取有缘网信息、模拟知乎登录、模拟github登录、模拟图虫网登录、爬取多点商城整站数据、爬取微信公众号历史文章、爬取微信群或者微信好友分享的文章、itchat监听指定微信公众号分享的文章
TurboWay/spiderman	498	0	0	over 3 years ago	0		3	mit	Python
基于 scrapy-redis 的通用分布式爬虫框架
zhangslob/awesome_crawl	206	0	0	over 6 years ago	0		0		Python
腾讯新闻、知乎话题、微博粉丝，Tumblr爬虫、斗鱼弹幕、妹子图爬虫、分布式设计等
guapier/zi5book	183	0	0	over 7 years ago	0		0		Python
book.zi5.me全站kindle电子书籍爬取，按照作者书籍名分类，每本书有mobi和equb两种格式，采用分布式进行全站爬取

Alternatives To tpeng/weibosearch

Select To Compare

crawlab-team/crawlab ⭐ 10,521

Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台，支持任何语言和框架

dependent packages 0 total releases 1 most recent commit over 2 years ago downloads badge

rmax/scrapy-redis ⭐ 5,392

Redis-based components for Scrapy.

dependent packages 21 total releases 18 most recent commit over 2 years ago downloads badge

SpiderClub/haipproxy ⭐ 5,329

:sparkling_heart: High available distributed ip proxy pool, powerd by Scrapy and Redis

dependent packages 0 total releases 7 most recent commit over 3 years ago downloads badge

gnemoug/distribute_crawler ⭐ 3,176

使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现

dependent packages 0 total releases 0 most recent commit about 9 years ago

istresearch/scrapy-cluster ⭐ 1,137

This Scrapy project uses Redis and Kafka to create a distributed on demand scraping cluster.

dependent packages 2 total releases 15 most recent commit over 2 years ago downloads badge

mtianyan/FunpySpiderSearchEngine ⭐ 862

Word2vec 千人千面个性化搜索 + Scrapy2.3.0(爬取数据) + ElasticSearch7.9.1(存储数据并提供对外Restful API) + Django3.1.1 搜索

dependent packages 0 total releases 0 most recent commit over 4 years ago

lb2281075105/Python-Spider ⭐ 680

豆瓣电影top250、斗鱼爬取json数据以及爬取美女图片、淘宝、有缘、CrawlSpider爬取红娘网相亲人的部分基本信息以及红娘网分布式爬取和存储redis、爬虫小demo、Selenium、爬取多点、django开发接口、爬取有缘网信息、模拟知乎登录、模拟github登录、模拟图虫网登录、爬取多点商城整站数据、爬取微信公众号历史文章、爬取微信群或者微信好友分享的文章、itchat监听指定微信公众号分享的文章

dependent packages 0 total releases 0 most recent commit almost 4 years ago

TurboWay/spiderman ⭐ 498

基于 scrapy-redis 的通用分布式爬虫框架

dependent packages 0 total releases 0 most recent commit over 3 years ago

zhangslob/awesome_crawl ⭐ 206

腾讯新闻、知乎话题、微博粉丝，Tumblr爬虫、斗鱼弹幕、妹子图爬虫、分布式设计等

dependent packages 0 total releases 0 most recent commit over 6 years ago

guapier/zi5book ⭐ 183

book.zi5.me全站kindle电子书籍爬取，按照作者书籍名分类，每本书有mobi和equb两种格式，采用分布式进行全站爬取

dependent packages 0 total releases 0 most recent commit over 7 years ago

Suggest An Alternative To weibosearch

Alternative Project Comparisons

tpeng/weibosearch vs Crawlab

tpeng/weibosearch vs Scrapy Redis

tpeng/weibosearch vs Haipproxy

tpeng/weibosearch vs Distribute_crawler

tpeng/weibosearch vs Scrapy Cluster

tpeng/weibosearch vs Funpyspidersearchengine

tpeng/weibosearch vs Python Spider

tpeng/weibosearch vs Spiderman

tpeng/weibosearch vs Awesome_crawl

tpeng/weibosearch vs Zi5book

Popular Redis Projects

Snailclimb/JavaGuide⭐ 140,256

「Java学习+面试指南」一份涵盖大部分 Java 程序员所需要掌握的核心知识。准备 Java 面试，首选 JavaGuide！

macrozheng/mall⭐ 73,367

mall项目是一套电商系统，包括前台商城系统及后台管理系统，基于SpringBoot+MyBatis实现，采用Docker容器化部署。前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等模块。

doocs/advanced-java⭐ 72,955

😮 Core Interview Questions & Answers For Experienced Java(Backend) Developers | 互联网 Java 工程师进阶知识完全扫盲：涵盖高并发、分布式、高可用、微服务、海量数据处理等领域知识

redis/redis⭐ 63,146

Redis is an in-memory database that persists on disk. The data model is key-value, but many different kind of values are supported: Strings, Lists, Sets, Sorted Sets, Hashes, Streams, HyperLogLogs, Bitmaps.

xingshaocheng/architect-awesome⭐ 57,200

后端架构师技术图谱

Popular Scrapy Projects

scrapy/scrapy⭐ 49,918

Scrapy, a fast high-level web crawling & scraping framework for Python.

wistbean/learn_python3_spider⭐ 14,425

python爬虫教程系列、从0到1学习python爬虫，包括浏览器抓包，手机APP抓包，如 fiddler、mitmproxy，各种爬虫涉及的模块的使用，如：requests、beautifulSoup、selenium、appium、scrapy等，以及IP代理，验证码识别，Mysql，MongoDB数据库的python使用，多线程多进程爬虫的使用，css 爬虫加密逆向破解，JS爬虫逆向，分布式爬虫，爬虫项目实战实例等

iamshuaidi/CS-Book⭐ 11,024

计算机类常用电子书整理，并且附带下载链接，包括Java，Python，Linux，Go，C，C++，数据结构与算法，人工智能，计算机基础，面试，设计模式，数据库，前端等书籍

scrapinghub/portia⭐ 8,982

Visual scraping for Scrapy

lining0806/PythonSpiderNotes⭐ 6,473

Python入门网络爬虫之精华版

Popular Data Storage Categories

Database

Mysql

Redis

Mongodb

Postgresql

Firebase

Elasticsearch

Backup

Sqlite