Hadoopy Alternatives

Name: bwhite/hadoopy
Brand: bwhite/hadoopy
SKU: project/bwhite/hadoopy
Rating: 4.51 (244 reviews)

Python MapReduce library written in Cython. Visit us in #hadoopy on freenode. See the link below for documentation and tutorials.

Categories > Data Processing > Hadoop

Suggest Alternative

Stars

244

Alternatives

License

gpl-3.0

Open Issues

Most Recent Commit

over 10 years ago

Programming Language

Monthly Downloads

Dependent Repos

Dependent Packages

Total Releases

Latest Release

December 15, 2021

Categories

Programming Languages > Python

Programming Languages > C

Data Processing > Hadoop

Programming Languages > Cython

Data Storage > Hdfs

Data Processing > Mapreduce

Site

Repo

Alternatives To bwhite/hadoopy

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
donnemartin/data-science-ipython-notebooks	25,668	0	0	over 2 years ago	0		34	other	Python
Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.
heibaiying/BigData-Notes	14,872	0	0	over 2 years ago	0		39		Java
大数据入门指南 :star:
andkret/Cookbook	12,557	0	0	over 2 years ago	0		111	apache-2.0
The Data Engineering Cookbook
apache/hive	5,222	0	0	over 2 years ago	0		89	apache-2.0	Java
Apache Hive
twitter/scalding	3,433	37	40	about 3 years ago	43	September 14, 2016	319	apache-2.0	Scala
A Scala API for Cascading
Yelp/mrjob	2,584	112	2	over 3 years ago	62	December 15, 2021	211	other	Python
Run MapReduce jobs on Hadoop or Amazon Web Services
Qihoo360/poseidon	1,543	0	0	about 9 years ago	0		9	bsd-3-clause	Go
A search engine which can hold 100 trillion lines of log data.
mongodb/mongo-hadoop	1,511	78	10	over 4 years ago	14	January 27, 2017	16		Java
MongoDB Connector for Hadoop
will-che/BigData-Interview	1,397	0	0	almost 5 years ago	0
:dart: :star2:[大数据面试题]分享自己在网络上收集的大数据相关的面试题以及自己的答案总结.目前包含Hadoop/Hive/Spark/Flink/Hbase/Kafka/Zookeeper框架的面试题知识总结
collabH/bigdata-growth	1,162	0	0	over 2 years ago	0		1	mit	Shell
大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。

Alternatives To bwhite/hadoopy

Select To Compare

donnemartin/data-science-ipython-notebooks ⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

dependent packages 0 total releases 0 most recent commit over 2 years ago

heibaiying/BigData-Notes ⭐ 14,872

大数据入门指南 :star:

dependent packages 0 total releases 0 most recent commit over 2 years ago

andkret/Cookbook ⭐ 12,557

The Data Engineering Cookbook

dependent packages 0 total releases 0 most recent commit over 2 years ago

apache/hive ⭐ 5,222

Apache Hive

dependent packages 0 total releases 0 most recent commit over 2 years ago

twitter/scalding ⭐ 3,433

A Scala API for Cascading

dependent packages 40 total releases 43 most recent commit about 3 years ago

Yelp/mrjob ⭐ 2,584

Run MapReduce jobs on Hadoop or Amazon Web Services

dependent packages 2 total releases 62 most recent commit over 3 years ago downloads badge

Qihoo360/poseidon ⭐ 1,543

A search engine which can hold 100 trillion lines of log data.

dependent packages 0 total releases 0 most recent commit about 9 years ago

mongodb/mongo-hadoop ⭐ 1,511

MongoDB Connector for Hadoop

dependent packages 10 total releases 14 most recent commit over 4 years ago

will-che/BigData-Interview ⭐ 1,397

:dart: :star2:[大数据面试题]分享自己在网络上收集的大数据相关的面试题以及自己的答案总结.目前包含Hadoop/Hive/Spark/Flink/Hbase/Kafka/Zookeeper框架的面试题知识总结

dependent packages 0 total releases 0 most recent commit almost 5 years ago

collabH/bigdata-growth ⭐ 1,162

大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。

dependent packages 0 total releases 0 most recent commit over 2 years ago

Suggest An Alternative To hadoopy

Alternative Project Comparisons

bwhite/hadoopy vs Data Science Ipython Notebooks

bwhite/hadoopy vs Bigdata Notes

bwhite/hadoopy vs Cookbook

bwhite/hadoopy vs Hive

bwhite/hadoopy vs Scalding

bwhite/hadoopy vs Mrjob

bwhite/hadoopy vs Poseidon

bwhite/hadoopy vs Mongo Hadoop

bwhite/hadoopy vs Bigdata Interview

bwhite/hadoopy vs Bigdata Growth

Popular Mapreduce Projects

redisson/redisson⭐ 22,313

Redisson - Easy Redis Java client with features of In-Memory Data Grid. Sync/Async/RxJava/Reactive API. Over 50 Redis based Java objects and services: Set, Multimap, SortedSet, Map, List, Queue, Deque, Semaphore, Lock, AtomicLong, Map Reduce, Bloom filter, Spring Cache, Tomcat, Scheduler, JCache API, Hibernate, RPC, local cache ...

PowerJob/PowerJob⭐ 6,249

Enterprise job scheduling middleware with distributed computing ability.

donnemartin/dev-setup⭐ 5,802

macOS development environment setup: Easy-to-understand instructions with automated setup scripts for developer tools like Vim, Sublime Text, Bash, iTerm, Python data analysis, Spark, Hadoop MapReduce, AWS, Heroku, JavaScript web development, Android development, common data stores, and dev-based OS X defaults.

chrislusf/gleam⭐ 3,555

Fast, efficient, and scalable distributed map/reduce system, DAG execution, in memory or on disk, written in pure Go, runs standalone or distributedly.

chaozh/MIT-6.824⭐ 2,976

Basic Sources for MIT 6.824 Distributed Systems Class

Popular Hadoop Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

dmlc/xgboost⭐ 25,253

Scalable, Portable and Distributed Gradient Boosting (GBDT, GBRT or GBM) Library, for Python, R, Java, Scala, C++ and more. Runs on single machine, Hadoop, Spark, Dask, Flink and DataFlow

spotify/luigi⭐ 17,046

Luigi is a Python module that helps you build complex pipelines of batch jobs. It handles dependency resolution, workflow management, visualization etc. It also comes with Hadoop support built in.

Tencent/APIJSON⭐ 16,277

🏆 零代码、全功能、强安全 ORM 库 🚀 后端接口和文档零代码，前端(客户端) 定制返回 JSON 的数据和结构。 🏆 A JSON Transmission Protocol and an ORM Library 🚀 provides APIs and Docs without writing any code.

deeplearning4j/deeplearning4j⭐ 13,290

Suite of tools for deploying and training deep learning models using the JVM. Highlights include model import for keras, tensorflow, and onnx/pytorch, a modular and tiny c++ library for running math code and a java based math library on top of the core c++ library. Also includes samediff: a pytorch/tensorflow like library for running deep learning using automatic differentiation.

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper