Hyperdrive Alternatives

Name: AbsaOSS/hyperdrive
Brand: AbsaOSS/hyperdrive
SKU: project/AbsaOSS/hyperdrive
Rating: 4.43 (41 reviews)

Extensible streaming ingestion pipeline on top of Apache Spark

Categories > Data Processing > Schema

Suggest Alternative

Stars

Alternatives

License

apache-2.0

Open Issues

Most Recent Commit

about 3 years ago

Programming Language

Scala

Dependent Repos

Dependent Packages

Total Releases

Latest Release

November 20, 2020

Categories

Programming Languages > Scala

Data Formats > Schema

Data Processing > Pipeline

Networking > Streaming

Data Processing > Spark

Data Processing > Kafka

Data Processing > Apache Spark

Repo

Alternatives To AbsaOSS/hyperdrive

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
dagster-io/dagster	9,467	2	133	over 2 years ago	585	December 07, 2023	2,343	apache-2.0	Python
An orchestration platform for the development, production, and observation of data assets.
mage-ai/mage-ai	6,324	0	0	over 2 years ago	314	December 06, 2023	189	apache-2.0	Python
🧙 The modern replacement for Airflow. Build, run, and manage data pipelines for integrating and transforming data.
salesforce/TransmogrifAI	2,099	0	3	over 4 years ago	9	June 11, 2020	44	bsd-3-clause	Scala
TransmogrifAI (pronounced trăns-mŏgˈrə-fī) is an AutoML library for building modular, reusable, strongly typed machine learning workflows on Apache Spark with minimal hand-tuning
tencentmusic/cube-studio	1,710	0	0	over 2 years ago	1	October 13, 2022	74	other	Jupyter Notebook
cube studio开源云原生一站式机器学习/深度学习AI平台，支持sso登录，多租户/多项目组，数据资产对接，notebook在线开发，拖拉拽任务流pipeline编排，多机多卡分布式算法训练，超参搜索，推理服务VGPU，多集群调度，边缘计算，serverless，标注平台，自动化标注，数据集管理，大模型一键微调，llmops，私有知识库，AI应用商店，支持模型一键开发/推理/微调，私有化部署，支持国产cpu/gpu/npu芯片，支持RDMA，支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式
combust/mleap	1,479	15	12	over 2 years ago	26	May 07, 2021	109	apache-2.0	Scala
MLeap: Deploy ML Pipelines to Production
ColZer/DigAndBuried	645	0	0	almost 10 years ago	0		4		GCC Machine Description
挖坑与填坑
san089/goodreads_etl_pipeline	593	0	0	over 6 years ago	0		0	mit	Python
An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.
amplab/keystone	472	0	0	about 9 years ago	5	March 03, 2017	39	apache-2.0	Scala
Simplifying robust end-to-end machine learning on Apache Spark.
jamesward/koober	301	0	0	over 8 years ago	0		3		Scala
lifeomic/sparkflow	301	0	0	almost 3 years ago	13	May 18, 2019	9	mit	Python
Easy to use library to bring Tensorflow on Apache Spark

Alternatives To AbsaOSS/hyperdrive

Select To Compare

dagster-io/dagster ⭐ 9,467

An orchestration platform for the development, production, and observation of data assets.

dependent packages 133 total releases 585 most recent commit over 2 years ago downloads badge

mage-ai/mage-ai ⭐ 6,324

🧙 The modern replacement for Airflow. Build, run, and manage data pipelines for integrating and transforming data.

dependent packages 0 total releases 314 most recent commit over 2 years ago downloads badge

salesforce/TransmogrifAI ⭐ 2,099

TransmogrifAI (pronounced trăns-mŏgˈrə-fī) is an AutoML library for building modular, reusable, strongly typed machine learning workflows on Apache Spark with minimal hand-tuning

dependent packages 3 total releases 9 most recent commit over 4 years ago

tencentmusic/cube-studio ⭐ 1,710

cube studio开源云原生一站式机器学习/深度学习AI平台，支持sso登录，多租户/多项目组，数据资产对接，notebook在线开发，拖拉拽任务流pipeline编排，多机多卡分布式算法训练，超参搜索，推理服务VGPU，多集群调度，边缘计算，serverless，标注平台，自动化标注，数据集管理，大模型一键微调，llmops，私有知识库，AI应用商店，支持模型一键开发/推理/微调，私有化部署，支持国产cpu/gpu/npu芯片，支持RDMA，支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式

dependent packages 0 total releases 1 most recent commit over 2 years ago downloads badge

combust/mleap ⭐ 1,479

MLeap: Deploy ML Pipelines to Production

dependent packages 12 total releases 26 most recent commit over 2 years ago

ColZer/DigAndBuried ⭐ 645

挖坑与填坑

dependent packages 0 total releases 0 most recent commit almost 10 years ago

san089/goodreads_etl_pipeline ⭐ 593

An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.

dependent packages 0 total releases 0 most recent commit over 6 years ago

amplab/keystone ⭐ 472

Simplifying robust end-to-end machine learning on Apache Spark.

dependent packages 0 total releases 5 most recent commit about 9 years ago

jamesward/koober ⭐ 301

dependent packages 0 total releases 0 most recent commit over 8 years ago

lifeomic/sparkflow ⭐ 301

Easy to use library to bring Tensorflow on Apache Spark

dependent packages 0 total releases 13 most recent commit almost 3 years ago downloads badge

Suggest An Alternative To hyperdrive

Alternative Project Comparisons

AbsaOSS/hyperdrive vs Dagster

AbsaOSS/hyperdrive vs Mage Ai

AbsaOSS/hyperdrive vs Transmogrifai

AbsaOSS/hyperdrive vs Cube Studio

AbsaOSS/hyperdrive vs Mleap

AbsaOSS/hyperdrive vs Digandburied

AbsaOSS/hyperdrive vs Goodreads_etl_pipeline

AbsaOSS/hyperdrive vs Keystone

AbsaOSS/hyperdrive vs Koober

AbsaOSS/hyperdrive vs Sparkflow

Popular Spark Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

donnemartin/data-science-ipython-notebooks⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

getredash/redash⭐ 24,479

Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.

yeasy/docker_practice⭐ 23,279

Learn and understand Docker&Container technologies, with real DevOps practice!

DataTalksClub/data-engineering-zoomcamp⭐ 19,461

Free Data Engineering course!

Popular Pipeline Projects

apache/airflow⭐ 33,219

Apache Airflow - A platform to programmatically author, schedule, and monitor workflows

nushell/nushell⭐ 28,304

A new type of shell

vectordotdev/vector⭐ 21,215

A high-performance observability data pipeline.

jina-ai/jina⭐ 19,573

☁️ Build multimodal AI applications with cloud-native stack

spotify/luigi⭐ 17,046

Luigi is a Python module that helps you build complex pipelines of batch jobs. It handles dependency resolution, workflow management, visualization etc. It also comes with Hadoop support built in.

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper