Aws Glue Libs Alternatives

Name: awslabs/aws-glue-libs
Brand: awslabs/aws-glue-libs
SKU: project/awslabs/aws-glue-libs
Rating: 4.63 (568 reviews)

AWS Glue Libraries are additions and enhancements to Spark for ETL operations.

Categories > Data Processing > Amazon Web Services

Suggest Alternative

Stars

568

Alternatives

License

other

Open Issues

Most Recent Commit

almost 3 years ago

Programming Language

Python

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Python

Cloud Computing > Amazon Web Services

Data Processing > Spark

Data Processing > Hadoop

Software Quality > Pytest

Data Processing > Etl

Repo

Alternatives To awslabs/aws-glue-libs

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
apache/doris	10,666	0	0	over 2 years ago	8	September 27, 2023	2,332	apache-2.0	Java
Apache Doris is an easy-to-use, high performance and unified analytics database.
dagster-io/dagster	9,467	2	133	over 2 years ago	585	December 07, 2023	2,343	apache-2.0	Python
An orchestration platform for the development, production, and observation of data assets.
mage-ai/mage-ai	6,324	0	0	over 2 years ago	314	December 06, 2023	189	apache-2.0	Python
🧙 The modern replacement for Airflow. Build, run, and manage data pipelines for integrating and transforming data.
aws-samples/aws-glue-samples	1,334	0	0	over 2 years ago	0		37	mit-0	Python
AWS Glue code samples
AlexIoannides/pyspark-example-project	1,034	0	0	over 3 years ago	0		11		Python
Example project implementing best practices for PySpark ETL jobs and applications.
san089/goodreads_etl_pipeline	593	0	0	over 6 years ago	0		0	mit	Python
An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.
awslabs/aws-glue-libs	568	0	0	almost 3 years ago	0		96	other	Python
AWS Glue Libraries are additions and enhancements to Spark for ETL operations.
YotpoLtd/metorikku	536	0	0	over 3 years ago	126	February 27, 2023	65	mit	Scala
A simplified, lightweight ETL Framework based on Apache Spark
zhaoyachao/zdh_web	379	0	0	over 2 years ago	0		19	apache-2.0	Java
大数据采集,抽取平台,zdh_web是zdh系列服务的可视化管理平台，包含数据采集,调度,权限,审批流,私域营销等模块
houshanren/big_data_architect_skills	353	0	0	almost 7 years ago	0		1
一个大数据架构师应该掌握的技能

Alternatives To awslabs/aws-glue-libs

Select To Compare

apache/doris ⭐ 10,666

Apache Doris is an easy-to-use, high performance and unified analytics database.

dependent packages 0 total releases 8 most recent commit over 2 years ago downloads badge

dagster-io/dagster ⭐ 9,467

An orchestration platform for the development, production, and observation of data assets.

dependent packages 133 total releases 585 most recent commit over 2 years ago downloads badge

mage-ai/mage-ai ⭐ 6,324

🧙 The modern replacement for Airflow. Build, run, and manage data pipelines for integrating and transforming data.

dependent packages 0 total releases 314 most recent commit over 2 years ago downloads badge

aws-samples/aws-glue-samples ⭐ 1,334

AWS Glue code samples

dependent packages 0 total releases 0 most recent commit over 2 years ago

AlexIoannides/pyspark-example-project ⭐ 1,034

Example project implementing best practices for PySpark ETL jobs and applications.

dependent packages 0 total releases 0 most recent commit over 3 years ago

san089/goodreads_etl_pipeline ⭐ 593

An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.

dependent packages 0 total releases 0 most recent commit over 6 years ago

awslabs/aws-glue-libs ⭐ 568

AWS Glue Libraries are additions and enhancements to Spark for ETL operations.

dependent packages 0 total releases 0 most recent commit almost 3 years ago

YotpoLtd/metorikku ⭐ 536

A simplified, lightweight ETL Framework based on Apache Spark

dependent packages 0 total releases 126 most recent commit over 3 years ago

zhaoyachao/zdh_web ⭐ 379

大数据采集,抽取平台,zdh_web是zdh系列服务的可视化管理平台，包含数据采集,调度,权限,审批流,私域营销等模块

dependent packages 0 total releases 0 most recent commit over 2 years ago

houshanren/big_data_architect_skills ⭐ 353

一个大数据架构师应该掌握的技能

dependent packages 0 total releases 0 most recent commit almost 7 years ago

Suggest An Alternative To aws-glue-libs

Alternative Project Comparisons

awslabs/aws-glue-libs vs Doris

awslabs/aws-glue-libs vs Dagster

awslabs/aws-glue-libs vs Mage Ai

awslabs/aws-glue-libs vs Aws Glue Samples

awslabs/aws-glue-libs vs Pyspark Example Project

awslabs/aws-glue-libs vs Goodreads_etl_pipeline

awslabs/aws-glue-libs vs Aws Glue Libs

awslabs/aws-glue-libs vs Metorikku

awslabs/aws-glue-libs vs Zdh_web

awslabs/aws-glue-libs vs Big_data_architect_skills

Popular Etl Projects

pingcap/tidb⭐ 35,604

TiDB is an open-source, cloud-native, distributed, MySQL-Compatible database for elastic scale and real-time analytics. Try AI-powered Chat2Query free at : https://tidbcloud.com/free-trial

apache/airflow⭐ 33,219

Apache Airflow - A platform to programmatically author, schedule, and monitor workflows

airbytehq/airbyte⭐ 12,918

The leading data integration platform for ETL / ELT data pipelines from APIs, databases & files to data warehouses, data lakes & data lakehouses. Both self-hosted and Cloud-hosted.

pentaho/pentaho-kettle⭐ 7,194

Pentaho Data Integration ( ETL ) a.k.a Kettle

benthosdev/benthos⭐ 7,051

Fancy stream processing made operationally mundane

Popular Spark Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

donnemartin/data-science-ipython-notebooks⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

getredash/redash⭐ 24,479

Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.

yeasy/docker_practice⭐ 23,279

Learn and understand Docker&Container technologies, with real DevOps practice!

DataTalksClub/data-engineering-zoomcamp⭐ 19,461

Free Data Engineering course!

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper