Project Name	Stars	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
Devops Python Tools	709		4 months ago			37	mit	Python
80+ DevOps & Data CLI Tools - AWS, GCP, GCF Python Cloud Functions, Log Anonymizer, Spark, Hadoop, HBase, Hive, Impala, Linux, Docker, Spark Data Converters & Validators (Avro/Parquet/JSON/CSV/INI/XML/YAML), Travis CI, AWS CloudFormation, Elasticsearch, Solr etc.
Divolte Collector	275		3 years ago			63	apache-2.0	Java
Divolte Collector
Storagetapper	269		2 years ago	4	November 19, 2021	21	mit	Go
StorageTapper is a scalable realtime MySQL change data streaming, logical backup and logical replication service
Bigdata File Viewer	269		7 months ago			2	gpl-2.0	Java
A cross-platform (Windows, MAC, Linux) desktop application to view common bigdata binary format like Parquet, ORC, AVRO, etc. Support local file system, HDFS, AWS S3, Azure Blob Storage ,etc.
Hdfs	257	7	7 months ago	15	December 13, 2022	20	mit	Python
API and command line interface for HDFS
Rumble	194		a year ago	4	December 03, 2019	134	other	Java
⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark \| Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) \| No install required (just a jar to download) \| Declarative Machine Learning and more
Camus	87		a year ago			6	apache-2.0	Java
Mirror of Linkedin's Camus
Spark Compaction	52		5 years ago			3	apache-2.0	Java
File compaction tool that runs on top of the Spark framework.
Etl Light	38		7 years ago				mit	Scala
A light Kafka to HDFS/S3 ETL library based on Apache Spark
Arvo2parquet	30		5 years ago			2	mit	Java
Example program that writes Parquet formatted data to plain files (i.e., not Hadoop hdfs); Parquet is a columnar storage format.

Alternatives To Salesforce2hadoop

Select To Compare

Devops Python Tools ⭐ 709

80+ DevOps & Data CLI Tools - AWS, GCP, GCF Python Cloud Functions, Log Anonymizer, Spark, Hadoop, HBase, Hive, Impala, Linux, Docker, Spark Data Converters & Validators (Avro/Parquet/JSON/CSV/INI/XML/YAML), Travis CI, AWS CloudFormation, Elasticsearch, Solr etc.

most recent commit 4 months ago

Divolte Collector ⭐ 275

Divolte Collector

most recent commit 3 years ago

Storagetapper ⭐ 269

StorageTapper is a scalable realtime MySQL change data streaming, logical backup and logical replication service

total releases 4most recent commit 2 years ago

Bigdata File Viewer ⭐ 269

A cross-platform (Windows, MAC, Linux) desktop application to view common bigdata binary format like Parquet, ORC, AVRO, etc. Support local file system, HDFS, AWS S3, Azure Blob Storage ,etc.

most recent commit 7 months ago

Hdfs ⭐ 257

API and command line interface for HDFS

dependent packages 7total releases 15most recent commit 7 months ago

Rumble ⭐ 194

⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark | Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) | No install required (just a jar to download) | Declarative Machine Learning and more

total releases 4most recent commit a year ago

Camus ⭐ 87

Mirror of Linkedin's Camus

most recent commit a year ago

Spark Compaction ⭐ 52

File compaction tool that runs on top of the Spark framework.

most recent commit 5 years ago

Etl Light ⭐ 38

A light Kafka to HDFS/S3 ETL library based on Apache Spark

most recent commit 7 years ago

Arvo2parquet ⭐ 30

Example program that writes Parquet formatted data to plain files (i.e., not Hadoop hdfs); Parquet is a columnar storage format.

most recent commit 5 years ago

Suggest An Alternative To salesforce2hadoop

Alternative Project Comparisons

Salesforce2hadoop vs Devops Python Tools

Salesforce2hadoop vs Divolte Collector

Salesforce2hadoop vs Storagetapper

Salesforce2hadoop vs Bigdata File Viewer

Salesforce2hadoop vs Hdfs

Salesforce2hadoop vs Rumble

Salesforce2hadoop vs Camus

Salesforce2hadoop vs Spark Compaction

Salesforce2hadoop vs Etl Light

Salesforce2hadoop vs Arvo2parquet

Popular Avro Projects

Confluent Kafka Dotnet ⭐ 2,691

Confluent's Apache Kafka .NET client

dependent packages 716total releases 150latest release October 25, 2023most recent commit 4 months ago

Avro ⭐ 2,691

Apache Avro is a data serialization system.

dependent packages 1,481total releases 151latest release September 17, 2023most recent commit 4 months ago

Parquet Mr ⭐ 2,296

Apache Parquet

dependent packages 208total releases 17latest release May 12, 2023most recent commit 4 months ago

Rq ⭐ 2,232

Record Query - A tool for doing record analysis and transformation

dependent packages 2total releases 4latest release March 11, 2017most recent commit 5 months ago

Schema Registry ⭐ 2,092

Confluent Schema Registry for Kafka

most recent commit 4 months ago

Popular Hdfs Projects

Seaweedfs ⭐ 21,063

SeaweedFS is a fast distributed storage system for blobs, objects, files, and data lake, for billions of files! Blob store has O(1) disk seek, cloud tiering. Filer supports Cloud Drive, cross-DC active-active replication, Kubernetes, POSIX FUSE mount, S3 API, S3 Gateway, Hadoop, WebDAV, encryption, Erasure Coding.

dependent packages 2total releases 296latest release April 24, 2021most recent commit 18 days ago

Cat ⭐ 18,237

CAT 作为服务端项目基础组件，提供了 Java, C/C++, Node.js, Python, Go 等多语言客户端，已经在美团点评的基础架构中间件框架（MVC框架，RPC框架，数据库框架，缓存框架等，

total releases 5latest release February 25, 2019most recent commit 5 months ago

Bigdata Notes ⭐ 14,872

大数据入门指南 :star:

most recent commit 4 months ago

Ceph ⭐ 12,859

Ceph is a distributed object, block, and file storage platform

dependent packages 1total releases 1latest release August 26, 2014most recent commit 4 months ago

Mycat Server ⭐ 9,431

most recent commit 7 months ago

Popular Data Processing Categories

Get A Weekly Email With Trending Projects For These Categories

No Spam. Unsubscribe easily at any time.

Scala

Salesforce

Hive

Hdfs

Avro

Privacy | About | Terms | Follow Us On Twitter

Downloads, Dependent Repos, Dependent Packages, Total Releases, Latest Releases data powered by Libraries.io.