Adam Alternatives

Name: bigdatagenomics/adam
Brand: bigdatagenomics/adam
SKU: project/bigdatagenomics/adam
Rating: 4.77 (966 reviews)

ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.

Categories > Data Processing > Apache

Suggest Alternative

Stars

966

Alternatives

License

apache-2.0

Open Issues

Most Recent Commit

over 2 years ago

Programming Language

Scala

Dependent Repos

Dependent Packages

Total Releases

Latest Release

December 16, 2020

Categories

Programming Languages > Python

Programming Languages > Java

Programming Languages > R

Programming Languages > Scala

Web Servers > Apache

Data Processing > Spark

Data Processing > Bioinformatics

Data Processing > Big Data

Science > Genomics

Science > Sequencing

Data Processing > Avro

Data Processing > Parquet

Repo

Alternatives To bigdatagenomics/adam

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
apache/iceberg	5,179	0	0	over 2 years ago	3	October 29, 2022	1,485	apache-2.0	Java
Apache Iceberg
gchq/Gaffer	1,724	4	31	over 2 years ago	101	November 14, 2023	142	apache-2.0	Java
A large-scale entity and relation database supporting aggregation of properties
uber/petastorm	1,693	0	8	over 2 years ago	86	February 03, 2023	174	apache-2.0	Python
Petastorm library enables single machine or distributed training and evaluation of deep learning models from datasets in Apache Parquet format. It supports ML frameworks such as Tensorflow, Pytorch, and PySpark and can be used from pure Python code.
bigdatagenomics/adam	966	20	17	over 2 years ago	14	December 16, 2020	35	apache-2.0	Scala
ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.
HariSekhon/DevOps-Python-tools	709	0	0	over 2 years ago	0		37	mit	Python
80+ DevOps & Data CLI Tools - AWS, GCP, GCF Python Cloud Functions, Log Anonymizer, Spark, Hadoop, HBase, Hive, Impala, Linux, Docker, Spark Data Converters & Validators (Avro/Parquet/JSON/CSV/INI/XML/YAML), Travis CI, AWS CloudFormation, Elasticsearch, Solr etc.
SuperCowPowers/zat	409	0	1	over 2 years ago	11	January 26, 2023	10	mit	Jupyter Notebook
Zeek Analysis Tools (ZAT): Processing and analysis of Zeek network data with Pandas, scikit-learn, Kafka and Spark
Netflix/iceberg	409	0	0	almost 5 years ago	0		27	apache-2.0	Java
Iceberg is a table format for large, slow-moving tabular data
adobe-research/spindle	333	0	0	over 11 years ago	0		2	apache-2.0	JavaScript
Next-generation web analytics processing with Scala, Spark, and Parquet.
RumbleDB/rumble	194	0	0	about 3 years ago	4	December 03, 2019	134	other	Java
⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark \| Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) \| No install required (just a jar to download) \| Declarative Machine Learning and more
aiyanbo/spark-programming-guide-zh-cn	188	0	0	over 3 years ago	0		0	other
Spark 编程指南简体中文版

Alternatives To bigdatagenomics/adam

Select To Compare

apache/iceberg ⭐ 5,179

Apache Iceberg

dependent packages 0 total releases 3 most recent commit over 2 years ago downloads badge

gchq/Gaffer ⭐ 1,724

A large-scale entity and relation database supporting aggregation of properties

dependent packages 31 total releases 101 most recent commit over 2 years ago

uber/petastorm ⭐ 1,693

Petastorm library enables single machine or distributed training and evaluation of deep learning models from datasets in Apache Parquet format. It supports ML frameworks such as Tensorflow, Pytorch, and PySpark and can be used from pure Python code.

dependent packages 8 total releases 86 most recent commit over 2 years ago downloads badge

bigdatagenomics/adam ⭐ 966

ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.

dependent packages 17 total releases 14 most recent commit over 2 years ago

HariSekhon/DevOps-Python-tools ⭐ 709

80+ DevOps & Data CLI Tools - AWS, GCP, GCF Python Cloud Functions, Log Anonymizer, Spark, Hadoop, HBase, Hive, Impala, Linux, Docker, Spark Data Converters & Validators (Avro/Parquet/JSON/CSV/INI/XML/YAML), Travis CI, AWS CloudFormation, Elasticsearch, Solr etc.

dependent packages 0 total releases 0 most recent commit over 2 years ago

SuperCowPowers/zat ⭐ 409

Zeek Analysis Tools (ZAT): Processing and analysis of Zeek network data with Pandas, scikit-learn, Kafka and Spark

dependent packages 1 total releases 11 most recent commit over 2 years ago downloads badge

Netflix/iceberg ⭐ 409

Iceberg is a table format for large, slow-moving tabular data

dependent packages 0 total releases 0 most recent commit almost 5 years ago

adobe-research/spindle ⭐ 333

Next-generation web analytics processing with Scala, Spark, and Parquet.

dependent packages 0 total releases 0 most recent commit over 11 years ago

RumbleDB/rumble ⭐ 194

⛈️ RumbleDB 1.21.0 "Hawthorn blossom" 🌳 for Apache Spark | Run queries on your large-scale, messy JSON-like data (JSON, text, CSV, Parquet, ROOT, AVRO, SVM...) | No install required (just a jar to download) | Declarative Machine Learning and more

dependent packages 0 total releases 4 most recent commit about 3 years ago

aiyanbo/spark-programming-guide-zh-cn ⭐ 188

Spark 编程指南简体中文版

dependent packages 0 total releases 0 most recent commit over 3 years ago

Suggest An Alternative To adam

Alternative Project Comparisons

bigdatagenomics/adam vs Iceberg

bigdatagenomics/adam vs Gaffer

bigdatagenomics/adam vs Petastorm

bigdatagenomics/adam vs Adam

bigdatagenomics/adam vs Devops Python Tools

bigdatagenomics/adam vs Zat

bigdatagenomics/adam vs Iceberg

bigdatagenomics/adam vs Spindle

bigdatagenomics/adam vs Rumble

bigdatagenomics/adam vs Spark Programming Guide Zh Cn

Popular Parquet Projects

multiprocessio/dsq⭐ 3,401

Commandline tool for running SQL queries against JSON, CSV, Excel, Parquet, and more.

roapi/roapi⭐ 2,969

Create full-fledged APIs for slowly moving datasets without writing a single line of code.

apache/parquet-mr⭐ 2,296

Apache Parquet

jqnatividad/qsv⭐ 2,079

CSVs sliced, diced & analyzed.

apache/drill⭐ 1,856

Apache Drill is a distributed MPP query layer for self describing data

Popular Spark Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

donnemartin/data-science-ipython-notebooks⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

getredash/redash⭐ 24,479

Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.

yeasy/docker_practice⭐ 23,279

Learn and understand Docker&Container technologies, with real DevOps practice!

DataTalksClub/data-engineering-zoomcamp⭐ 19,461

Free Data Engineering course!

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper