Gatk Alternatives

Name: broadinstitute/gatk
Brand: broadinstitute/gatk
SKU: project/broadinstitute/gatk
Rating: 4.94 (1549 reviews)

Official code repository for GATK versions 4 and up

Categories > Data Processing > Spark

Suggest Alternative

Stars

1,549

Alternatives

License

other

Open Issues

1,299

Most Recent Commit

over 2 years ago

Programming Language

Java

Dependent Repos

Dependent Packages

Total Releases

Latest Release

March 16, 2023

Categories

Programming Languages > Java

Data Processing > Spark

Data Processing > Bioinformatics

Science > Genome

Science > Genomics

Science > Sequencing

Science > Dna

Science > Ngs

Version Control > Git Lfs

Site

Repo

Alternatives To broadinstitute/gatk

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
broadinstitute/gatk	1,549	0	2	over 2 years ago	46	March 16, 2023	1,299	other	Java
Official code repository for GATK versions 4 and up
bigdatagenomics/adam	966	20	17	over 2 years ago	14	December 16, 2020	35	apache-2.0	Scala
ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.
aehrc/VariantSpark	121	0	0	about 3 years ago	40	October 03, 2025	62	other	JavaScript
machine learning for genomic variants
GenomicsDB/GenomicsDB	88	0	2	over 2 years ago	35	October 12, 2023	28	other	C++
High performance data storage for importing, querying and transforming variants.
TileDB-Inc/TileDB-VCF	79	0	0	over 2 years ago	0		18	mit	C++
Efficient variant-call data storage and retrieval library using the TileDB storage library.
bigdatagenomics/cannoli	37	0	1	over 2 years ago	11	December 17, 2020	1	apache-2.0	Scala
Distributed execution of bioinformatics tools on Apache Spark. Apache 2 licensed.
gorpipe/gor	37	0	0	over 2 years ago	0		7	agpl-3.0	Java
GORpipe is a tool based on a genomic ordered relational architecture and allows analysis of large sets of genomic and phenotypic tabular data using declarative query language, in a parallel execution engine.
mcapuccini/spark-tutorial	34	0	0	over 10 years ago	0		0	apache-2.0	Scala
Introduction to predictive modeling in Spark with applications in pharmaceutical bioinformatics
jtnystrom/Discount	14	0	0	about 3 years ago	6	February 13, 2023	0	gpl-3.0	Scala
Very large scale k-mer counting and analysis on Apache Spark.
allenday/spark-genome-alignment-demo	13	0	0	about 10 years ago	0		2		Scala
An example of bioinformatics and bigdata tools can playing nicely together

Alternatives To broadinstitute/gatk

Select To Compare

broadinstitute/gatk ⭐ 1,549

Official code repository for GATK versions 4 and up

dependent packages 2 total releases 46 most recent commit over 2 years ago

bigdatagenomics/adam ⭐ 966

ADAM is a genomics analysis platform with specialized file formats built using Apache Avro, Apache Spark, and Apache Parquet. Apache 2 licensed.

dependent packages 17 total releases 14 most recent commit over 2 years ago

aehrc/VariantSpark ⭐ 121

machine learning for genomic variants

dependent packages 0 total releases 40 most recent commit about 3 years ago downloads badge

GenomicsDB/GenomicsDB ⭐ 88

High performance data storage for importing, querying and transforming variants.

dependent packages 2 total releases 35 most recent commit over 2 years ago

TileDB-Inc/TileDB-VCF ⭐ 79

Efficient variant-call data storage and retrieval library using the TileDB storage library.

dependent packages 0 total releases 0 most recent commit over 2 years ago

bigdatagenomics/cannoli ⭐ 37

Distributed execution of bioinformatics tools on Apache Spark. Apache 2 licensed.

dependent packages 1 total releases 11 most recent commit over 2 years ago

gorpipe/gor ⭐ 37

GORpipe is a tool based on a genomic ordered relational architecture and allows analysis of large sets of genomic and phenotypic tabular data using declarative query language, in a parallel execution engine.

dependent packages 0 total releases 0 most recent commit over 2 years ago

mcapuccini/spark-tutorial ⭐ 34

Introduction to predictive modeling in Spark with applications in pharmaceutical bioinformatics

dependent packages 0 total releases 0 most recent commit over 10 years ago

jtnystrom/Discount ⭐ 14

Very large scale k-mer counting and analysis on Apache Spark.

dependent packages 0 total releases 6 most recent commit about 3 years ago

allenday/spark-genome-alignment-demo ⭐ 13

An example of bioinformatics and bigdata tools can playing nicely together

dependent packages 0 total releases 0 most recent commit about 10 years ago

Suggest An Alternative To gatk

Alternative Project Comparisons

broadinstitute/gatk vs Gatk

broadinstitute/gatk vs Adam

broadinstitute/gatk vs Variantspark

broadinstitute/gatk vs Genomicsdb

broadinstitute/gatk vs Tiledb Vcf

broadinstitute/gatk vs Cannoli

broadinstitute/gatk vs Gor

broadinstitute/gatk vs Spark Tutorial

broadinstitute/gatk vs Discount

broadinstitute/gatk vs Spark Genome Alignment Demo

Popular Spark Projects

apache/spark⭐ 37,661

Apache Spark - A unified analytics engine for large-scale data processing

donnemartin/data-science-ipython-notebooks⭐ 25,668

Data science Python notebooks: Deep learning (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, big data (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python essentials, AWS, and various command lines.

getredash/redash⭐ 24,479

Make Your Company Data Driven. Connect to any data source, easily visualize, dashboard and share your data.

yeasy/docker_practice⭐ 23,279

Learn and understand Docker&Container technologies, with real DevOps practice!

DataTalksClub/data-engineering-zoomcamp⭐ 19,461

Free Data Engineering course!

Popular Bioinformatics Projects

Developer-Y/cs-video-courses⭐ 62,887

List of Computer Science courses with video lectures.

plotly/dash⭐ 19,976

Data Apps & Dashboards for Python. No JavaScript Required.

biopython/biopython⭐ 3,918

Official git repository for Biopython (originally converted from CVS)

google/deepvariant⭐ 2,978

DeepVariant is an analysis pipeline that uses a deep neural network to call genetic variants from next-generation DNA sequencing data.

seandavi/awesome-single-cell⭐ 2,784

Community-curated list of software packages and data resources for single-cell, including RNA-seq, ATAC-seq, etc.

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper