Pytorch Original Transformer Alternatives

Name: gordicaleksa/pytorch-original-transformer
Brand: gordicaleksa/pytorch-original-transformer
SKU: project/gordicaleksa/pytorch-original-transformer
Rating: 4.56 (376 reviews)

My implementation of the original transformer model (Vaswani et al.). I've additionally included the playground.py file for visualizing otherwise seemingly hard concepts. Currently included IWSLT pretrained models.

Categories > Machine Learning > Deep Learning

Suggest Alternative

Stars

376

Alternatives

License

mit

Open Issues

Most Recent Commit

over 5 years ago

Programming Language

Jupyter Notebook

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Python

Data Processing > Jupyter Notebook

Machine Learning > Deep Learning

Machine Learning > Pytorch

Data Processing > Translation

Machine Learning > Attention

Machine Learning > Attention Mechanism

Repo

Alternatives To gordicaleksa/pytorch-original-transformer

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
huggingface/transformers	119,240	5,683	10,762	over 2 years ago	235	June 15, 2026	946	apache-2.0	Python
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
AUTOMATIC1111/stable-diffusion-webui	118,856	0	0	over 2 years ago	2	January 17, 2022	1,826	agpl-3.0	Python
Stable Diffusion web UI
pytorch/pytorch	74,794	15,038	27,114	over 2 years ago	59	June 17, 2026	13,261	other	Python
Tensors and Dynamic neural networks in Python with strong GPU acceleration
keras-team/keras	60,198	794	1,481	over 2 years ago	121	May 07, 2026	183	apache-2.0	Python
Deep Learning for humans
CorentinJ/Real-Time-Voice-Cloning	49,550	0	0	over 2 years ago	0		187	other	Python
Clone a voice in 5 seconds to generate arbitrary speech in real-time
ultralytics/yolov5	44,755	0	2	over 2 years ago	3	June 08, 2022	144	agpl-3.0	Python
YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite
labmlai/annotated_deep_learning_paper_implementations	41,877	0	2	over 2 years ago	79	November 05, 2023	30	mit	Jupyter Notebook
🧑‍🏫 60 Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), gans(cyclegan, stylegan2, ...), 🎮 reinforcement learning (ppo, dqn), capsnet, distillation, ... 🧠
babysor/MockingBird	36,869	0	0	6 months ago	2	February 28, 2022	446	other	Python
🚀Clone a voice in 5 seconds to generate arbitrary speech in real-time
GokuMohandas/Made-With-ML	34,775	0	0	over 2 years ago	5	May 15, 2019	6	mit	Jupyter Notebook
Learn how to design, develop, deploy and iterate on production-grade ML applications.
TencentARC/GFPGAN	33,600	0	9	over 2 years ago	11	September 20, 2022	305	other	Python
GFPGAN aims at developing Practical Algorithms for Real-world Face Restoration.

Alternatives To gordicaleksa/pytorch-original-transformer

Select To Compare

huggingface/transformers ⭐ 119,240

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

dependent packages 10,762 total releases 235 most recent commit over 2 years ago downloads badge

AUTOMATIC1111/stable-diffusion-webui ⭐ 118,856

Stable Diffusion web UI

dependent packages 0 total releases 2 most recent commit over 2 years ago downloads badge

pytorch/pytorch ⭐ 74,794

Tensors and Dynamic neural networks in Python with strong GPU acceleration

dependent packages 27,114 total releases 59 most recent commit over 2 years ago downloads badge

keras-team/keras ⭐ 60,198

Deep Learning for humans

dependent packages 1,481 total releases 121 most recent commit over 2 years ago downloads badge

CorentinJ/Real-Time-Voice-Cloning ⭐ 49,550

Clone a voice in 5 seconds to generate arbitrary speech in real-time

dependent packages 0 total releases 0 most recent commit over 2 years ago

ultralytics/yolov5 ⭐ 44,755

YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

dependent packages 2 total releases 3 most recent commit over 2 years ago downloads badge

labmlai/annotated_deep_learning_paper_implementations ⭐ 41,877

🧑‍🏫 60 Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), gans(cyclegan, stylegan2, ...), 🎮 reinforcement learning (ppo, dqn), capsnet, distillation, ... 🧠

dependent packages 2 total releases 79 most recent commit over 2 years ago downloads badge

babysor/MockingBird ⭐ 36,869

🚀Clone a voice in 5 seconds to generate arbitrary speech in real-time

dependent packages 0 total releases 2 most recent commit 6 months ago downloads badge

GokuMohandas/Made-With-ML ⭐ 34,775

Learn how to design, develop, deploy and iterate on production-grade ML applications.

dependent packages 0 total releases 5 most recent commit over 2 years ago downloads badge

TencentARC/GFPGAN ⭐ 33,600

GFPGAN aims at developing Practical Algorithms for Real-world Face Restoration.

dependent packages 9 total releases 11 most recent commit over 2 years ago downloads badge

Suggest An Alternative To pytorch-original-transformer

Alternative Project Comparisons

gordicaleksa/pytorch-original-transformer vs Transformers

gordicaleksa/pytorch-original-transformer vs Stable Diffusion Webui

gordicaleksa/pytorch-original-transformer vs Pytorch

gordicaleksa/pytorch-original-transformer vs Keras

gordicaleksa/pytorch-original-transformer vs Real Time Voice Cloning

gordicaleksa/pytorch-original-transformer vs Yolov5

gordicaleksa/pytorch-original-transformer vs Annotated_deep_learning_paper_implementations

gordicaleksa/pytorch-original-transformer vs Mockingbird

gordicaleksa/pytorch-original-transformer vs Made With Ml

gordicaleksa/pytorch-original-transformer vs Gfpgan

Popular Deep Learning Projects

tensorflow/tensorflow⭐ 180,196

An Open Source Machine Learning Framework for Everyone

opencv/opencv⭐ 73,748

Open Source Computer Vision Library

Developer-Y/cs-video-courses⭐ 62,887

List of Computer Science courses with video lectures.

d2l-ai/d2l-zh⭐ 53,401

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

deepfakes/faceswap⭐ 48,125

Deepfakes Software For All

Popular Pytorch Projects

chinese-poetry/chinese-poetry⭐ 45,313

The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人，21050首词。

huggingface/pytorch-image-models⭐ 36,940

The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more

facebookresearch/fairseq⭐ 32,238

Facebook AI Research Sequence-to-Sequence Toolkit written in Python.

yunjey/pytorch-tutorial⭐ 27,137

PyTorch Tutorial for Deep Learning Researchers

open-mmlab/mmdetection⭐ 26,886

OpenMMLab Detection Toolbox and Benchmark

Popular Machine Learning Categories

Deep Learning

Machine Learning

Pytorch

Tensorflow

Natural Language Processing

Neural Network

Neural

Computer Vision

Convolutional Neural Networks

Opencv