Project Name	Stars	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
Distiller	4,252		a year ago			65	apache-2.0	Jupyter Notebook
Neural Network Distiller by Intel AI Lab: a Python package for neural network compression research. https://intellabs.github.io/distiller
Pinto_model_zoo	3,121		3 months ago			11	mit	Python
A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.
Deepsparse	2,729	3	3 months ago	141	December 07, 2023	28	other	Python
Sparsity-aware deep learning inference runtime for CPUs
Micronet	2,177		3 years ago	46	October 06, 2021	70	mit	Python
micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape
Optimum	1,908	53	3 months ago	53	December 06, 2023	295	apache-2.0	Python
🚀 Accelerate training and inference of 🤗 Transformers and 🤗 Diffusers with easy to use hardware optimization tools
Ppq	957		10 months ago			9	apache-2.0	Python
PPL Quantization Tool (PPQ) is a powerful offline neural network quantization tool.
Nncf	725	6	3 months ago	16	November 16, 2023	46	apache-2.0	Python
Neural Network Compression Framework for enhanced OpenVINO™ inference
Deepvac	618		3 years ago	59	June 28, 2021	12	gpl-3.0	Python
PyTorch Project Specification.
Onnx2tf	461	2	3 months ago	438	December 10, 2023	14	mit	Python
Self-Created Tools to convert ONNX files (NCHW) to TensorFlow/TFLite/Keras format (NHWC). The purpose of this tool is to solve the massive Transpose extrapolation problem in onnx-tensorflow (onnx-tf). I don't need a Star, but give me a pull request.
Onnx2tflite	422		6 months ago			10	apache-2.0	Python
Tool for onnx->keras or onnx->tflite. If tool is useful for you, please star it.

Alternatives To Llama.onnx

Select To Compare

Distiller ⭐ 4,252

Neural Network Distiller by Intel AI Lab: a Python package for neural network compression research. https://intellabs.github.io/distiller

most recent commit a year ago

Pinto_model_zoo ⭐ 3,121

A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.

most recent commit 3 months ago

Deepsparse ⭐ 2,729

Sparsity-aware deep learning inference runtime for CPUs

dependent packages 3total releases 141most recent commit 3 months ago

Micronet ⭐ 2,177

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/in

total releases 46most recent commit 3 years ago

Optimum ⭐ 1,908

🚀 Accelerate training and inference of 🤗 Transformers and 🤗 Diffusers with easy to use hardware optimization tools

dependent packages 53total releases 53most recent commit 3 months ago

Ppq ⭐ 957

PPL Quantization Tool (PPQ) is a powerful offline neural network quantization tool.

most recent commit 10 months ago

Nncf ⭐ 725

Neural Network Compression Framework for enhanced OpenVINO™ inference

dependent packages 6total releases 16most recent commit 3 months ago

Deepvac ⭐ 618

PyTorch Project Specification.

total releases 59most recent commit 3 years ago

Onnx2tf ⭐ 461

Self-Created Tools to convert ONNX files (NCHW) to TensorFlow/TFLite/Keras format (NHWC). The purpose of this tool is to solve the massive Transpose extrapolation problem in onnx-tensorflow (onnx-tf). I don't need a Star, but give me a pull request.

dependent packages 2total releases 438most recent commit 3 months ago

Onnx2tflite ⭐ 422

Tool for onnx->keras or onnx->tflite. If tool is useful for you, please star it.

most recent commit 6 months ago

Suggest An Alternative To llama.onnx

Alternative Project Comparisons

Llama.onnx vs Distiller

Llama.onnx vs Pinto_model_zoo

Llama.onnx vs Deepsparse

Llama.onnx vs Micronet

Llama.onnx vs Optimum

Llama.onnx vs Ppq

Llama.onnx vs Nncf

Llama.onnx vs Deepvac

Llama.onnx vs Onnx2tf

Llama.onnx vs Onnx2tflite

Popular Quantization Projects

Chinese Llama Alpaca ⭐ 15,877

中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs)

most recent commit 4 months ago

Llama Factory ⭐ 10,715

Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM)

total releases 19latest release December 03, 2023most recent commit 3 months ago

Faster Whisper ⭐ 8,711

Faster Whisper transcription with CTranslate2

dependent packages 22total releases 12latest release November 26, 2023most recent commit 22 days ago

Mozjpeg ⭐ 5,225

Improved JPEG encoder.

dependent packages 1total releases 2latest release December 01, 2023most recent commit 7 months ago

Pngquant ⭐ 4,995

Lossy PNG compressor — pngquant command based on libimagequant library

total releases 5latest release November 13, 2022most recent commit 3 months ago

Popular Onnx Projects

Yolov5 ⭐ 44,755

YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

dependent packages 2total releases 3latest release June 08, 2022most recent commit 3 months ago

Netron ⭐ 26,068

Visualizer for neural network, deep learning and machine learning models

dependent packages 70total releases 610latest release December 09, 2023most recent commit 10 days ago

Ncnn ⭐ 19,097

ncnn is a high-performance neural network inference framework optimized for the mobile platform

dependent packages 1total releases 26latest release October 27, 2023most recent commit 25 days ago

Onnx ⭐ 16,275

Open standard for machine learning interoperability

dependent packages 493total releases 31latest release October 26, 2023most recent commit 3 months ago

Clip As Service ⭐ 12,160

🏄 Scalable embedding, reasoning, ranking for images and sentences with CLIP

dependent packages 14total releases 56latest release December 20, 2019most recent commit 3 months ago

Popular Machine Learning Categories

Natural Language Processing

Neural Network

Neural

Computer Vision

Convolutional Neural Networks

Opencv