Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
Sentencepiece	8,851	120	787	5 months ago	34	May 02, 2023	32	apache-2.0	C++
Unsupervised text tokenizer for Neural Network-based text generation.
Catalyst	3,151	19	19	a year ago	108	April 29, 2022	6	apache-2.0	Python
Accelerated deep learning R&D
Awesome Deeplearning	2,670			5 months ago			462	apache-2.0	Jupyter Notebook
深度学习入门课、资深课、特色课、学术案例、产业实践案例、深度学习知识百科及面试题库The course, case and knowledge of Deep Learning and AI
Gse	2,352	14	21	7 months ago	82	January 16, 2023	12	apache-2.0	Go
Go efficient multilingual NLP and text segmentation; support English, Chinese, Japanese and others.
Deepnlp	1,311			6 years ago	8	January 01, 2018	44	mit	Python
Deep Learning NLP Pipeline implemented on Tensorflow
Jieba Php	1,193	29	8	2 years ago	17	August 15, 2022	21	mit	PHP
"結巴"中文分詞：做最好的 PHP 中文分詞、中文斷詞組件。 / "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best PHP Chinese word segmentation module.
Natasha	1,085	3	9	9 months ago	19	July 24, 2023	24	mit	Python
Solves basic Russian NLP tasks, API for lower level Natasha projects
Xmnlp	940	1		2 years ago	14	November 12, 2022	3	apache-2.0	Python
xmnlp：提供中文分词, 词性标注, 命名体识别，情感分析，文本纠错，文本转拼音，文本摘要，偏旁部首，句子表征及文本相似度计算等功能
Jieba Rs	585	5	15	a year ago	40	July 16, 2023	9	mit	Rust
The Jieba Chinese Word Segmentation Implemented in Rust
Ekphrasis	583	7		2 years ago	54	May 17, 2022	18	mit	Python
Ekphrasis is a text processing tool, geared towards text from social networks, such as Twitter or Facebook. Ekphrasis performs tokenization, word normalization, word segmentation (for splitting hashtags) and spell correction, using word statistics from 2 big corpora (english Wikipedia, twitter - 330mil english tweets).

Alternatives To Tokenizer

Select To Compare

Sentencepiece ⭐ 8,851

Unsupervised text tokenizer for Neural Network-based text generation.

dependent packages 787total releases 34most recent commit 5 months ago

Catalyst ⭐ 3,151

Accelerated deep learning R&D

dependent packages 19total releases 108most recent commit a year ago

Awesome Deeplearning ⭐ 2,670

深度学习入门课、资深课、特色课、学术案例、产业实践案例、深度学习知识百科及面试题库The course, case and knowledge of Deep Learning and AI

most recent commit 5 months ago

Gse ⭐ 2,352

Go efficient multilingual NLP and text segmentation; support English, Chinese, Japanese and others.

dependent packages 21total releases 82most recent commit 7 months ago

Deepnlp ⭐ 1,311

Deep Learning NLP Pipeline implemented on Tensorflow

total releases 8most recent commit 6 years ago

Jieba Php ⭐ 1,193

"結巴"中文分詞：做最好的 PHP 中文分詞、中文斷詞組件。 / "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best PHP Chinese word segmentation module.

dependent packages 8total releases 17most recent commit 2 years ago

Natasha ⭐ 1,085

Solves basic Russian NLP tasks, API for lower level Natasha projects

dependent packages 9total releases 19most recent commit 9 months ago

Xmnlp ⭐ 940

xmnlp：提供中文分词, 词性标注, 命名体识别，情感分析，文本纠错，文本转拼音，文本摘要，偏旁部首，句子表征及文本相似度计算等功能

total releases 14most recent commit 2 years ago

Jieba Rs ⭐ 585

The Jieba Chinese Word Segmentation Implemented in Rust

dependent packages 15total releases 40most recent commit a year ago

Ekphrasis ⭐ 583

Ekphrasis is a text processing tool, geared towards text from social networks, such as Twitter or Facebook. Ekphrasis performs tokenization, word normalization, word segmentation (for splitting hashtags) and spell correction, using word statistics from 2 big corpora (english Wikipedia, twitter - 330mil english tweets).

total releases 54most recent commit 2 years ago

Suggest An Alternative To tokenizer

Alternative Project Comparisons

Tokenizer vs Sentencepiece

Tokenizer vs Catalyst

Tokenizer vs Awesome Deeplearning

Tokenizer vs Gse

Tokenizer vs Deepnlp

Tokenizer vs Jieba Php

Tokenizer vs Natasha

Tokenizer vs Xmnlp

Tokenizer vs Jieba Rs

Tokenizer vs Ekphrasis

Popular Natural Language Processing Projects

Transformers ⭐ 127,491

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

dependent packages 2,484total releases 125latest release November 15, 2023most recent commit 19 days ago

D2l Zh ⭐ 56,684

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

dependent packages 1total releases 51latest release August 18, 2023most recent commit 3 months ago

Ailearning ⭐ 38,419

AiLearning：数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2

dependent packages 2total releases 8latest release March 20, 2022most recent commit 4 months ago

Made With Ml ⭐ 36,177

Learn how to design, develop, deploy and iterate on production-grade ML applications.

total releases 5latest release May 15, 2019most recent commit 7 months ago

Bert ⭐ 36,099

TensorFlow code and pre-trained models for BERT

dependent packages 10total releases 5latest release August 11, 2020most recent commit 8 months ago

Popular Segmentation Projects

Jieba ⭐ 31,881

结巴中文分词

dependent packages 419total releases 32latest release January 20, 2020most recent commit 5 months ago

Deep Learning For Image Processing ⭐ 18,759

deep learning for image processing including classification and object-detection etc.

most recent commit 7 months ago

Imgaug ⭐ 13,682

Image augmentation for machine learning experiments.

dependent packages 141total releases 11latest release February 05, 2020most recent commit a year ago

Albumentations ⭐ 13,493

Fast image augmentation library and an easy-to-use wrapper around other libraries. Documentation: https://albumentations.ai/docs/ Paper about the library: https://www.mdpi.com/2078-2489/11/2/125

dependent packages 273total releases 53latest release June 10, 2023most recent commit 2 months ago

Paddledetection ⭐ 11,653

Object Detection toolkit based on PaddlePaddle. It supports object detection, instance segmentation, multiple object tracking and real-time multi-person keypoint detection.

dependent packages 1total releases 9latest release September 19, 2022most recent commit 6 months ago

Popular Machine Learning Categories

Natural Language Processing

Neural Network

Neural

Computer Vision

Convolutional Neural Networks

Opencv