Sentences Alternatives

Name: neurosnap/sentences
Brand: neurosnap/sentences
SKU: project/neurosnap/sentences
Rating: 4.56 (391 reviews)

A multilingual command line sentence tokenizer in Golang

Categories > Compilers > Command Line

Suggest Alternative

Stars

391

Alternatives

License

mit

Open Issues

Most Recent Commit

over 2 years ago

Programming Language

Dependent Repos

Dependent Packages

127

Total Releases

Latest Release

May 26, 2021

Categories

Programming Languages > Golang

Command Line Interface > Command Line

Companies > Amd

Text Processing > Multilingual

Compilers > Tokenizer

Site

Repo

Alternatives To neurosnap/sentences

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
BLKSerene/Wordless	649	0	0	over 2 years ago	0		0	gpl-3.0	Python
An Integrated Corpus Tool With Multilingual Support for the Study of Language, Literature, and Translation
neurosnap/sentences	391	31	127	over 2 years ago	7	May 26, 2021	5	mit	Go
A multilingual command line sentence tokenizer in Golang
artitw/text2text	268	0	0	over 2 years ago	134	October 21, 2023	27	other	Python
Text2Text: Crosslingual NLP/G toolkit
bitextor/bitextor	260	0	0	almost 3 years ago	0		4	gpl-3.0	Python
Bitextor generates translation memories from multilingual websites
winkjs/wink-tokenizer	47	29	15	over 4 years ago	19	January 27, 2022	0	mit	JavaScript
Multilingual tokenizer that automatically tags each token with its type
hottolink/hottoSNS-bert	41	0	0	about 5 years ago	0		2	other	Python
hottoSNS-BERT: 大規模SNSコーパスによる文分散表現モデル
yeontaek/BERT-Korean-Model	34	0	0	over 6 years ago	0		1	apache-2.0
BERT with SentencePiece for Korean text
jonsafari/tok-tok	26	0	0	about 9 years ago	0		1	apache-2.0	Python
A fast, simple, multilingual tokenizer
jerinphilip/ilmulti	12	0	0	almost 6 years ago	2	August 30, 2020	4	mit	Python
Tooling to play around with multilingual machine translation for Indian Languages.
liuzl/tokenizer	11	0	0	over 7 years ago	1	November 28, 2018	0	apache-2.0	Go
Natural Language Tokenizer

Alternatives To neurosnap/sentences

Select To Compare

BLKSerene/Wordless ⭐ 649

An Integrated Corpus Tool With Multilingual Support for the Study of Language, Literature, and Translation

dependent packages 0 total releases 0 most recent commit over 2 years ago

neurosnap/sentences ⭐ 391

A multilingual command line sentence tokenizer in Golang

dependent packages 127 total releases 7 most recent commit over 2 years ago

artitw/text2text ⭐ 268

Text2Text: Crosslingual NLP/G toolkit

dependent packages 0 total releases 134 most recent commit over 2 years ago downloads badge

bitextor/bitextor ⭐ 260

Bitextor generates translation memories from multilingual websites

dependent packages 0 total releases 0 most recent commit almost 3 years ago

winkjs/wink-tokenizer ⭐ 47

Multilingual tokenizer that automatically tags each token with its type

dependent packages 15 total releases 19 most recent commit over 4 years ago downloads badge

hottolink/hottoSNS-bert ⭐ 41

hottoSNS-BERT: 大規模SNSコーパスによる文分散表現モデル

dependent packages 0 total releases 0 most recent commit about 5 years ago

yeontaek/BERT-Korean-Model ⭐ 34

BERT with SentencePiece for Korean text

dependent packages 0 total releases 0 most recent commit over 6 years ago

jonsafari/tok-tok ⭐ 26

A fast, simple, multilingual tokenizer

dependent packages 0 total releases 0 most recent commit about 9 years ago

jerinphilip/ilmulti ⭐ 12

Tooling to play around with multilingual machine translation for Indian Languages.

dependent packages 0 total releases 2 most recent commit almost 6 years ago downloads badge

liuzl/tokenizer ⭐ 11

Natural Language Tokenizer

dependent packages 0 total releases 1 most recent commit over 7 years ago

Suggest An Alternative To sentences

Alternative Project Comparisons

neurosnap/sentences vs Wordless

neurosnap/sentences vs Sentences

neurosnap/sentences vs Text2text

neurosnap/sentences vs Bitextor

neurosnap/sentences vs Wink Tokenizer

neurosnap/sentences vs Hottosns Bert

neurosnap/sentences vs Bert Korean Model

neurosnap/sentences vs Tok Tok

neurosnap/sentences vs Ilmulti

neurosnap/sentences vs Tokenizer

Popular Tokenizer Projects

huggingface/tokenizers⭐ 8,056

💥 Fast State-of-the-Art Tokenizers optimized for Research and Production

Morizeyao/GPT2-Chinese⭐ 7,249

Chinese version of GPT2 training code, using BERT tokenizer.

sebastianbergmann/php-token-stream⭐ 6,457

Wrapper around PHP's tokenizer extension.

sindresorhus/file-type⭐ 3,366

Detect the file type of a Buffer/Uint8Array/ArrayBuffer

teamtnt/tntsearch⭐ 3,004

A fully featured full text search engine written in PHP

Popular Multilingual Projects

PaddlePaddle/PaddleOCR⭐ 36,076

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

adityatelange/hugo-PaperMod⭐ 7,897

A fast, clean, responsive Hugo theme.

facebookresearch/LASER⭐ 3,460

Language-Agnostic SEntence Representations

fluentmigrator/fluentmigrator⭐ 3,076

Fluent migrations framework for .NET

facebookresearch/MUSE⭐ 2,844

A library for Multilingual Unsupervised or Supervised word Embeddings

Popular Compilers Categories

Llvm

Abstract Syntax Tree

Gcc

Clang

Emscripten

Wsl

Jit

Ghc

Lexer

Ida