Chinese Nlp Corpus Alternatives

Name: OYE93/Chinese-NLP-Corpus
Brand: OYE93/Chinese-NLP-Corpus
SKU: project/OYE93/Chinese-NLP-Corpus
Rating: 4.56 (378 reviews)

Collections of Chinese NLP corpus

Categories > Data Processing > Dataset

Suggest Alternative

Stars

378

Alternatives

License

No license specified

Open Issues

Most Recent Commit

over 5 years ago

Programming Language

Python

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Python

Data Processing > Dataset

Machine Learning > Natural Language Processing

Community > Chinese

Data Processing > Corpus

Science > Medical

Machine Learning > Ner

Social Media > Weibo

Machine Learning > Chinese Nlp

Repo

Alternatives To OYE93/Chinese-NLP-Corpus

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
brightmart/nlp_chinese_corpus	8,344	0	0	about 3 years ago	0		20	mit
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
nl8590687/ASRT_SpeechRecognition	7,253	0	0	over 2 years ago	1	October 23, 2020	101	gpl-3.0	Python
A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
shibing624/pycorrector	4,928	0	1	over 2 years ago	30	November 07, 2023	27	apache-2.0	Python
pycorrector is a toolkit for text error correction. 文本纠错，实现了Kenlm，T5，MacBERT，ChatGLM3，LLaMA等模型应用在纠错场景，开箱即用。
wainshine/Chinese-Names-Corpus	3,719	0	0	over 2 years ago	0		7	apache-2.0
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
CLUEbenchmark/CLUE	3,345	0	0	about 3 years ago	0		73		Python
中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
dbiir/UER-py	2,802	0	0	over 2 years ago	0		132	apache-2.0	Python
Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo
CLUEbenchmark/CLUEDatasetSearch	2,778	0	0	over 3 years ago	0		6		Python
搜索所有中文NLP数据集，附常用英文NLP数据集
jinfagang/weibo_terminater	2,265	0	0	over 6 years ago	0		9		Python
Final Weibo Crawler Scrap Anything From Weibo, comments, weibo contents, followers, anything. The Terminator
imcaspar/gpt2-ml	1,674	0	0	about 3 years ago	0		22	apache-2.0	Python
GPT2 for Multiple Languages, including pretrained models. GPT2 多语言支持, 15亿参数中文预训练模型
crownpku/Rasa_NLU_Chi	1,466	0	0	over 2 years ago	0		79	apache-2.0	Python
Turn Chinese natural language into structured data 中文自然语言理解

Alternatives To OYE93/Chinese-NLP-Corpus

Select To Compare

brightmart/nlp_chinese_corpus ⭐ 8,344

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

dependent packages 0 total releases 0 most recent commit about 3 years ago

nl8590687/ASRT_SpeechRecognition ⭐ 7,253

A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统

dependent packages 0 total releases 1 most recent commit over 2 years ago downloads badge

shibing624/pycorrector ⭐ 4,928

pycorrector is a toolkit for text error correction. 文本纠错，实现了Kenlm，T5，MacBERT，ChatGLM3，LLaMA等模型应用在纠错场景，开箱即用。

dependent packages 1 total releases 30 most recent commit over 2 years ago downloads badge

wainshine/Chinese-Names-Corpus ⭐ 3,719

中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。

dependent packages 0 total releases 0 most recent commit over 2 years ago

CLUEbenchmark/CLUE ⭐ 3,345

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

dependent packages 0 total releases 0 most recent commit about 3 years ago

dbiir/UER-py ⭐ 2,802

Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo

dependent packages 0 total releases 0 most recent commit over 2 years ago

CLUEbenchmark/CLUEDatasetSearch ⭐ 2,778

搜索所有中文NLP数据集，附常用英文NLP数据集

dependent packages 0 total releases 0 most recent commit over 3 years ago

jinfagang/weibo_terminater ⭐ 2,265

Final Weibo Crawler Scrap Anything From Weibo, comments, weibo contents, followers, anything. The Terminator

dependent packages 0 total releases 0 most recent commit over 6 years ago

imcaspar/gpt2-ml ⭐ 1,674

GPT2 for Multiple Languages, including pretrained models. GPT2 多语言支持, 15亿参数中文预训练模型

dependent packages 0 total releases 0 most recent commit about 3 years ago

crownpku/Rasa_NLU_Chi ⭐ 1,466

Turn Chinese natural language into structured data 中文自然语言理解

dependent packages 0 total releases 0 most recent commit over 2 years ago

Suggest An Alternative To Chinese-NLP-Corpus

Alternative Project Comparisons

OYE93/Chinese-NLP-Corpus vs Nlp_chinese_corpus

OYE93/Chinese-NLP-Corpus vs Asrt_speechrecognition

OYE93/Chinese-NLP-Corpus vs Pycorrector

OYE93/Chinese-NLP-Corpus vs Chinese Names Corpus

OYE93/Chinese-NLP-Corpus vs Clue

OYE93/Chinese-NLP-Corpus vs Uer Py

OYE93/Chinese-NLP-Corpus vs Cluedatasetsearch

OYE93/Chinese-NLP-Corpus vs Weibo_terminater

OYE93/Chinese-NLP-Corpus vs Gpt2 Ml

OYE93/Chinese-NLP-Corpus vs Rasa_nlu_chi

Popular Corpus Projects

nltk/nltk⭐ 12,699

NLTK Source

stanfordnlp/GloVe⭐ 6,480

Software in C and data files for the popular GloVe model for distributed word representations, a.k.a. word vectors or embeddings

codertimo/BERT-pytorch⭐ 5,605

Google AI 2018 BERT pytorch implementation

ibab/tensorflow-wavenet⭐ 5,362

A TensorFlow implementation of DeepMind's WaveNet paper

niderhoff/nlp-datasets⭐ 5,235

Alphabetical list of free/public domain datasets with text data for use in Natural Language Processing (NLP)

Popular Chinese Projects

iptv-org/iptv⭐ 74,798

Collection of publicly available IPTV channels from all over the world

Anduin2017/HowToCook⭐ 57,819

程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).

ElemeFE/element⭐ 53,857

A Vue.js 2.0 UI Toolkit for Web

d2l-ai/d2l-zh⭐ 53,401

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

chinese-poetry/chinese-poetry⭐ 45,313

The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人，21050首词。

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper