Cmrc2018 Alternatives

Name: ymcui/cmrc2018
Brand: ymcui/cmrc2018
SKU: project/ymcui/cmrc2018
Rating: 4.53 (313 reviews)

A Span-Extraction Dataset for Chinese Machine Reading Comprehension (CMRC 2018)

Categories > Community > Dataset

Suggest Alternative

Stars

313

Alternatives

License

cc-by-sa-4.0

Open Issues

Most Recent Commit

about 4 years ago

Programming Language

Python

Dependent Repos

Dependent Packages

Total Releases

Categories

Programming Languages > Python

Data Processing > Dataset

Machine Learning > Natural Language Processing

Community > Chinese

Content Management > Questions And Answers

Site

Repo

Alternatives To ymcui/cmrc2018

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
brightmart/nlp_chinese_corpus	8,344	0	0	about 3 years ago	0		20	mit
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
lonePatient/awesome-pretrained-chinese-nlp-models	3,738	0	0	over 2 years ago	0		1	mit	Python
Awesome Pretrained Chinese NLP Models，高质量中文预训练模型&大模型&多模态模型&大语言模型集合
wainshine/Chinese-Names-Corpus	3,719	0	0	over 2 years ago	0		7	apache-2.0
中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。
CLUEbenchmark/CLUE	3,345	0	0	about 3 years ago	0		73		Python
中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
Belval/TextRecognitionDataGenerator	2,901	0	0	over 2 years ago	12	August 02, 2022	134	mit	Python
A synthetic data generator for text recognition
CLUEbenchmark/CLUEDatasetSearch	2,778	0	0	over 3 years ago	0		6		Python
搜索所有中文NLP数据集，附常用英文NLP数据集
GanjinZero/awesome_Chinese_medical_NLP	1,847	0	0	over 2 years ago	0		1
中文医学NLP公开资源整理：术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/模型/论文/etc
CLUEbenchmark/CLUENER2020	1,359	0	0	over 3 years ago	0		48		Python
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
didi/ChineseNLP	1,329	0	0	almost 5 years ago	0		3		HTML
Datasets, SOTA results of every fields of Chinese NLP
alibaba/data-juicer	994	0	0	over 2 years ago	3	September 28, 2023	16	apache-2.0	Python
A one-stop data processing system to make data higher-quality, juicier, and more digestible for LLMs! 🍎 🍋 🌽 ➡️ ➡️🍸 🍹 🍷为大语言模型提供更高质量、更丰富、更易”消化“的数据！

Alternatives To ymcui/cmrc2018

Select To Compare

brightmart/nlp_chinese_corpus ⭐ 8,344

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

dependent packages 0 total releases 0 most recent commit about 3 years ago

lonePatient/awesome-pretrained-chinese-nlp-models ⭐ 3,738

Awesome Pretrained Chinese NLP Models，高质量中文预训练模型&大模型&多模态模型&大语言模型集合

dependent packages 0 total releases 0 most recent commit over 2 years ago

wainshine/Chinese-Names-Corpus ⭐ 3,719

中文人名语料库。人名生成器。中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。可用于中文分词、人名实体识别。

dependent packages 0 total releases 0 most recent commit over 2 years ago

CLUEbenchmark/CLUE ⭐ 3,345

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

dependent packages 0 total releases 0 most recent commit about 3 years ago

Belval/TextRecognitionDataGenerator ⭐ 2,901

A synthetic data generator for text recognition

dependent packages 0 total releases 12 most recent commit over 2 years ago downloads badge

CLUEbenchmark/CLUEDatasetSearch ⭐ 2,778

搜索所有中文NLP数据集，附常用英文NLP数据集

dependent packages 0 total releases 0 most recent commit over 3 years ago

GanjinZero/awesome_Chinese_medical_NLP ⭐ 1,847

中文医学NLP公开资源整理：术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/模型/论文/etc

dependent packages 0 total releases 0 most recent commit over 2 years ago

CLUEbenchmark/CLUENER2020 ⭐ 1,359

CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition

dependent packages 0 total releases 0 most recent commit over 3 years ago

didi/ChineseNLP ⭐ 1,329

Datasets, SOTA results of every fields of Chinese NLP

dependent packages 0 total releases 0 most recent commit almost 5 years ago

alibaba/data-juicer ⭐ 994

A one-stop data processing system to make data higher-quality, juicier, and more digestible for LLMs! 🍎 🍋 🌽 ➡️ ➡️🍸 🍹 🍷为大语言模型提供更高质量、更丰富、更易”消化“的数据！

dependent packages 0 total releases 3 most recent commit over 2 years ago downloads badge

Suggest An Alternative To cmrc2018

Alternative Project Comparisons

ymcui/cmrc2018 vs Nlp_chinese_corpus

ymcui/cmrc2018 vs Awesome Pretrained Chinese Nlp Models

ymcui/cmrc2018 vs Chinese Names Corpus

ymcui/cmrc2018 vs Clue

ymcui/cmrc2018 vs Textrecognitiondatagenerator

ymcui/cmrc2018 vs Cluedatasetsearch

ymcui/cmrc2018 vs Awesome_chinese_medical_nlp

ymcui/cmrc2018 vs Cluener2020

ymcui/cmrc2018 vs Chinesenlp

ymcui/cmrc2018 vs Data Juicer

Popular Chinese Projects

iptv-org/iptv⭐ 74,798

Collection of publicly available IPTV channels from all over the world

Anduin2017/HowToCook⭐ 57,819

程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).

ElemeFE/element⭐ 53,857

A Vue.js 2.0 UI Toolkit for Web

d2l-ai/d2l-zh⭐ 53,401

《动手学深度学习》：面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。

chinese-poetry/chinese-poetry⭐ 45,313

The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人，21050首词。

Popular Dataset Projects

public-apis/public-apis⭐ 276,890

A collective list of free APIs

awesomedata/awesome-public-datasets⭐ 57,596

A topic-centric list of HQ open datasets.

apache/superset⭐ 56,358

Apache Superset is a Data Visualization and Data Exploration Platform

aymericdamien/TensorFlow-Examples⭐ 43,109

TensorFlow Tutorial and Examples for Beginners (support TF v1 & v2)

HumanSignal/label-studio⭐ 26,994

Label Studio is a multi-type data labeling and annotation tool with standardized output format

Popular Community Categories

Social

Chinese

Conference

Japanese

Feedback

Meetup

Cats

Open Data

China

Stanford