Awesome Open Source
Search
Programming Languages
Languages
All Categories
Categories
About
Search results for python jieba
jieba
x
python
x
209 search results found
Jieba
⭐
26,693
结巴中文分词
Pkuseg Python
⭐
6,001
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
Textrank4zh
⭐
2,903
🌳从中文文本中自动提取关键词和摘要
Harvesttext
⭐
1,803
文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等)
Rasa_nlu_chi
⭐
1,430
Turn Chinese natural language into structured data 中文自然语言理解
Thulac Python
⭐
1,341
An Efficient Lexical Analyzer for Chinese
Textinfoexp
⭐
1,269
自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等
Gnes
⭐
1,095
GNES is Generic Neural Elastic Search, a cloud-native semantic search system based on deep neural network.
Wechat_friends
⭐
1,089
微信好友信息分析并可视化以及自动回复微信消息
Kgqa Based On Medicine
⭐
582
基于医药知识图谱的智能问答系统
Qa Snake
⭐
562
基于多搜索引擎和深度学习技术的自动问答
Jieba_fast
⭐
512
Use C Api and Swig to Speed up jieba 高效的中文分词库
Python Girlfriend Mood
⭐
477
😚 Analyze her mood through her girlfriend's words ·女朋友聊天时的情绪波动图谱,没女朋友的可自用(雾)。
Chinese_keyphrase_extractor
⭐
457
An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com
Chitchatassistant
⭐
440
Rasa中文聊天机器人
Nlp_basis
⭐
308
这是我学习一个NLP教程【2019最新AI 自然语言处理之深度机器学习顶级项目实战课程】做的笔记与代码
Sentiment Analysis
⭐
296
Chinese Shopping Reviews sentiment analysis
Dynamic Seq2seq
⭐
293
seq2seq中文聊天机器人
Rasa_nlu_gq
⭐
280
turn natural language into structured data(支持中文,自定义了N种模型,支持不同的场景和任务)
Chinese Text Classification
⭐
276
Chinese-Text-Classification,Tensorflow CNN(卷积神经网络)实现的中文文本分类。QQ群:522785813,微信群二维码:http://w
Textmining
⭐
250
Python文本挖掘系统 Research of Text Mining System
Web Crawler Tutorial
⭐
216
Python 網頁爬蟲入門實戰
Text Cnn
⭐
198
嵌入Word2vec词向量的CNN中文文本分类
Ptt Chat Generator
⭐
190
批踢踢推文產生器
Dianping_textmining
⭐
186
大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目
News Search Engine
⭐
173
新闻搜索引擎
Text Similarity
⭐
167
用TF特征向量和simhash指纹计算中文文本的相似度
Python
⭐
162
Python学习第三方库案例总结
Dailyfresh
⭐
159
Django-天天生鲜电商学习项目
Chatlog
⭐
132
QQ群聊天记录分析
Elmo Chinese
⭐
131
Deep contextualized word representations for Chinese
Sentence Similarity
⭐
125
对四种句子/文本相似度计算方法进行实验与比较
Blog
⭐
125
blog developed with web.py, posted with raw markdown files
Microtokenizer
⭐
119
一个微型&算法全面的中文分词引擎 | A micro tokenizer for Chinese
Deep Siamese Text Similarity
⭐
108
基于siamese-lstm的中文句子相似度计算
Chinese_nlu_by_using_rasa_nlu
⭐
106
使用 RASA NLU 来构建中文自然语言理解系统(NLU)| Use RASA NLU to build a Chinese Natural Language Understanding System (NLU)
Zihaowordcloud
⭐
97
simple tutorials and examples of wordcloud-python
Bilibili Barrage Analysis
⭐
94
bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化
Spammessage
⭐
93
中文垃圾短信识别(手写分类器)
Tf Idf Python
⭐
86
Term frequency–inverse document frequency for Chinese novel/documents implemented in python.
Nlp_summary
⭐
83
自然语言处理
Tf Text Classification
⭐
81
CNN and RNN with Attention for Chinese Text Classification in Tensorflow
Rasachatbot
⭐
78
基于Rasa搭建的案件信息问答系统
News Recommend System
⭐
76
This is for http://115.28.182.124/c/00000000050/team
Atec Nlp
⭐
74
ATEC 金融大脑-金融智能NLP服务
Luciabot
⭐
70
An introduction to NoneBot and development with gocqhttp and docker.
Igcloud
⭐
67
*UNSUPPORTED* Use igcloud to generate Instagram Word Cloud ! 🛫 🛫 ✈ 🔝
Chinese Sentiment Analysis With Doc2vec
⭐
64
using jieba and doc2vec to implement sentiment analysis for Chinese docs
Douban Kgqa
⭐
60
豆瓣书籍,电影类别的知识图谱问答系统
Sohu Baseline
⭐
60
搜狐校园算法大赛baseline
Chinese Segmentation Evaluation
⭐
58
中文分词工具评估
Langueone
⭐
57
练习题︱基于今日头条开源数据的文本挖掘
Udicopendata
⭐
56
公開的情緒訓練資料
Rasa_bot
⭐
49
整理:基于Rasa-NLU和Rasa-Core的任务型ChatBot
Blog
⭐
48
A blog based on Django + MySQL + redis + celery
Cnn Text Classification
⭐
43
基于卷积神经网络参数优化的情感分析论文code
Rhyme
⭐
41
收集分析一些嘻哈说唱歌词中双押甚至三押词汇
Cacl2
⭐
40
Lexicon for Chinese lexical analyzing, 中文语言分词词库
Justcopy Backend
⭐
40
記者快抄後端,包含爬文、前處理、新聞與markdown生成
Loginputengine
⭐
40
落格输入法中文拼音整句输入引擎
Jay_kg
⭐
40
周杰伦歌曲信息的知识图谱问答系统
Turing Giftbooks Crawler
⭐
38
图灵社区样书爬虫
T2t_wmt_zhen
⭐
37
NMT for chinese-english using tensor2tensor
Inception External Recommender
⭐
37
Get annotation suggestions for the INCEpTION text annotation platform from spaCy, Sentence BERT, scikit-learn and more. Runs as a web-service compatible with the external recommender API of INCEpTION.
Wechat
⭐
37
微信好友男女比例,区域排名,签名情感分析
Tianchi_meinian_rank12_1st_season
⭐
35
Word2vec Chinese
⭐
34
a tutorial for training Chinese-word2vec using Wiki corpus
Douban_sentiment_analysis
⭐
34
基于朴素贝叶斯实现的豆瓣影评情感分析
Chinesener
⭐
34
named entity recognition for Chinese.
Chinese Wikipedia Corpus Creator
⭐
33
Corpus creator for Chinese Wikipedia
Flask Reptiles
⭐
30
flask 打造分词搜索与web
Textclassification Meituan Featureextraction Classifier
⭐
30
该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分
Tytalk
⭐
27
Convert Chinese Mandarin texts to vsqx files for Vocaloid, automatically predicting the prosody.
Eduwatching
⭐
27
基于PaddlePaddle的智慧课堂实时监测系统—EduWatching
Sina_analysis
⭐
25
利用微博热点话题舆情聚类分析
Text_extraction
⭐
25
提取金融相关领域研究报告的主要结论(key idea)
Guanchazhe_spider
⭐
23
观察者新闻网爬虫(新闻爬虫),基于python+Flask+Echarts,实现首页与更多新闻页面爬
Spam_filtering
⭐
23
NLP 短文本 评论 垃圾 过滤
Nlp_sum
⭐
20
Devonthink Chinese Search
⭐
20
部分解决 DEVONthink 搜索问题
Textpair
⭐
19
文本对关系比较 - 语义相似度、字面相似度、文本蕴含等等
Mining Frequent Pattern From Search History
⭐
19
《大数据挖掘技术》@复旦 课程项目,试图从搜狗实验室用户查询日志数据(2008)中找出搜索记录中有较高支持度关键词的频繁二项集 Hadoop 集群,并且用 Python 实现了 Parallel FP-Growth 算法中的三个 MapReduce 过程。
Raspi Bot
⭐
19
树莓派语音机器人
Spammessage
⭐
19
一个垃圾短信识别系统
Tianchi_ogeek_rank2
⭐
18
TIANCHI天池-OGeek算法挑战赛(亚军)
Jseg
⭐
18
A modified version of Jieba
Simple_search_engine
⭐
18
社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度
Judicial_competition
⭐
18
"中国法研杯"司法人工智能挑战赛第一阶段代码
Get_chinese_name
⭐
16
Chinese naming tool, supports ancient poetry naming. Built-in Shijin, Analects, Tang poetry, Song poetry, Chuci, Zhouyi. Support getting name from customize article.
Chinese Article Classification Based On Own Corpus Via Textcnn And Gbdt
⭐
16
中文文本分类,包含了语料库的基本处理,Wiki_zh的处理等
Python Jieba Chart
⭐
16
An online Chinese text segmentation visualization tool based Python/Flask/Jieba.
Cnn Text Classification Master
⭐
15
中文文本情感分类利用cnn
Fake Review Generation
⭐
15
无监督中文仿真评论自动生成。 Unsupervised Automatic Generation of Chinese Fake Reviews.
Anki_cloze_maker
⭐
14
根据jieba的tf-idf算法,及自定义的关键词,对.txt文件批量生成anki填空符。
Pyircbot
⭐
14
Python 版 IRC 机器人
Knn Website Classifier System
⭐
14
一种基于改进的KNN网站分类系统,特点是快速、高准确率
Rake_for_chinese
⭐
14
Implementation of RAKE in Chinese
Word Counting
⭐
14
利用jieba库对中文小说进行词频统计并进行简单的正则匹配,同时验证Zipf-Law(Use the jieba library to perform word frequency statistics on Chinese novels and perform simple regular matching, and verify Zipf-Law)
Fenci
⭐
13
中文分词模块:继承了jieba分词的基本算法逻辑,进行了全方位的代码优化,还额外提供了HMM算法的训
Rasa_nlu_cn
⭐
13
Turn Chinese natural language into structured data 中文自然语言理解,并支持spacy
Related Searches
Python Flask (16,493)
Python Docker (14,113)
Python Machine Learning (14,099)
Python Tensorflow (13,736)
Python Deep Learning (13,092)
Python Jupyter Notebook (12,976)
Python Django (8,165)
Python Neural Network (7,548)
Python Neural (7,444)
Python Natural Language Processing (7,323)
1-100 of 209 search results
Next >
Privacy
|
About
|
Terms
|
Follow Us On Twitter
Copyright 2018-2023 Awesome Open Source. All rights reserved.