Awesome Open Source
Search
Programming Languages
Languages
All Categories
Categories
About
Search results for jieba
jieba
x
242 search results found
Jieba
⭐
31,881
结巴中文分词
Pkuseg Python
⭐
6,001
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
Textrank4zh
⭐
3,090
🌳从中文文本中自动提取关键词和摘要
Nodejieba
⭐
2,883
"结巴"中文分词的Node.js版本
Gse
⭐
2,352
Go efficient multilingual NLP and text segmentation; support English, Chinese, Japanese and others.
Harvesttext
⭐
2,055
文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等)
Deep Learning With Keras Notebooks
⭐
1,868
Jupyter notebooks for using & learning Keras
Rasa_nlu_chi
⭐
1,466
Turn Chinese natural language into structured data 中文自然语言理解
Thulac Python
⭐
1,341
An Efficient Lexical Analyzer for Chinese
Textinfoexp
⭐
1,269
自然语言处理实验(sougou数据集),TF-IDF,文本分类、聚类、词向量、情感识别、关系抽取等
Jieba Php
⭐
1,193
"結巴"中文分詞:做最好的 PHP 中文分詞、中文斷詞組件。 / "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best PHP Chinese word segmentation module.
Ik Analyzer Solr
⭐
1,133
ik-analyzer for solr 7.x-8.x
Gnes
⭐
1,095
GNES is Generic Neural Elastic Search, a cloud-native semantic search system based on deep neural network.
Wechat_friends
⭐
1,089
微信好友信息分析并可视化以及自动回复微信消息
Jieba.net
⭐
937
jieba中文分词的.NET版本(支持.NET Framework与.NET Core)
Node Rs
⭐
903
Node.js bindings ❤️ Rust crates
Textgrocery
⭐
678
A simple short-text classification tool based on LibLinear
Thulac
⭐
611
An Efficient Lexical Analyzer for Chinese
Jieba Rs
⭐
585
The Jieba Chinese Word Segmentation Implemented in Rust
Kgqa Based On Medicine
⭐
582
基于医药知识图谱的智能问答系统
Qa Snake
⭐
562
基于多搜索引擎和深度学习技术的自动问答
Fullstack Data Engineer
⭐
516
全栈数据工程师养成攻略
Jieba_fast
⭐
512
Use C Api and Swig to Speed up jieba 高效的中文分词库
Elasticsearch Jieba Plugin
⭐
509
jieba analysis plugin for elasticsearch 7.0.0, 6.4.0, 6.0.0, 5.4.0,5.3.0, 5.2.2, 5.2.1, 5.2, 5.1.2, 5.1.1
Chinese_keyphrase_extractor
⭐
502
An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com
Python Girlfriend Mood
⭐
477
😚 Analyze her mood through her girlfriend's words ·女朋友聊天时的情绪波动图谱,没女朋友的可自用(雾)。
Chitchatassistant
⭐
440
Rasa中文聊天机器人
Zhihu
⭐
400
✨ 知乎日报 - 爬虫、数据分析、Node.js、Vue.js ...
Nmsl
⭐
343
一个纯前端的抽象话转换器
Nlp_basis
⭐
308
这是我学习一个NLP教程【2019最新AI 自然语言处理之深度机器学习顶级项目实战课程】做的笔记与代码
Ccf2016_sougou
⭐
306
ccf2016 sougou final winner solution
Elasticsearch Analysis Jieba
⭐
296
The plugin includes the `jieba` analyzer, `jieba` tokenizer, and `jieba` token filter, and have two mode you can choose. one is `index` which means it will be used when you want to index a document. another is `search` mode which used when you want to search something.
Sentiment Analysis
⭐
296
Chinese Shopping Reviews sentiment analysis
Dynamic Seq2seq
⭐
293
seq2seq中文聊天机器人
Rasa_nlu_gq
⭐
280
turn natural language into structured data(支持中文,自定义了N种模型,支持不同的场景和任务)
Jiebar
⭐
277
Chinese text segmentation with R. R语言中文分词 (文档已更新 🎉 :https://qinwenfeng.com/jiebaR/ )
Chinese Text Classification
⭐
276
Chinese-Text-Classification,Tensorflow CNN(卷积神经网络)实现的中文文本分类。QQ群:522785813,微信群二维码:http://w
Thulac Java
⭐
263
An Efficient Lexical Analyzer for Chinese
Pg_jieba
⭐
259
Postgresql full-text search extension for chinese
Textmining
⭐
250
Python文本挖掘系统 Research of Text Mining System
Covid 19 Nlp Vis
⭐
223
使用 flask + pyecharts 搭建的新冠肺炎疫情数据可视化交互分析网站平台,包含疫情数据获取、每日疫情地图、曲线图展示,数据统计分
Web Crawler Tutorial
⭐
216
Python 網頁爬蟲入門實戰
Finance_news_analysis
⭐
206
金融新闻数据挖掘分析
Text Cnn
⭐
198
嵌入Word2vec词向量的CNN中文文本分类
Ptt Chat Generator
⭐
190
批踢踢推文產生器
Dianping_textmining
⭐
186
大众点评评论文本挖掘,包括点评数据爬取、数据清洗入库、数据分析、评论情感分析等的完整挖掘项目
News Search Engine
⭐
173
新闻搜索引擎
Text Similarity
⭐
167
用TF特征向量和simhash指纹计算中文文本的相似度
Python
⭐
162
Python学习第三方库案例总结
Phpjieba
⭐
161
结巴中文分词之php扩展,适用php5,php7
Dailyfresh
⭐
159
Django-天天生鲜电商学习项目
Chatlog
⭐
132
QQ群聊天记录分析
Elmo Chinese
⭐
131
Deep contextualized word representations for Chinese
Pinduoduo
⭐
128
拼多多商品信息爬虫
Blog
⭐
125
blog developed with web.py, posted with raw markdown files
Sentence Similarity
⭐
125
对四种句子/文本相似度计算方法进行实验与比较
Microtokenizer
⭐
119
一个微型&算法全面的中文分词引擎 | A micro tokenizer for Chinese
Deep Siamese Text Similarity
⭐
108
基于siamese-lstm的中文句子相似度计算
Chinese_nlu_by_using_rasa_nlu
⭐
106
使用 RASA NLU 来构建中文自然语言理解系统(NLU)| Use RASA NLU to build a Chinese Natural Language Understanding System (NLU)
Jstarcraft Nlp
⭐
99
专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSearch插件.
Segment
⭐
98
The jieba-analysis tool for java.(基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。支持词性标注。)
Zihaowordcloud
⭐
97
simple tutorials and examples of wordcloud-python
Bilibili Barrage Analysis
⭐
94
bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化
Chinesewordvectors
⭐
93
搜集、整理、发布 预训练 中文 词向量/字向量,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
Spammessage
⭐
93
中文垃圾短信识别(手写分类器)
Awesome Elasticsearch Cn
⭐
88
ElasticSearch中文相关资料整理,包括书籍、视频、博文等。
Tf Idf Python
⭐
86
Term frequency–inverse document frequency for Chinese novel/documents implemented in python.
Chinese_wordseg_keras
⭐
84
基于深度学习的中文分词尝试
Nlp_summary
⭐
83
自然语言处理
Tf Text Classification
⭐
81
CNN and RNN with Attention for Chinese Text Classification in Tensorflow
Rasachatbot
⭐
78
基于Rasa搭建的案件信息问答系统
News Recommend System
⭐
76
This is for http://115.28.182.124/c/00000000050/team
Atec Nlp
⭐
74
ATEC 金融大脑-金融智能NLP服务
Luciabot
⭐
70
An introduction to NoneBot and development with gocqhttp and docker.
Jaba
⭐
69
结巴分词(java版)
Igcloud
⭐
67
*UNSUPPORTED* Use igcloud to generate Instagram Word Cloud ! 🛫 🛫 ✈ 🔝
Jieba Solr
⭐
67
adapters for solr: jieba, fudan nlp, stanford nlp
Cang Jie
⭐
65
Chinese tokenizer for tantivy, based on jieba-rs
Chinese Sentiment Analysis With Doc2vec
⭐
64
using jieba and doc2vec to implement sentiment analysis for Chinese docs
Sohu Baseline
⭐
60
搜狐校园算法大赛baseline
Douban Kgqa
⭐
60
豆瓣书籍,电影类别的知识图谱问答系统
Chinese Segmentation Evaluation
⭐
58
中文分词工具评估
Langueone
⭐
57
练习题︱基于今日头条开源数据的文本挖掘
Udicopendata
⭐
56
公開的情緒訓練資料
Sqljieba
⭐
55
Jieba Mysql Full-Text Parser Plugin
Analyzer Solr
⭐
53
analyzer adapter for solr 5, we support Jieba, and stranford in the future
Md2html
⭐
51
第一个 Java 代码:把文件夹下的 Markdown 文件,转化成 GitHub 风格的 HTML(用 pandoc 转)
Rasa_bot
⭐
49
整理:基于Rasa-NLU和Rasa-Core的任务型ChatBot
Blog
⭐
48
A blog based on Django + MySQL + redis + celery
Sligen
⭐
45
Pitching like a boss
2015talk Chinese Search
⭐
44
Cnn Text Classification
⭐
43
基于卷积神经网络参数优化的情感分析论文code
Loginputengine
⭐
41
落格输入法中文拼音整句输入引擎
Tinysearchengine
⭐
41
基于vue前端框架/scrapy爬虫框架/结巴分词实现的小型搜索引擎
Rhyme
⭐
41
收集分析一些嘻哈说唱歌词中双押甚至三押词汇
Jay_kg
⭐
40
周杰伦歌曲信息的知识图谱问答系统
Justcopy Backend
⭐
40
記者快抄後端,包含爬文、前處理、新聞與markdown生成
Cacl2
⭐
40
Lexicon for Chinese lexical analyzing, 中文语言分词词库
Miteiru
⭐
39
Miteiru is an open source Electron video player to learn Chinese, Cantonese, and Japanese. It can play all Youtube and HTML 5 supported format (.mkv, .mp4, .mov, and many more) videos, and lots of supports on other subtitle formats (.srt, .ass, .vtt, and many more)
Turing Giftbooks Crawler
⭐
38
图灵社区样书爬虫
1-100 of 242 search results
Next >
Privacy
|
About
|
Terms
|
Follow Us On Twitter
Copyright 2018-2024 Awesome Open Source. All rights reserved.