Wiki2text Alternatives

Name: rspeer/wiki2text
Brand: rspeer/wiki2text
SKU: project/rspeer/wiki2text
Rating: 4.47 (129 reviews)

Extract a plain text corpus from MediaWiki XML dumps, such as Wikipedia.

Categories > Companies > Formatter

Suggest Alternative

Stars

129

Alternatives

License

mit

Open Issues

Most Recent Commit

over 7 years ago

Programming Language

Nim

Dependent Repos

Dependent Packages

Total Releases

Latest Release

June 30, 2015

Categories

Text Processing > Formatter

Data Processing > Corpus

Programming Languages > Nim

Companies > Wikipedia

Content Management > Mediawiki

Repo

Alternatives To rspeer/wiki2text

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
wikimedia/mediawiki	4,936	8	4	4 months ago	167	September 29, 2023	0	other	PHP
🌻 The collaborative editing software that runs Wikipedia. Mirror from https://gerrit.wikimedia.org/g/mediawiki/core. See https://mediawiki.org/wiki/Developer_access for contributing.
earwig/mwparserfromhell	676	151	67	over 2 years ago	23	September 05, 2023	77	mit	Python
A Python parser for MediaWiki wikicode
WikiTeam/wikiteam	661	0	0	over 2 years ago	0		159	gpl-3.0	Python
Tools for downloading and preserving wikis. We archive wikis, from Wikipedia to tiniest wikis. As of 2023, WikiTeam has preserved more than 350,000 wikis.
wikimedia/pywikibot	591	0	0	over 2 years ago	0		0	mit	Python
A Python library that interfaces with the MediaWiki API. This is a mirror from gerrit.wikimedia.org. Do not submit any patches here. See https://www.mediawiki.org/wiki/Developer_account for contributing.
siznax/wptools	448	13	5	over 4 years ago	39	August 16, 2018	29	mit	Python
Wikipedia tools (for Humans): easily extract data from Wikipedia, Wikidata, and other MediaWikis
openzim/mwoffliner	420	0	2	4 months ago	400	May 24, 2023	162	gpl-3.0	TypeScript
MediaWiki scraper: all your wiki articles in one highly compressed ZIM file
dijs/wiki	294	236	85	over 3 years ago	94	February 07, 2023	17	mit	JavaScript
Wikipedia Interface for Node.js
mwclient/mwclient	287	0	0	over 2 years ago	6	November 05, 2020	45	mit	Python
Python client library to interface with the MediaWiki API
walle/wiki	263	0	0	over 6 years ago	2	November 29, 2019	4	mit	Go
Command line tool to fetch summaries from MediaWiki wikis, like Wikipedia
kiwix/kiwix-js	254	0	0	over 2 years ago	0		93	gpl-3.0	JavaScript
Fully portable & lightweight ZIM reader in Javascript

Alternatives To rspeer/wiki2text

Select To Compare

wikimedia/mediawiki ⭐ 4,936

🌻 The collaborative editing software that runs Wikipedia. Mirror from https://gerrit.wikimedia.org/g/mediawiki/core. See https://mediawiki.org/wiki/Developer_access for contributing.

dependent packages 4 total releases 167 most recent commit 4 months ago

earwig/mwparserfromhell ⭐ 676

A Python parser for MediaWiki wikicode

dependent packages 67 total releases 23 most recent commit over 2 years ago downloads badge

WikiTeam/wikiteam ⭐ 661

Tools for downloading and preserving wikis. We archive wikis, from Wikipedia to tiniest wikis. As of 2023, WikiTeam has preserved more than 350,000 wikis.

dependent packages 0 total releases 0 most recent commit over 2 years ago

wikimedia/pywikibot ⭐ 591

A Python library that interfaces with the MediaWiki API. This is a mirror from gerrit.wikimedia.org. Do not submit any patches here. See https://www.mediawiki.org/wiki/Developer_account for contributing.

dependent packages 0 total releases 0 most recent commit over 2 years ago

siznax/wptools ⭐ 448

Wikipedia tools (for Humans): easily extract data from Wikipedia, Wikidata, and other MediaWikis

dependent packages 5 total releases 39 most recent commit over 4 years ago downloads badge

openzim/mwoffliner ⭐ 420

MediaWiki scraper: all your wiki articles in one highly compressed ZIM file

dependent packages 2 total releases 400 most recent commit 4 months ago downloads badge

dijs/wiki ⭐ 294

Wikipedia Interface for Node.js

dependent packages 85 total releases 94 most recent commit over 3 years ago downloads badge

mwclient/mwclient ⭐ 287

Python client library to interface with the MediaWiki API

dependent packages 0 total releases 6 most recent commit over 2 years ago

walle/wiki ⭐ 263

Command line tool to fetch summaries from MediaWiki wikis, like Wikipedia

dependent packages 0 total releases 2 most recent commit over 6 years ago

kiwix/kiwix-js ⭐ 254

Fully portable & lightweight ZIM reader in Javascript

dependent packages 0 total releases 0 most recent commit over 2 years ago

Suggest An Alternative To wiki2text

Alternative Project Comparisons

rspeer/wiki2text vs Mediawiki

rspeer/wiki2text vs Mwparserfromhell

rspeer/wiki2text vs Wikiteam

rspeer/wiki2text vs Pywikibot

rspeer/wiki2text vs Wptools

rspeer/wiki2text vs Mwoffliner

rspeer/wiki2text vs Wiki

rspeer/wiki2text vs Mwclient

rspeer/wiki2text vs Wiki

rspeer/wiki2text vs Kiwix Js

Popular Wikipedia Projects

kamranahmedse/design-patterns-for-humans⭐ 42,678

An ultra-simplified explanation to design patterns

dwmkerr/hacker-laws⭐ 24,993

💻📖 Laws, Theories, Principles and Patterns that developers will find useful. #hackerlaws

sohamkamani/javascript-design-patterns-for-humans⭐ 4,191

An ultra-simplified explanation of design patterns implemented in javascript

attardi/wikiextractor⭐ 3,440

A tool for extracting plain text from Wikipedia dumps

ragunathjawahar/android-saripaar⭐ 3,176

UI form validation library for Android

Popular Mediawiki Projects

vimwiki/vimwiki⭐ 8,441

Personal Wiki for Vim

seisman/how-to-write-makefile⭐ 3,057

跟我一起写Makefile重制版

django-wiki/django-wiki⭐ 1,747

A wiki system with complex functionality for simple integration and a superb interface. Store your knowledge with style: Use django models.

mozilla/server-side-tls⭐ 1,104

Server side TLS Tools

thombashi/sqlitebiter⭐ 795

A CLI tool to convert CSV / Excel / HTML / JSON / Jupyter Notebook / LDJSON / LTSV / Markdown / SQLite / SSV / TSV / Google-Sheets to a SQLite database file.

Popular Companies Categories

Google

Microsoft

Amazon

Apple

Intel

Oracle

Nvidia

Ibm

Netlify

Elastic