Sparkit Learn Alternatives

Name: lensacom/sparkit-learn
Brand: lensacom/sparkit-learn
SKU: project/lensacom/sparkit-learn
Rating: 4.81 (1054 reviews)

PySpark + Scikit-learn = Sparkit-learn

Categories > Data Processing > Machine Learning

Suggest Alternative

Stars

1,054

Alternatives

License

apache-2.0

Open Issues

Most Recent Commit

over 5 years ago

Programming Language

Python

Monthly Downloads

Dependent Repos

Dependent Packages

Total Releases

Latest Release

June 24, 2015

Categories

Programming Languages > Python

Machine Learning > Machine Learning

Programming Languages > Basic

Machine Learning > Scikit Learn

Mathematics > Matrices

Machine Learning > Sklearn

Data Processing > Apache Spark

Data Processing > Pyspark

Repo

Alternatives To lensacom/sparkit-learn

Project Name	Stars	Repos Using This	Packages Using This	Most Recent Commit	Total Releases	Latest Release	Open Issues	License	Language
kailashahirwar/cheatsheets-ai	13,281	0	0	over 6 years ago	0		6	mit
Essential Cheat Sheets for deep learning and machine learning researchers https://medium.com/@kailashahirwar/essential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5
microsoft/SynapseML	4,914	0	6	over 2 years ago	12	November 27, 2023	335	mit	Scala
Simple and Distributed Machine Learning
JohnSnowLabs/spark-nlp	3,578	0	30	over 2 years ago	134	December 08, 2023	43	apache-2.0	Scala
State of the Art Natural Language Processing
ethen8181/machine-learning	2,607	0	0	over 2 years ago	0		6	mit	HTML
:earth_americas: machine learning tutorials (mainly in Python3)
uber/petastorm	1,693	0	8	over 2 years ago	86	February 03, 2023	174	apache-2.0	Python
Petastorm library enables single machine or distributed training and evaluation of deep learning models from datasets in Apache Parquet format. It supports ML frameworks such as Tensorflow, Pytorch, and PySpark and can be used from pure Python code.
hi-primus/optimus	1,540	0	0	over 1 year ago	32	June 19, 2022	29	apache-2.0	Python
:truck: Agile Data Preparation Workflows made easy with Pandas, Dask, cuDF, Dask-cuDF, Vaex and PySpark
jadianes/spark-py-notebooks	1,515	0	0	about 3 years ago	0		9	other	Jupyter Notebook
Apache Spark & Python (pySpark) tutorials for Big Data Analysis and Machine Learning as IPython / Jupyter notebooks
lensacom/sparkit-learn	1,054	5	0	over 5 years ago	13	June 24, 2015	35	apache-2.0	Python
PySpark + Scikit-learn = Sparkit-learn
logicalclocks/hopsworks	1,041	0	0	over 2 years ago	1	September 11, 2019	12	agpl-3.0	Java
Hopsworks - Data-Intensive AI platform with a Feature Store
h2oai/sparkling-water	957	0	6	over 2 years ago	195	October 26, 2023	44	apache-2.0	Scala
Sparkling Water provides H2O functionality inside Spark cluster

Alternatives To lensacom/sparkit-learn

Select To Compare

kailashahirwar/cheatsheets-ai ⭐ 13,281

Essential Cheat Sheets for deep learning and machine learning researchers https://medium.com/@kailashahirwar/essential-cheat-sheets-for-machine-learning-and-deep-learning-researchers-efb6a8ebd2e5

dependent packages 0 total releases 0 most recent commit over 6 years ago

microsoft/SynapseML ⭐ 4,914

Simple and Distributed Machine Learning

dependent packages 6 total releases 12 most recent commit over 2 years ago

JohnSnowLabs/spark-nlp ⭐ 3,578

State of the Art Natural Language Processing

dependent packages 30 total releases 134 most recent commit over 2 years ago downloads badge

ethen8181/machine-learning ⭐ 2,607

:earth_americas: machine learning tutorials (mainly in Python3)

dependent packages 0 total releases 0 most recent commit over 2 years ago

uber/petastorm ⭐ 1,693

Petastorm library enables single machine or distributed training and evaluation of deep learning models from datasets in Apache Parquet format. It supports ML frameworks such as Tensorflow, Pytorch, and PySpark and can be used from pure Python code.

dependent packages 8 total releases 86 most recent commit over 2 years ago downloads badge

hi-primus/optimus ⭐ 1,540

:truck: Agile Data Preparation Workflows made easy with Pandas, Dask, cuDF, Dask-cuDF, Vaex and PySpark

dependent packages 0 total releases 32 most recent commit over 1 year ago downloads badge

jadianes/spark-py-notebooks ⭐ 1,515

Apache Spark & Python (pySpark) tutorials for Big Data Analysis and Machine Learning as IPython / Jupyter notebooks

dependent packages 0 total releases 0 most recent commit about 3 years ago

lensacom/sparkit-learn ⭐ 1,054

PySpark + Scikit-learn = Sparkit-learn

dependent packages 0 total releases 13 most recent commit over 5 years ago downloads badge

logicalclocks/hopsworks ⭐ 1,041

Hopsworks - Data-Intensive AI platform with a Feature Store

dependent packages 0 total releases 1 most recent commit over 2 years ago downloads badge

h2oai/sparkling-water ⭐ 957

Sparkling Water provides H2O functionality inside Spark cluster

dependent packages 6 total releases 195 most recent commit over 2 years ago

Suggest An Alternative To sparkit-learn

Alternative Project Comparisons

lensacom/sparkit-learn vs Cheatsheets Ai

lensacom/sparkit-learn vs Synapseml

lensacom/sparkit-learn vs Spark Nlp

lensacom/sparkit-learn vs Machine Learning

lensacom/sparkit-learn vs Petastorm

lensacom/sparkit-learn vs Optimus

lensacom/sparkit-learn vs Spark Py Notebooks

lensacom/sparkit-learn vs Sparkit Learn

lensacom/sparkit-learn vs Hopsworks

lensacom/sparkit-learn vs Sparkling Water

Popular Pyspark Projects

ibis-project/ibis⭐ 3,404

The flexibility of Python with the scale and performance of modern SQL.

apache/linkis⭐ 3,200

Apache Linkis builds a computation middleware layer to facilitate connection, governance and orchestration between the upper applications and the underlying data engines.

combust/mleap⭐ 1,479

MLeap: Deploy ML Pipelines to Production

awesome-spark/awesome-spark⭐ 1,461

A curated list of awesome Apache Spark packages and resources.

jupyter-incubator/sparkmagic⭐ 1,272

Jupyter magics and kernels for working with remote Spark clusters

Popular Machine Learning Projects

tensorflow/tensorflow⭐ 180,196

An Open Source Machine Learning Framework for Everyone

huggingface/transformers⭐ 119,240

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

pytorch/pytorch⭐ 74,794

Tensors and Dynamic neural networks in Python with strong GPU acceleration

netdata/netdata⭐ 66,844

Monitor your servers, containers, and applications, in high-resolution and in real-time!

microsoft/ML-For-Beginners⭐ 63,698

12 weeks, 26 lessons, 52 quizzes, classic Machine Learning for all

Popular Data Processing Categories

Jupyter Notebook

Dataset

Sql

Validation

Pipeline

Translation

Data Science

Classification

Transaction

Scraper