Awesome Open Source

Programming Languages

Lol Rl

Advantage Leftover Lunch Reinforcement Learning (A-LoL RL): Improving Language Models with Advantage-based Offline Policy Gradients

Categories > Machine Learning > Policy Gradient

Suggest Alternative

Stars

16

License

No license specified

Most Recent Commit

7 months ago

Programming Language

Python

Categories

Programming Languages > Python

Machine Learning > Natural Language Processing

Machine Learning > Reinforcement Learning

Machine Learning > Language Model

Machine Learning > Policy Gradient

Suggest An Alternative To LoL-RL

Popular Policy Gradient Projects

Reinforcement Learning With Tensorflow ⭐ 8,174

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

most recent commit a year ago

Easy Rl ⭐ 7,643

强化学习中文教程（蘑菇书），在线阅读地址：https://datawhalechina.github

most recent commit 6 months ago

Tianshou ⭐ 7,125

An elegant PyTorch deep reinforcement learning library.

dependent packages 10total releases 33latest release August 22, 2023most recent commit 5 months ago

pypi tianshou} Downloads

Reinforcement Learning ⭐ 4,115

Learn Deep Reinforcement Learning in 60 days! Lectures & Code in Python. Reinforcement Learning + Deep Learning

most recent commit 4 years ago

Reinforcement Learning ⭐ 3,119

Minimal and Clean Reinforcement Learning Examples

most recent commit a year ago

Popular Language Model Projects

Transformers ⭐ 127,491

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

dependent packages 2,484total releases 125latest release November 15, 2023most recent commit 19 days ago

pypi transformers} Downloads

Gpt4free ⭐ 52,083

The official gpt4free repository | various collection of powerful language models

dependent packages 10total releases 83latest release December 06, 2023most recent commit 5 months ago

pypi g4f} Downloads

Prompt Engineering Guide ⭐ 45,478

🐙 Guides, papers, lecture, notebooks and resources for prompt engineering

most recent commit 16 days ago

Open Assistant ⭐ 36,197

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

most recent commit 5 months ago

Stanford_alpaca ⭐ 24,846

Code and documentation to train Stanford's Alpaca models, and generate the data.

most recent commit a year ago

Popular Machine Learning Categories

Machine Learning

Natural Language Processing

Computer Vision

Convolutional Neural Networks

Related Searches

Python Natural Language Processing

Python Reinforcement Learning

Python Language Model

Python Policy Gradient

Natural Language Processing Reinforcement Learning

Reinforcement Learning Policy Gradient

Reinforcement Learning Language Model

Natural Language Processing Policy Gradient

Get A Weekly Email With Trending Projects For These Categories

No Spam. Unsubscribe easily at any time.

Python

Natural Language Processing

Reinforcement Learning

Language Model

Policy Gradient

Privacy | About | Terms | Follow Us On Twitter

Downloads, Dependent Repos, Dependent Packages, Total Releases, Latest Releases data powered by Libraries.io.

Copyright 2018-2024 Awesome Open Source. All rights reserved.