Alignprop

Name: mihirp1998/AlignProp
Brand: mihirp1998/AlignProp
SKU: project/mihirp1998/AlignProp
Rating: 4.47 (127 reviews)

AlignProp uses direct reward backpropogation for the alignment of large-scale text-to-image diffusion models. Our method is 25x more sample and compute efficient than reinforcement learning methods (PPO) for finetuning Stable Diffusion

Categories > Machine Learning > Reinforcement Learning

Suggest Alternative

Privacy | About | Terms | Follow Us On Twitter

Downloads, Dependent Repos, Dependent Packages, Total Releases, Latest Releases data powered by Libraries.io.