Project Name | Stars | Downloads | Repos Using This | Packages Using This | Most Recent Commit | Total Releases | Latest Release | Open Issues | License | Language |
---|---|---|---|---|---|---|---|---|---|---|
Seq2seq Couplet | 5,447 | 3 months ago | 8 | agpl-3.0 | Python | |||||
Play couplet with seq2seq model. 用深度学习对对联。 | ||||||||||
Deep Pink | 705 | 6 years ago | 9 | Python | ||||||
Deep Pink is a chess AI that learns to play chess using deep learning. | ||||||||||
Reversi Alpha Zero | 634 | a year ago | 28 | mit | Python | |||||
Reversi reinforcement learning by AlphaGo Zero methods. | ||||||||||
Ddpg Keras Torcs | 595 | 6 years ago | 54 | Python | ||||||
Using Keras and Deep Deterministic Policy Gradient to play TORCS | ||||||||||
Chinesechess Alphazero | 542 | 3 years ago | 7 | gpl-3.0 | Python | |||||
Implement AlphaZero/AlphaGo Zero methods on Chinese chess. | ||||||||||
Aigames | 484 | a year ago | 1 | mit | Python | |||||
use AI to play some games. | ||||||||||
Dpir | 405 | 6 months ago | 15 | mit | Python | |||||
Plug-and-Play Image Restoration with Deep Denoiser Prior (IEEE TPAMI 2021) (PyTorch) | ||||||||||
Game Bot | 199 | 2 years ago | 16 | apache-2.0 | Python | |||||
Artificial intelligence learn playing any game with watching you. | ||||||||||
Alphatoe | 162 | 6 years ago | 1 | mit | Python | |||||
Applying the deep learning techniques from Alpha Go to play tic-tac-toe | ||||||||||
Deepqnetwork | 162 | 7 years ago | Lua | |||||||
A modification of Google's Deep Q-Network to learn to play Super Mario Bros. |
此為利用機器學習的方式自動學習flappy bird的專案,而學習方法則是用Q Learning
部份參考至http://sarvagyavaish.github.io/FlappyBirdRL/
npm install
bower install
利用Phaser.js製作出flappy bird遊戲,如下圖
(參考至 http://www.lessmilk.com/tutorial/flappy-bird-phaser-1)
重點在於這一個公式
而一開始利用這個公式訓練時碰到了一些困難
當只使用這兩個狀態空間時,也就是QState是一個二維的空間
造成在低點的障礙物無法得知離地面或是離天空的距離而常常超出邊界
所以我加上了一個狀態空間,為到天空的距離
但這又引發了別的問題,當我一般的速度通過磚塊時,理論上會以這個方式行動
紅點的位置會慢慢訓練成不按的情況下Q Value會比按的情況下高
但在這個情況時
由於下降的速度太快,導致於Q Value訓練成必須要按下之後才能避免撞到磚塊
也因為這兩個狀態沒辦法收斂到正確的位置,而收斂到了其他的位置
所以我們必須再加一個狀態空間為速度這個空間
基本上這樣就可以完成練習了
@gcaaa31928
有任何意見可以開issues或是pull request