前排提醒,目前我們能 “用 ppo 四分鐘訓(xùn)練 ant 到 6000 分”,比本文的 3 小時快了很多很多,有空會更新代碼
https://blog.csdn.net/sinat_39620217/article/details/131724602
介紹了 Isaac Gym 庫 如何使用 GPU 做大規(guī)模并行仿真,對環(huán)境模塊提速。這篇帖子,我們使用 1 張 A100GPU 在 3 個小時之內(nèi),把 Ant 機(jī)器人訓(xùn)練到 6000 分以上,并開源了代碼。希望對社區(qū)成員提供幫助。
文章來源:http://www.zghlxwxcb.cn/news/detail-594619.html
而這一篇帖子,我們開源了 GPU 并行仿真環(huán)境 Isaac Gym 的強(qiáng)化學(xué)習(xí)庫小雅 ElegantRL 的訓(xùn)練代碼。并在文章結(jié)尾貼上了我們的多個訓(xùn)練結(jié)果。想要在 GPU 并行環(huán)境上訓(xùn)練強(qiáng)化學(xué)習(xí)算法,并發(fā)揮出 GPU 仿真環(huán)境的全部潛力,需要對強(qiáng)化學(xué)習(xí)的代碼做一些較大的改動,所以我們將代碼發(fā)布在了 ElegantRL 這個強(qiáng)化學(xué)習(xí)庫的 develop 分支里,收集使用反饋后,我們會將它整合到 master 分支里,如果大家想貢獻(xiàn)代碼,也可以直接 pull request 提自己的分支。我們社區(qū)的核心成員會對代碼進(jìn)行審核,提出調(diào)整意見。(運(yùn)行下方代碼的 demo_Isaac_Gym.py 就可以訓(xùn)練了)文章來源地址http://www.zghlxwxcb.cn/news/detail-594619.html
1.用 GPU 并行環(huán)境 Isaac Gym + 強(qiáng)化學(xué)習(xí)庫 ElegantRL
到了這里,關(guān)于用 GPU 并行環(huán)境 Isaac Gym + 強(qiáng)化學(xué)習(xí)庫 ElegantRL:訓(xùn)練機(jī)器人Ant,3小時6000分,最高12000分的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!