国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Humanoid-Gym 開源人形機(jī)器人端到端強(qiáng)化學(xué)習(xí)訓(xùn)練框架!星動紀(jì)元聯(lián)合清華大學(xué)、上海期智研究院發(fā)布!

這篇具有很好參考價(jià)值的文章主要介紹了Humanoid-Gym 開源人形機(jī)器人端到端強(qiáng)化學(xué)習(xí)訓(xùn)練框架!星動紀(jì)元聯(lián)合清華大學(xué)、上海期智研究院發(fā)布!。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

系列文章目錄

?文章來源地址http://www.zghlxwxcb.cn/news/detail-849057.html


前言

Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer

GitHub Repository:?GitHub - roboterax/humanoid-gym: Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer

humanoid-gym,機(jī)器人最優(yōu)控制工具,機(jī)器人,人工智能,自動駕駛,強(qiáng)化學(xué)習(xí),人形機(jī)器人,開源,四足機(jī)器人


?

一、介紹

Humanoid-Gym是一個(gè)基于Nvidia Isaac Gym的易于使用的強(qiáng)化學(xué)習(xí)(RL)框架,旨在訓(xùn)練仿人機(jī)器人的運(yùn)動技能,強(qiáng)調(diào)從仿真到真實(shí)世界環(huán)境的零誤差轉(zhuǎn)移。Humanoid-Gym 還集成了一個(gè)從 Isaac Gym 到 Mujoco 的仿真到仿真框架,允許用戶在不同的物理仿真中驗(yàn)證訓(xùn)練好的策略,以確保策略的魯棒性和通用性。

RobotEra 的 XBot-S(身高 1.2 米的仿人機(jī)器人)和 XBot-L(身高 1.65 米的仿人機(jī)器人)在真實(shí)環(huán)境中對該代碼庫進(jìn)行了驗(yàn)證,實(shí)現(xiàn)了模擬到現(xiàn)實(shí)的零距離傳輸。

用于評估的機(jī)器人硬件平臺

humanoid-gym,機(jī)器人最優(yōu)控制工具,機(jī)器人,人工智能,自動駕駛,強(qiáng)化學(xué)習(xí),人形機(jī)器人,開源,四足機(jī)器人

?

二、仿真環(huán)境搭建

?

歡迎訪問我們的 Humanoid-Gym!

Humanoid-Gym 是一個(gè)基于 Nvidia Isaac Gym 的易于使用的強(qiáng)化學(xué)習(xí)(RL)框架,旨在訓(xùn)練仿人機(jī)器人的運(yùn)動技能,強(qiáng)調(diào)從仿真到真實(shí)環(huán)境的零誤差轉(zhuǎn)移。Humanoid-Gym 還集成了從 Isaac Gym 到 Mujoco 的仿真到仿真框架,允許用戶在不同的物理仿真中驗(yàn)證訓(xùn)練好的策略,以確保策略的魯棒性和通用性。

RobotEra 的 XBot-S(身高 1.2 米的仿人機(jī)器人)和 XBot-L(身高 1.65 米的仿人機(jī)器人)在真實(shí)環(huán)境中對該代碼庫進(jìn)行了驗(yàn)證,實(shí)現(xiàn)了模擬到現(xiàn)實(shí)的零距離傳輸。

2.1 特點(diǎn)

1. 仿人機(jī)器人訓(xùn)練

該庫為仿人機(jī)器人的訓(xùn)練提供全面的指導(dǎo)和腳本。Humanoid-Gym 具有針對仿人機(jī)器人的專門獎勵(lì),簡化了模擬到真實(shí)轉(zhuǎn)移的難度。在本資源庫中,我們以 RobotEra 的 XBot-L 為主要示例。只需稍作調(diào)整,也可用于其他機(jī)器人。我們的資源包括設(shè)置、配置和執(zhí)行。我們的目標(biāo)是通過提供深入的訓(xùn)練和優(yōu)化,讓機(jī)器人為真實(shí)世界的運(yùn)動做好充分準(zhǔn)備。

全面的訓(xùn)練指南: 我們?yōu)橛?xùn)練過程的每個(gè)階段提供詳盡的演練。
逐步配置說明: 我們的指導(dǎo)清晰簡潔,可確保高效的設(shè)置過程。
易于部署的執(zhí)行腳本: 利用我們預(yù)先準(zhǔn)備好的腳本,簡化培訓(xùn)工作流程。

2. Sim2Sim 支持

sim2sim 管道,使您能夠?qū)⒂?xùn)練有素的策略轉(zhuǎn)移到高精度和精心設(shè)計(jì)的仿真環(huán)境中。獲得機(jī)器人后,您就可以放心地在真實(shí)環(huán)境中部署經(jīng)過 RL 訓(xùn)練的策略。

我們的仿真器設(shè)置,尤其是 Mujoco 的設(shè)置,都經(jīng)過了精心調(diào)整,以接近真實(shí)世界的場景。這種細(xì)致的校準(zhǔn)確保了仿真環(huán)境和真實(shí)世界環(huán)境中的性能密切吻合。這一改進(jìn)使我們的仿真更可信,增強(qiáng)了我們對仿真適用于真實(shí)世界場景的信心。

3. 去噪世界模型學(xué)習(xí)(即將推出)

去噪世界模型學(xué)習(xí)(DWL)提出了一種先進(jìn)的模擬到現(xiàn)實(shí)框架,將狀態(tài)估計(jì)和系統(tǒng)識別融為一體。這種雙方法確保機(jī)器人的學(xué)習(xí)和適應(yīng)在現(xiàn)實(shí)世界中既實(shí)用又有效。

增強(qiáng)的仿真適應(yīng)性: 優(yōu)化機(jī)器人從仿真環(huán)境過渡到真實(shí)環(huán)境的技術(shù)。
改進(jìn)的狀態(tài)估計(jì)能力: 用于精確可靠的狀態(tài)分析的先進(jìn)工具。

2.2 安裝

用 Python 3.8 生成一個(gè)新的 Python 虛擬環(huán)境,使用?

conda create -n myenv python=3.8

為獲得最佳性能,我們建議使用 NVIDIA 驅(qū)動程序版本 525

sudo apt install nvidia-driver-525

。支持的最低驅(qū)動程序版本為 515。如果無法安裝 525 版本,請確保系統(tǒng)至少有 515 版本,以維持基本功能。
使用 Cuda-11.7 安裝 PyTorch 1.13:

conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia

使用

conda install numpy=1.23

安裝 numpy-1.23。
安裝 Isaac Gym:
從以下地址下載并安裝 Isaac Gym Preview 4

Isaac Gym - Preview Release | NVIDIA Developer.

cd isaacgym/python && pip install -e .

?使用

cd examples && python 1080_balls_of_solitude.py

運(yùn)行示例。
有關(guān)故障排除,請參閱 isaacgym/docs/index.html。
安裝 Humanoid-Gym:
克隆此軟件源。

cd humanoid_gym && pip install -e .

2.3?使用指南

示例

# Launching PPO Policy Training for 'v1' Across 8192 Environments
# This command initiates the PPO algorithm-based training for the humanoid task.
python scripts/train.py --task=humanoid_ppo --run_name v1 --headless --num_envs 8192

# Evaluating the Trained PPO Policy 'v1'
# This command loads the 'v1' policy for performance assessment in its environment. 
# Additionally, it automatically exports a JIT model, suitable for deployment purposes.
python scripts/play.py --task=humanoid_ppo --run_name v1

# Implementing Simulation-to-Simulation Model Transformation
# This command facilitates a sim-to-sim transformation using exported 'v1' policy.
python scripts/sim2sim.py --load_model /path/to/logs/XBot_ppo/exported/policies/policy_1.pt

# Run our trained policy
python scripts/sim2sim.py --load_model /path/to/logs/XBot_ppo/exported/policies/policy_example.pt

1. 默認(rèn)任務(wù)

humanoid_ppo

目的: 基準(zhǔn)、PPO 策略、多坐標(biāo)系低級控制
觀察空間: 可變 (47 X H) 維度,其中 H 為坐標(biāo)系幀數(shù)


權(quán)限信息: 73 維
humanoid_dwl (即將推出)

2. PPO 策略

訓(xùn)練命令: 如需訓(xùn)練 PPO 策略,請執(zhí)行

python humanoid/scripts/train.py --task=humanoid_ppo --load_run log_file_path --name run_name

運(yùn)行訓(xùn)練有素的保單: 要部署訓(xùn)練有素的 PPO 政策,請使用

python humanoid/scripts/play.py --task=humanoid_ppo --load_run log_file_path --name run_name

默認(rèn)情況下,將加載實(shí)驗(yàn)文件夾中最后一次運(yùn)行的最新模型。不過,也可以通過調(diào)整訓(xùn)練配置中的 load_run 和 checkpoint 來選擇其他運(yùn)行迭代/模型。

3. Sim-to-sim

基于 Mujoco 的 Sim2Sim 部署: 使用下面的命令利用 Mujoco 執(zhí)行仿真到仿真 (sim2sim) 部署:

python scripts/sim2sim.py --load_model /path/to/export/model.pt

4. 參數(shù)

CPU 和 GPU 使用情況: 要在 CPU 上運(yùn)行仿真,請同時(shí)設(shè)置 --sim_device=cpu 和 --rl_device=cpu。對于 GPU 操作,請相應(yīng)指定 --sim_device=cuda:{0,1,2...} 和 --rl_device={0,1,2...}。請注意,CUDA_VISIBLE_DEVICES 并不適用,因此必須匹配 --sim_device 和 --rl_device 設(shè)置。
無頭操作: 包括 --headless,用于無渲染操作。
渲染控制: 按 "v "鍵可在訓(xùn)練過程中切換渲染。
策略位置: 訓(xùn)練后的策略保存在 humanoid/logs/<experiment_name>/<date_time>_<run_name>/model_<iteration>.pt 中。

5. 命令行參數(shù)

關(guān)于 RL 訓(xùn)練,請參考人形機(jī)器人/utils/helpers.py#L161。關(guān)于模擬到模擬過程,請參閱 humanoid/scripts/sim2sim.py#L169。

2.4 代碼結(jié)構(gòu)

每個(gè)環(huán)境都取決于一個(gè) env 文件 (legged_robot.py) 和一個(gè)配置文件 (legged_robot_config.py)。后者包含兩個(gè)類: LeggedRobotCfg(包含所有環(huán)境參數(shù))和 LeggedRobotCfgPPO(表示所有訓(xùn)練參數(shù))。
env 和 config 類都使用繼承。
cfg 中指定的非零獎勵(lì)標(biāo)度會為總獎勵(lì)貢獻(xiàn)一個(gè)相應(yīng)名稱的函數(shù)。
任務(wù)必須使用 task_registry.register(name,EnvClass,EnvConfig,TrainConfig)進(jìn)行注冊。注冊可以在 envs/__init__.py 中進(jìn)行,也可以在本資源庫之外進(jìn)行。

2.5 添加新環(huán)境

基本環(huán)境 legged_robot 構(gòu)建了一個(gè)粗糙地形運(yùn)動任務(wù)。相應(yīng)的配置沒有指定機(jī)器人資產(chǎn)(URDF/ MJCF),也沒有獎勵(lì)標(biāo)度。

如果需要添加新環(huán)境,請?jiān)?envs/ 目錄下新建一個(gè)文件夾,并將配置文件命名為 <your_env>_config.py。新配置應(yīng)繼承現(xiàn)有環(huán)境配置。
如果提議使用新機(jī)器人
在 resources/ 文件夾中插入相應(yīng)的資產(chǎn)。
在 cfg 文件中,設(shè)置資產(chǎn)路徑,定義體名、默認(rèn)關(guān)節(jié)位置和 PD 增益。指定所需的 train_cfg 和環(huán)境名稱(python 類)。
在 train_cfg 中,設(shè)置 experiment_name 和 run_name。
必要時(shí),在 <your_env>.py 中創(chuàng)建環(huán)境。繼承現(xiàn)有環(huán)境,覆蓋所需的功能和/或添加自己的獎勵(lì)功能。
在人形機(jī)器人/envs/__init__.py 中注冊環(huán)境。
根據(jù)需要修改或調(diào)整 cfg 或 cfg_train 中的其他參數(shù)。要移除獎勵(lì),請將其比例設(shè)為零。避免修改其他環(huán)境的參數(shù)!

2.6 故障排除

請注意以下情況:

# error
ImportError: libpython3.8.so.1.0: cannot open shared object file: No such file or directory

# solution
# set the correct path
export LD_LIBRARY_PATH="~/miniconda3/envs/your_env/lib:$LD_LIBRARY_PATH" 

# OR
sudo apt install libpython3.8

# error
AttributeError: module 'distutils' has no attribute 'version'

# solution
# install pytorch 1.12.0
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

# error, results from libstdc++ version distributed with conda differing from the one used on your system to build Isaac Gym
ImportError: /home/roboterax/anaconda3/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.20` not found (required by /home/roboterax/carbgym/python/isaacgym/_bindings/linux64/gym_36.so)

# solution
mkdir ${YOUR_CONDA_ENV}/lib/_unused
mv ${YOUR_CONDA_ENV}/lib/libstdc++* ${YOUR_CONDA_ENV}/lib/_unused

2.7 致謝

Humanoid-Gym 的實(shí)現(xiàn)依賴于機(jī)器人系統(tǒng)實(shí)驗(yàn)室(Robotic Systems Lab)創(chuàng)建的 legged_gym 和 rsl_rl 項(xiàng)目的資源。我們特別利用了他們研究中的 LeggedRobot 實(shí)現(xiàn)來增強(qiáng)我們的代碼庫。

2.8 引用

如果您使用本代碼或其部分內(nèi)容,請引用以下內(nèi)容:?

@software{RobotEra2024Humanoid-Gym,
  author = {RobotEra},
  title = {{Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer}},
  url = {https://github.com/roboterax/humanoid-gym},
  year = {2024}
}

?

?

到了這里,關(guān)于Humanoid-Gym 開源人形機(jī)器人端到端強(qiáng)化學(xué)習(xí)訓(xùn)練框架!星動紀(jì)元聯(lián)合清華大學(xué)、上海期智研究院發(fā)布!的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • SanctuaryAI推出Phoenix: 專為工作而設(shè)計(jì)的人形通用機(jī)器人

    SanctuaryAI推出Phoenix: 專為工作而設(shè)計(jì)的人形通用機(jī)器人

    唯一入選《時(shí)代》雜志 2023 年最佳發(fā)明的通用機(jī)器人。 稱機(jī)器人自主做家務(wù)的速度和 靈活度 已達(dá)到了和人類相當(dāng)?shù)乃健?官網(wǎng)鏈接:https://sanctuary.ai/ Sanctuary AI 由其開創(chuàng)性的 人工智能控制系統(tǒng) Carbon? 提供支持,在宣布其技術(shù)首次商業(yè)部署后不到兩個(gè)月,Sanctuary AI 公布了其

    2024年03月09日
    瀏覽(22)
  • NVIDIA 宣布推出適用于人形機(jī)器人的 GR00T 項(xiàng)目基礎(chǔ)模型和主要 Isaac 機(jī)器人平臺更新

    NVIDIA 宣布推出適用于人形機(jī)器人的 GR00T 項(xiàng)目基礎(chǔ)模型和主要 Isaac 機(jī)器人平臺更新

    Isaac 機(jī)器人平臺現(xiàn)為開發(fā)人員提供新的機(jī)器人訓(xùn)練模擬器、Jetson Thor 機(jī)器人計(jì)算機(jī)、生成式 AI 基礎(chǔ)模型以及 CUDA 加速感知和操作庫 GTC — NVIDIA 今天宣布推出 GR00T 項(xiàng)目,這是一個(gè)用于人形機(jī)器人的通用基礎(chǔ)模型,旨在進(jìn)一步推動機(jī)器人技術(shù)和具體人工智能領(lǐng)域的突破。 作為該

    2024年04月13日
    瀏覽(26)
  • 機(jī)器人訓(xùn)練環(huán)境isaac gym以及l(fā)egged_gym項(xiàng)目的配置問題

    機(jī)器人訓(xùn)練環(huán)境isaac gym以及l(fā)egged_gym項(xiàng)目的配置問題

    isaac gym是現(xiàn)階段主流的機(jī)器人訓(xùn)練環(huán)境之一,而“https://leggedrobotics.github.io/legged_gym/”(下稱legged_gym)則是入門isaac gym機(jī)器人訓(xùn)練的經(jīng)典開源項(xiàng)目,博主在這里記錄實(shí)現(xiàn)legged_gym項(xiàng)目過程中的部分環(huán)境配置過程: 首先在ubuntu系統(tǒng)中創(chuàng)建新的虛擬環(huán)境,python版本為3.8: 進(jìn)入虛擬

    2024年01月24日
    瀏覽(27)
  • isaacgym(legged_gym)學(xué)習(xí) (一)—— 添加自己的機(jī)器人模型并訓(xùn)練

    提示:寫完文章后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 例如:isaacgym系列學(xué)習(xí)記錄。 這里默認(rèn)已經(jīng)安裝好isaacgym學(xué)習(xí)環(huán)境,并可以成功運(yùn)行其中的案例 這里我以宇數(shù)科技的GO2機(jī)器人為例,去其官網(wǎng)下載GO2的urdf文件 下載好了urdf文件,將其中resources/robots/go2文

    2024年02月20日
    瀏覽(170)
  • 用 GPU 并行環(huán)境 Isaac Gym + 強(qiáng)化學(xué)習(xí)庫 ElegantRL:訓(xùn)練機(jī)器人Ant,3小時(shí)6000分,最高12000分

    用 GPU 并行環(huán)境 Isaac Gym + 強(qiáng)化學(xué)習(xí)庫 ElegantRL:訓(xùn)練機(jī)器人Ant,3小時(shí)6000分,最高12000分

    前排提醒,目前我們能 “用 ppo 四分鐘訓(xùn)練 ant 到 6000 分”,比本文的 3 小時(shí)快了很多很多,有空會更新代碼 https://blog.csdn.net/sinat_39620217/article/details/131724602 介紹了 Isaac Gym 庫 如何使用 GPU 做大規(guī)模并行仿真,對環(huán)境模塊提速。這篇帖子,我們使用 1 張 A100GPU 在 3 個(gè)小時(shí)之內(nèi)

    2024年02月16日
    瀏覽(21)
  • 機(jī)器人制作開源方案 | 掃地機(jī)器人

    機(jī)器人制作開源方案 | 掃地機(jī)器人

    ? ? ?掃地機(jī)器人是現(xiàn)代家庭清潔的得力助手,能夠自主規(guī)劃清掃路徑,避開障礙物,有效覆蓋整個(gè)清潔區(qū)域。掃地機(jī)器人的出現(xiàn)極大地減輕了家庭清潔的負(fù)擔(dān),節(jié)省了時(shí)間和精力,它可以定期清理地面,確保家居環(huán)境的整潔和衛(wèi)生,讓家里變得更加舒適、無塵和宜居。 本文

    2024年02月05日
    瀏覽(21)
  • 【對話機(jī)器人】開源機(jī)器人項(xiàng)目介紹

    目錄 1. 閑聊機(jī)器人介紹 2. 青云客平臺 3. 思知項(xiàng)目 閑聊機(jī)器人是一種基于人工智能和自然語言處理技術(shù)的智能對話系統(tǒng),旨在模擬人類的語言交流能力,與用戶進(jìn)行自然、連貫的對話。閑聊機(jī)器人能夠理解用戶的問題或指令,通過分析和處理文本,生成符合語法和語義規(guī)則的

    2024年02月11日
    瀏覽(17)
  • 開源機(jī)器人SmallRobotArm機(jī)器人源碼解讀

    開源機(jī)器人SmallRobotArm機(jī)器人源碼解讀

    開源機(jī)器人SmallRobotArm是一個(gè)開源的6軸機(jī)械臂,都由步進(jìn)電機(jī)驅(qū)動,github地址:https://github.com/SkyentificGit/SmallRobotArm ?機(jī)器人長這個(gè)樣子 2 歐拉角及姿態(tài)變換 由歐拉角求姿態(tài)矩陣 源碼中用的歐拉角是ZYZ順組的歐拉角。 已知世界坐標(biāo)的坐標(biāo)(x,y,z)和歐拉角(α,β,γ),求出對應(yīng)的姿

    2024年02月16日
    瀏覽(25)
  • 機(jī)器人制作開源方案 | 送餐機(jī)器人

    機(jī)器人制作開源方案 | 送餐機(jī)器人

    作者: 賴志彩、曹柳洲、王恩開、李雪兒、楊玉凱 單位: 華北科技學(xué)院 指導(dǎo)老師: 張偉杰、羅建國 1.1 項(xiàng)目目的 ? ? ? 近年來,全國多地疫情頻發(fā),且其傳染性極高,食品接觸是傳播途徑之一。疫情防控需要大量人員投入,常常出現(xiàn)人力緊張的情況,物資配送已經(jīng)成為一

    2024年02月12日
    瀏覽(20)
  • 機(jī)器人制作開源方案 | 自主消毒防疫機(jī)器人

    機(jī)器人制作開源方案 | 自主消毒防疫機(jī)器人

    作者:陳毅豪 張植銅 羅郡 馬鑫龍 王丹晶 單位:西安外事學(xué)院 指導(dǎo)老師:陳小虎 杜喜 1. 1 目的及意義 ? ? ? 消毒是疫情防控工作中的重要一環(huán),傳統(tǒng)的消毒方式需要人工操作消毒設(shè)備,不僅工作量大,且一些消毒劑會對人體造成傷害,消毒機(jī)器人便成了代替人工的不二之

    2024年02月02日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包