国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

OpenAI-gym 關(guān)于render無法彈出游戲窗口以及想要在訓(xùn)練時(shí)不渲染然后在測試時(shí)再渲染的解決方案

這篇具有很好參考價(jià)值的文章主要介紹了OpenAI-gym 關(guān)于render無法彈出游戲窗口以及想要在訓(xùn)練時(shí)不渲染然后在測試時(shí)再渲染的解決方案。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.render()無法彈出游戲窗口的原因

你使用的代碼可能與你的gym版本不符
在我目前的測試看來,gym 0.23的版本,在初始化env的時(shí)候只需要游戲名稱這一個(gè)實(shí)參,然后在需要渲染的時(shí)候主動(dòng)調(diào)用render()去渲染游戲窗口,比如:

env = gym.make("CartPole-v1")
obs = env.reset()
for _ in range(1000):
	env.render()
	obs, reward, done, info = env.step(env.action_space.sample())	# 以action隨機(jī)抽樣為例
	if done:
		break
env.close()

而在gym0.26的版本,在初始化env的時(shí)候你需要加入另一個(gè)實(shí)參:render_mode,如:

env = gym.make("CartPole-v1", render_mode="human")

具體參數(shù)參考官方文檔:https://www.gymlibrary.dev/
并且,你在reset時(shí)需要設(shè)置seed參數(shù),并且還要用二項(xiàng)元組接收數(shù)據(jù),而且step時(shí)需要用五項(xiàng)元組接收數(shù)據(jù),否則會(huì)報(bào)錯(cuò)
就模仿官方文檔的入門教程這樣寫:

import gym
env = gym.make("LunarLander-v2", render_mode="human")
observation, info = env.reset(seed=42)
for _ in range(1000):
   action = policy(observation)  # User-defined policy function
   observation, reward, terminated, truncated, info = env.step(action)

   if terminated or truncated:
      observation, info = env.reset()
env.close()

2.在設(shè)置好 render_mode 后,調(diào)用reset()即會(huì)自動(dòng)開始渲染

看了一下gym0.26的reset方法代碼,它會(huì)根據(jù)你初始化env時(shí)傳入的render_mode參數(shù)去決定它要不要渲染,并且,在gym0.26主動(dòng)調(diào)用render是無效的
CartPole游戲的reset源碼如下:

    def reset(
        self,
        *,
        seed: Optional[int] = None,
        options: Optional[dict] = None,
    ):
        super().reset(seed=seed)
        # Note that if you use custom reset bounds, it may lead to out-of-bound
        # state/observations.
        low, high = utils.maybe_parse_reset_bounds(
            options, -0.05, 0.05  # default low
        )  # default high
        self.state = self.np_random.uniform(low=low, high=high, size=(4,))
        self.steps_beyond_terminated = None

        if self.render_mode == "human":
            self.render()
        return np.array(self.state, dtype=np.float32), {}

可以看到,在最后,如果render_mode設(shè)置為"human",那么render方法將被調(diào)用。

3.在gym 0.26如何實(shí)現(xiàn)訓(xùn)練時(shí)不渲染,而測試時(shí)再渲染

在gym0.23版本,可以主動(dòng)調(diào)用render來決定渲不渲染,而在gym0.26版本,只要reset就渲染,所以如果你剛開始就設(shè)定render_mode="human"的話,那么你將會(huì)看到整個(gè)訓(xùn)練過程,且動(dòng)畫渲染結(jié)束之后才會(huì)開始下一個(gè)episode的訓(xùn)練,所以訓(xùn)練時(shí)長會(huì)比不渲染時(shí)更長。

解決方案:

最初,我以為動(dòng)態(tài)地去修改env.render_mode即可,但我發(fā)現(xiàn)env初始化之后這個(gè)就是一個(gè)無法修改的參數(shù)

所以,你可以在初始化訓(xùn)練的env_train時(shí),不添加render_mode參數(shù)(或添加除human之外的參數(shù)),然后在測試的時(shí)候,新創(chuàng)建一個(gè)與之前一樣的env:env_test

env_test = gym.make("CartPole-v1", render_mode='human')

用新的env_test去測試就好文章來源地址http://www.zghlxwxcb.cn/news/detail-426188.html

到了這里,關(guān)于OpenAI-gym 關(guān)于render無法彈出游戲窗口以及想要在訓(xùn)練時(shí)不渲染然后在測試時(shí)再渲染的解決方案的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包