初识gym——why is gym?

    技术2022-07-10  130

    who

    gym中的环境有几种,都可以在官网找到gym官网—环境

    Classic control and toy text(经典控制和玩具文本)Atari(Atari游戏)2D and 3D robots(2D和3D机器人)

    使用代码

    from gym import envs print(envs.registry.all())

    输出会是一个字典,其中包含gym的全部环境

    开发RL算法时,请使用下面的写法,很简单

    import gym env = gym.make('CartPole-v0')

    Background: Why Gym? (2016)

    基本上官网在分析,RL现在哪里好,在哪里又受到限制。

    这里简单摘要

    好处 RL的应用可以很广RL现在在一些困难的场景中已经很厉害了,例如AlphaGo 受到限制 适用RL的环境缺乏多样性适用RL的环境缺乏标准,论文难以浮现

    gym的目的就是解决这些

    总结

    官网的东西就这么多啦,算上这篇我已经总结了三篇gym官网的文档了。

    接下来的工作就是

    我会想办法把mujoco搞一套gym官网github上的代码分析一波最后拿几个小环境跑跑一些更新更强大的RL算法【附录】我其实水过pysc2,但这次我可能会认真搞一搞

    有兴趣加关注啦

    Processed: 0.009, SQL: 9