报道:深度强化学习实验室
作者:Devin
OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用
OpenAI、DeepMind,伯克利三个可以说是强化学习的推动者,其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子,以A2C算法为例子(具体a2c算法原理后续讲解):
首先就是安装gym环境,具体直接参考OpenAI的github: https://github.com/openai/gym
本文使用了Atari游戏,那么在gym中需要安装,不然有的游戏可能不会默认安装:
pip install -e '.[atari]'
这是原话:The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:
import gym
env = gym.make('SpaceInvaders-v0')
env.reset()
env.render()
下一步就是clone baselines的仓库了:
git clone https://github.com/openai/baselines.git
然后进入目录进行运行:
目录如下:
total 48drwxrwxr-x 6 jqw jqw 4096 Jun 8 16:50 .drwxrwxr-x 3 jqw jqw 4096 Jun 7 11:07 ..drwxrwxr-x 15 jqw jqw 4096 Jun 8 19:42 baselines
drwxr-xr-x 2 root root 4096 Jun 8 16:50 baselines.egg-infodrwxrwxr-x 2 jqw jqw 4096 Jun 7 11:08 data-rw-rw-r-- 1 jqw jqw 504 Jun 7 11:08 Dockerfile
drwxrwxr-x 8 jqw jqw 4096 Jun 7 11:08 .git-rw-rw-r-- 1 jqw jqw 285 Jun 7 11:08 .gitignore-rw-rw-r-- 1 jqw jqw 1087 Jun 7 11:08 LICENSE-rw-rw-r-- 1 jqw jqw 3417 Jun 7 11:08 README.md-rw-rw-r-- 1 jqw jqw 957 Jun 7 11:08 setup.py-rw-rw-r-- 1 jqw jqw 224 Jun 7 11:08 .travis.yml
python3 -m baselines.a2c.run_atari
就可以了,其他的算法同样的道理。
注意:此处使用给的是python3,
那么对应需要在python3下安装numpy, matplotlib, tensorflow, 等一系列库,此处省略
注意:如果使用OpenAI的baselines运行Mujoco环境,可能存在一些列问题,下一篇文章将会介绍!敬请期待,欢迎大家互相讨论学习!
参考:
https://github.com/openai/gym
https://github.com/openai/bas...
推荐阅读
专注深度强化学习前沿技术干货,论文,框架,学习路线等,欢迎关注微信公众号。
更多深度强化学习精选知识请关注深度强化学习实验室专栏,投稿请联系微信 1946738842.