深度强化学习系列之--OpenAI-Baselines的使用方法 - 极术社区

报道：深度强化学习实验室
作者：Devin

OpenAI，由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后，决定共同创建OpenAI，希望能够预防人工智能的灾难性影响，推动人工智能发挥积极作用

OpenAI、DeepMind，伯克利三个可以说是强化学习的推动者，其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子，以A2C算法为例子（具体a2c算法原理后续讲解）：

首先就是安装gym环境，具体直接参考OpenAI的github： https://github.com/openai/gym
本文使用了Atari游戏，那么在gym中需要安装，不然有的游戏可能不会默认安装：

pip install -e '.[atari]'

这是原话：The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:

import gym
env = gym.make('SpaceInvaders-v0')
env.reset()
env.render()

下一步就是clone baselines的仓库了：

git clone https://github.com/openai/baselines.git

然后进入目录进行运行：

目录如下：
total 48drwxrwxr-x  6 jqw  jqw  4096 Jun  8 16:50 .drwxrwxr-x  3 jqw  jqw  4096 Jun  7 11:07 ..drwxrwxr-x 15 jqw  jqw  4096 Jun  8 19:42 baselines
drwxr-xr-x  2 root root 4096 Jun  8 16:50 baselines.egg-infodrwxrwxr-x  2 jqw  jqw  4096 Jun  7 11:08 data-rw-rw-r--  1 jqw  jqw   504 Jun  7 11:08 Dockerfile
drwxrwxr-x  8 jqw  jqw  4096 Jun  7 11:08 .git-rw-rw-r--  1 jqw  jqw   285 Jun  7 11:08 .gitignore-rw-rw-r--  1 jqw  jqw  1087 Jun  7 11:08 LICENSE-rw-rw-r--  1 jqw  jqw  3417 Jun  7 11:08 README.md-rw-rw-r--  1 jqw  jqw   957 Jun  7 11:08 setup.py-rw-rw-r--  1 jqw  jqw   224 Jun  7 11:08 .travis.yml

python3 -m baselines.a2c.run_atari

就可以了，其他的算法同样的道理。

注意：此处使用给的是python3,
那么对应需要在python3下安装numpy, matplotlib, tensorflow, 等一系列库，此处省略

注意：如果使用OpenAI的baselines运行Mujoco环境，可能存在一些列问题，下一篇文章将会介绍！敬请期待，欢迎大家互相讨论学习！

参考：
https://github.com/openai/gym
https://github.com/openai/bas...

推荐阅读
基于强化学习的自动交易系统研究与发展综述
DeepMind发布强化学习库 RLax
AAAI-2020 || 52篇深度强化学习accept论文汇总
专注深度强化学习前沿技术干货，论文，框架，学习路线等，欢迎关注微信公众号。

更多深度强化学习精选知识请关注深度强化学习实验室专栏，投稿请联系微信 1946738842.