6

DeepRL · 2020年03月04日

方法 || 深度强化学习解决交通控制问题

人工智能强化学习

本文作者来自于宾夕法尼亚州立大学，提出了一种使用深度强化学习解决交通问题的方法。
报道：深度强化学习实验室
作者：DeepRL

智能交通信号灯控制对于高效的交通系统至关重要。现有的交通信号灯主要由手工制定的规则操作，而智能交通信号灯控制系统应动态调整为实时交通。使用深度强化学习技术进行交通信号灯控制的新兴趋势，最近的研究显示出令人鼓舞的结果。但是，现有研究尚未在现实世界的交通数据上测试这些方法，它们仅专注于研究奖励而不解释策略。而作者提出了一种用于交通信号灯控制的更有效的深度强化学习模型。并在从监控摄像头获得的大规模真实交通数据集上测试了方法。

作者在现有研究方法的基础上提出了使用深度强化学习解决交通控制的方法，整体结构图如下：

从图中可以看出右侧使我们熟悉的强化学习的模型结构。在此基础上定义了一些交通控制中的参数

下面是作者提出的模型结构：

其中的Q网络结构如下左侧，而经验池的结构如右侧

在实验的初始化中，作者设置的相关参数如下

在以上模型的基础上，他们针对济南的交通数据进行了相关实验

结果如下：

原文请详细查看原论文：https://faculty.ist.psu.edu/jessieli/Publications/2018-KDD-IntelliLight.pdf（文章末可以直接下载）

推荐阅读

专注深度强化学习前沿技术干货，论文，框架，学习路线等，欢迎关注微信公众号。

更多深度强化学习精选知识请关注深度强化学习实验室专栏，投稿请联系微信 1946738842.

6 阅读 3.7k

推荐阅读

深度强化学习入门到精通-2020最全资料综述深度强化学习系列之--OpenAI-Baselines的使用方法深度强化学习十大原则最前沿：深度强化学习的强者之路《深度强化学习：基础、研究与应用》书籍开源啦，中文简体版免费下载(附链接) 一份人工智能领域知识脑图汇总

深度强化学习

关注数

2954

内容数

56

专注深度强化学习前沿技术，欢迎关注

关注专栏专栏主页

目录

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息