DeepRL · 2020年03月04日

方法 || 深度强化学习解决交通控制问题

本文作者来自于宾夕法尼亚州立大学,提出了一种使用深度强化学习解决交通问题的方法。
报道深度强化学习实验室
作者:DeepRL
智能交通信号灯控制对于高效的交通系统至关重要。现有的交通信号灯主要由手工制定的规则操作,而智能交通信号灯控制系统应动态调整为实时交通。使用深度强化学习技术进行交通信号灯控制的新兴趋势,最近的研究显示出令人鼓舞的结果。但是,现有研究尚未在现实世界的交通数据上测试这些方法,它们仅专注于研究奖励而不解释策略。而作者提出了一种用于交通信号灯控制的更有效的深度强化学习模型。并在从监控摄像头获得的大规模真实交通数据集上测试了方法。

作者在现有研究方法的基础上提出了使用深度强化学习解决交通控制的方法,整体结构图如下:1.jpg

从图中可以看出右侧使我们熟悉的强化学习的模型结构。在此基础上定义了一些交通控制中的参数

2.jpg
下面是作者提出的模型结构:
3.jpg
其中的Q网络结构如下左侧,而经验池的结构如右侧
4.jpg

在实验的初始化中,作者设置的相关参数如下
5.jpg

在以上模型的基础上,他们针对济南的交通数据进行了相关实验
6.jpg

结果如下:
7.jpg

原文请详细查看原论文:https://faculty.ist.psu.edu/jessieli/Publications/2018-KDD-IntelliLight.pdf(文章末可以直接下载)


推荐阅读


专注深度强化学习前沿技术干货,论文,框架,学习路线等,欢迎关注微信公众号。
深度强化学习实验室.png
更多深度强化学习精选知识请关注深度强化学习实验室专栏,投稿请联系微信 1946738842.
推荐阅读
关注数
2945
内容数
56
专注深度强化学习前沿技术,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息