本文作者来自于宾夕法尼亚州立大学,提出了一种使用深度强化学习解决交通问题的方法。
报道:深度强化学习实验室
作者:DeepRL
智能交通信号灯控制对于高效的交通系统至关重要。现有的交通信号灯主要由手工制定的规则操作,而智能交通信号灯控制系统应动态调整为实时交通。使用深度强化学习技术进行交通信号灯控制的新兴趋势,最近的研究显示出令人鼓舞的结果。但是,现有研究尚未在现实世界的交通数据上测试这些方法,它们仅专注于研究奖励而不解释策略。而作者提出了一种用于交通信号灯控制的更有效的深度强化学习模型。并在从监控摄像头获得的大规模真实交通数据集上测试了方法。
作者在现有研究方法的基础上提出了使用深度强化学习解决交通控制的方法,整体结构图如下:
从图中可以看出右侧使我们熟悉的强化学习的模型结构。在此基础上定义了一些交通控制中的参数
下面是作者提出的模型结构:
其中的Q网络结构如下左侧,而经验池的结构如右侧
在实验的初始化中,作者设置的相关参数如下
在以上模型的基础上,他们针对济南的交通数据进行了相关实验
结果如下:
原文请详细查看原论文:https://faculty.ist.psu.edu/jessieli/Publications/2018-KDD-IntelliLight.pdf(文章末可以直接下载)
推荐阅读
专注深度强化学习前沿技术干货,论文,框架,学习路线等,欢迎关注微信公众号。
更多深度强化学习精选知识请关注深度强化学习实验室专栏,投稿请联系微信 1946738842.