交通流问题具有复杂性高、非线性等特点。传统的预测方法效果不尽如人意。在2018年,北京大学和北京大数据研究院发布一篇名为《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》的论文,提出了STGCN的图网络结构来解决交通领域的时序预测问题,并在当时达到了SOTA的效果。
STGCN可以处理时间序列问题,不仅可以用于交通也可用于其他时序问题;结合了图卷积与因果卷积,可以提取时域和空间域特征;网络由卷积结构构成,可以平行计算,速度快。
节点为交通观测点,边为道路。通过对路网进行定期采样可以得到图的时间序列。
STGCN的网络为2个时空卷积块和1个输出层组成。时空卷积块为三明治结构,2个时域卷积夹1个空间域卷积。如下图所示。
即,作者采用了时域卷积来提取交通路网在时间序列上的特征,采样空间卷积来提取路网互相勾连的空间信息。其中时域卷积采取的是因果卷积和GLU,空间域的卷积采取的是GCN。
空间域卷积
图卷积定义:信号x与滤波器Θ在傅里叶域里的乘积
∗g是图卷积操作, 经过拉普拉斯变换后,U是特征向量矩阵, Λ是特征值矩阵,UTx是信号x的傅里叶变换,Θ(Λ)是L特征向量的函数
直接进行图卷积的话,计算复杂度太高,矩阵分解的计算量过大。
利用切比雪夫多项式可以来近似图卷积的结果。
通过K阶截断来获得近似值
Tk(·)是k阶的切比雪夫多项式,θk是系数,L ̃是re-scaled的特征值对角矩阵
一个layer-wise的线性公式可以由多个使用1阶近似拉普拉斯矩阵的局部图卷积层堆叠而来。
定义λmax =2
令θ0 θ1是共享参数,可以用θ来替换,θ= θ0 =-θ1
再次归一化后
通过垂直堆叠一阶近似的图卷积可以获得和水平的K阶卷积相同的效果
时域卷积
作者通过一维因果卷积和一个GLU来提取时域特征。
在卷积之后,将输入拆成2个部分,其中一部分乘以激活函数,2个部分再进行哈玛达积,形成类残差的结构。
数据结构的变化
当因果卷积的kernel size是3时,时间序列会缩短。
实验
作者采用北京跟美国加州的数据集分别进行了验证,并且取得了sota的效果。
文章来源:知乎
作者:于璠
推荐阅读
更多嵌入式AI相关技术干货请关注嵌入式AI专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。