爱笑的小姐姐 · 2022年08月18日 · 北京市

STGCN时空卷积图神经网络

交通流问题具有复杂性高、非线性等特点。传统的预测方法效果不尽如人意。在2018年,北京大学和北京大数据研究院发布一篇名为《Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting》的论文,提出了STGCN的图网络结构来解决交通领域的时序预测问题,并在当时达到了SOTA的效果。

STGCN可以处理时间序列问题,不仅可以用于交通也可用于其他时序问题;结合了图卷积与因果卷积,可以提取时域和空间域特征;网络由卷积结构构成,可以平行计算,速度快。

节点为交通观测点,边为道路。通过对路网进行定期采样可以得到图的时间序列。

STGCN的网络为2个时空卷积块和1个输出层组成。时空卷积块为三明治结构,2个时域卷积夹1个空间域卷积。如下图所示。

即,作者采用了时域卷积来提取交通路网在时间序列上的特征,采样空间卷积来提取路网互相勾连的空间信息。其中时域卷积采取的是因果卷积和GLU,空间域的卷积采取的是GCN。

空间域卷积

图卷积定义:信号x与滤波器Θ在傅里叶域里的乘积

∗g是图卷积操作, 经过拉普拉斯变换后,U是特征向量矩阵, Λ是特征值矩阵,UTx是信号x的傅里叶变换,Θ(Λ)是L特征向量的函数

直接进行图卷积的话,计算复杂度太高,矩阵分解的计算量过大。

利用切比雪夫多项式可以来近似图卷积的结果。

通过K阶截断来获得近似值

Tk(·)是k阶的切比雪夫多项式,θk是系数,L ̃是re-scaled的特征值对角矩阵

一个layer-wise的线性公式可以由多个使用1阶近似拉普拉斯矩阵的局部图卷积层堆叠而来。

定义λmax =2

令θ0 θ1是共享参数,可以用θ来替换,θ= θ0 =-θ1

再次归一化后

通过垂直堆叠一阶近似的图卷积可以获得和水平的K阶卷积相同的效果

时域卷积

作者通过一维因果卷积和一个GLU来提取时域特征。

在卷积之后,将输入拆成2个部分,其中一部分乘以激活函数,2个部分再进行哈玛达积,形成类残差的结构。

数据结构的变化

当因果卷积的kernel size是3时,时间序列会缩短。

实验

作者采用北京跟美国加州的数据集分别进行了验证,并且取得了sota的效果。

文章来源:知乎
作者:于璠

推荐阅读

更多嵌入式AI相关技术干货请关注嵌入式AI专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
16564
内容数
1230
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息