首发:AI公园公众号
作者:Abhinav Sagar
编译:ronghuaiyang
导读
利用变分推断进行分割置信度的预测。
在过去的十年里,深度学习在一系列的应用中取得了巨大的成功。然而,为了验证和可解释性,我们不仅需要模型做出的预测,还需要知道它在做出预测时的置信度。这对于让医学影像学的临床医生接受它是非常重要的。在这篇博客中,我们展示了我们在韦洛尔理工学院进行的研究。我们使用了一个基于变分推理技术的编码解码架构来分割脑肿瘤图像。我们比较了U-Net、V-Net和FCN等不同的主干架构作为编码器的条件分布采样数据。我们使用Dice相似系数(DSC)和IOU作为评价指标来评价我们在公开数据集BRATS上的工作。
医学图像分割
在目前的文献中主要利用两种技术成功地解决了医学图像的分割问题,一种是利用全卷积网络(FCN),另一种是基于U-Net的技术。FCN体系结构的主要特点是在最后没有使用已成功用于图像分类问题的全连接层。另一方面,U-Net使用一种编码器-解码器架构,在编码器中有池化层,在解码器中有上采样层。
贝叶斯神经网络
变分推断
=======
随机不确定性和认知不确定性
================
有两种类型的不确定性 —— 随机不确定性和认知不确定性,其中方差是两者的总和。对于最终的预测,单个的均值和方差可以估计,如下两个方程所示。
方差中的第一项表示随机不确定性,而第二项表示认知不确定性。
网络结构
先验分布有助于整合网络上的权值学习。我们的模型使用了与VAEs中使用的类似的编码器解码器体系结构,编码器的输入来自预先训练好的图像分割结构。输入到编码器只需要表示置信度的条件分布的标准差向量的均值,以此来正确预测像素点。参数经过编码器后,被转换为一个潜在表示,再采样的平均值和标准偏差向量。解码器随后将其恢复到原始分布。采用传统的反向传播算法进行梯度下降模型的训练。本工作中使用的模型架构如图1所示:
图1:模型结构
算法
下面是基于随机梯度下降的训练网络的算法。
数据集
======
为了评估我们的网络性能,我们使用BRATS18脑瘤分割数据集。它包含175名恶性胶质瘤和低级别恶性胶质瘤患者的MRI扫描。图像分辨率为240×240×155像素。ground truth标签是由神经放射学专家创建的。数据集的一个示例如图2所示。
图2:MRI切片的例子以及分割的ground truth
评估指标
评价指标为Dice相似系数(DSC),也称F1-score和IoU。对应的方程如下所示。
损失函数
=======
结果
=====
分割所涉及的不确定性如图3所示。深的颜色表示更自信,而浅的颜色表示模型在这些区域不太自信。
图3:与ground truth分割相比,测试样本上的模型预测示例。第一列:输入图像,第二列:真值分割,第三列:预测分割,第四列:随机不确定性,第五列:认知不确定性
总结
在这个博客中,我们提出了一种在医学图像分割中量化不确定性的方法。我们的模型基于一个类似于VAEs所使用的编码器解码器框架。网络的权值代表分布而不是点估计,从而在进行预测的同时给出了一种原则性的测量不确定性的方法。编码器的输入来自于预训练的骨干架构,如U-Net, V-Net, FCN,这些架构都是从条件分布中采样的,代表了像素被正确标记的置信度。我们在公开数据集BRATS上评估我们的结果,使用DSC和IOU指标,我们的网络优于以前的SOTA的结果。
—END—
英文原文:https://towardsdatascience.co...
推荐阅读
关注图像处理,自然语言处理,机器学习等人工智能领域,请点击关注AI公园专栏。
欢迎关注微信公众号