多发性硬化症 (Multiple sclerosis, MS) 是一种以中枢神经系统白质炎性脱髓鞘病变为主要特点的慢性致残疾病,多以青壮年人群为目标,故又被称为「年轻人的隐形杀手」。据相关数据统计,全球有超过 280 万人受其影响。在亚洲,每 10 万人中就约有 1-5 个人罹患 MS,且该病已成为中国青壮年致残原因中仅次于外伤的疾病。2018 年,中国将该病列入《第一批罕见病目录》。
大脑磁共振成像 (Magnetic resonance imaging, MRI) 标志物在 MS 临床治疗和研究中至关重要,比如通过多重对比 MRI 扫描,可以捕捉疾病演变。然而,多重对比需要不同类型的专业扫描设备,过程耗时费力且成本昂贵,很多医院更是不具备此条件。因此,如何简化 MRI 分析就成为解决问题的关键,尤其是通过单对比度脑容量计算,既可以减少多重对比采集的需求,又可以降低临床试验成本。
基于此,英国伦敦大学学院的研究团队开发了一款名为 MindGlide 的工具,可以从 MS 患者护理过程中获得的 MRI 扫描图像中提取关键信息, 例如大脑受损区域、大脑萎缩和斑块等细微变化。MindGlide 证明了常规 MRI 扫描在缺乏理想成像对比时,依旧有发现新病变和细微脑组织损伤方面的潜力, 同时也有望进一步帮助医护人员提升解释和评估 MS 患者的治疗效果的能力。
相关研究以「Enabling new insights from old scans by repurposing clinical MRI archives for multiple sclerosis research」为题,发表于 Nature Communications。
研究亮点:
*实现了从单个 MRI 对比中提取多个临床相关 MRI 生物标志,并且与最先进技术相比,MindGlide 能够在多个关键领域表现的更优异
- 即使使用有限的 MRI 数据和通常不用于这些任务的单对比,也可以实现具有临床意义的组织分割和病变量化
论文地址:
https://www.nature.com/articles/s41467-025-58274-8
开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,还提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s
数据集:所有数据基于 MS 患者采集而来
为了验证模型的可靠性和有效性,研究采用了不同的训练数据集和外部验证数据集,且数据完全来自 MS 患者。该研究得到了蒙特利尔神经学研究所的国际进行性多发性硬化症联盟 (International Progressive MS Alliance) 数据库支持, 并抽取了相关训练数据,主要来自 MS-stat 试验、ORATORIO 试验,以及英国 3 家医院获取的儿科复发缓解型 MS 患者的常规护理数据集和 2 个开源病变分割数据集(MS-30 和 ISBI)。
*MindGlide 通过医院档案中常用的 MRI 对比和相关组织强度(T1-weighted、TI-weighted、Proton Density (PD) 和 T2-Fluid Attenuated Inversion Recovery (FLAIR))处理 MRI,包括 2D 和 3D 扫描。
在模型训练阶段,研究人员使用了 8,550 张真实和合成图像的数据集对 MindGlide 进行训练。 其中,真实的 MRI 扫描图像共计 4,247 张(包括 2,092 张 TI-weighted 和 2,155 张 FLAIR),来自 2,871 名患者(包括 1,082 名复发缓解型 MS 患者 (RRMS)、1,453 名继发进行型 MS 患者 (SPMS) 和 336 名原发进行型 MS 患者(PPMS))。这些扫描图像通过 592 台专业的 MRI 扫描仪器分别在 1.5 和 3 特斯拉磁场下获得。 随后,研究人员又生成了 4,303 张合成扫描图像来扩展训练。
训练集的患者特征
在模型验证阶段,研究人员采用了一组外部验证集,测试了 MindGlide 在 14-64 岁年龄段的通用性,包括两项进展性 MS 临床试验和一组真实的儿科复发缓解型 MS 患者。 外部验证数据集包含了 1,001 名患者(PPMS 试验 699 名,SPMS 试验 141 名,RRMS 试验 161 名),通过 186 台 MRI 扫描仪获得。
其中,PPMS 数据集包括 11,015 个 MRI 扫描(2,756 个 TI-weighted、2,754 个 T2-weighted、2,749 个 FLAIR、2,756 个 PD),所有切片厚度均为 3mm(1mm x 1mm x 3mm);SPMS 数据集包括 763 次扫描(378 次 TI-weighted、385 次 T2-weighted),具有不同的切片厚度(T1-weighted 为 1mm x 1mm x 1mm;T2-weighted 为 3mm x 1mm x 1mm);儿科 RRMS 数据集包括 1,478 次扫描(523 个 T1-weighted、475 个 T2-weighted、480 个 FLAIR),包含不同的切片厚度。
模型架构:一种高效 3D 卷积神经网络
MindGlide 的开发基于「nnU-Net」,这是一种基于 U-Net 架构的 3D 卷积神经网络 (CNN) , 它具有自动自配置的能力,从而可以绕过昂贵的超参数调谐过程。通过训练,MindGlide 可以同时分割脑灰质、白质区域以及 MS 病变,从而适应真实的 MRI 变化,解决传统图像处理软件中的伪影问题。整体架构及策略如下图所示。
MindGlide 训练及外部验证策略的相关步骤
针对模型训练的图像预处理,研究人员使用了一个最小的预处理管道,首先将图像分辨率标准化为 1 mm 各向同性体素,然后根据 nnU-Net 设计。然后研究人员使用滑动窗口技术提取 128 x 128 x 64 体素补丁,以优化训练期间的内存和计算效率。
数据增强主要是通过随机修改人为地扩大训练数据的多样性,增强模型的可泛化性,减轻过拟合。研究人员采用了两种技术用于扩大其适应性,一是扭曲真实扫描的几何形状和图像强度,二是生成合成扫描。 如图中 a 所示,采用域随机化,产生强度变化,为不同的 MRI 对比准备模型。
合成数据的生成使用了 SynthSeg 2.0 版本,另外研究人员使用 MONAI 1.2.0 版本在训练期间进行增强,然后直接从训练数据集的标签生成不同对比度的合成扫描。如图中 a 演示了生成的合成数据示例,并在图 b 中展示了通过真实数据和增强数据训练 MindGlide。
在相关的报道中,媒体用直观的数据展示了这款模型的能力。其提到,以往神经放射科专家需要数周才能手动解读的复杂扫描,如今 MindGlide 每张图只需要 5 到 10 秒, 这使得以前无法分析的图像和常规 MRI 扫描图像获得了新的价值,在临床试验和常规护理中检测不同治疗方法对疾病进展的影响有了更可靠的依据。
实验结果:多维度对比显示 MindGlide 的优越性
为了评估 MindGlide 的验证效果,研究人员将其与现有最先进的技术进行了对比,比对对象分别为 WMH-SynthSeg 和 SAMSEG,其中前者能够从不同分辨率和对比度的扫描中同时分割白质高信号和大脑解剖结构,后者能够在不同 MRI 对比度下稳健分割病变和大脑结构。
首先,实验比较了三者与人类专家标记病变分割与残疾的一致性情况,如下图所示。MindGlide 与人工标记的真实病变之间的一致程度更高, 中位数 Dice 得分为 0.606,SAMSEG 为 0.504,WMH-Synthseg 为 0.385。
性能比较概况
另外,在 PPMS 数据集中,MindGlide 得出的病变负荷与扩展残疾状态量表 (Expanded Disability Status Scale,EDSS) 的数值相关性也比现有技术更高。
随后,研究人员进行了针对病变治疗效果的纵向验证,涉及多项实验,证明了 MindGlide 在治疗效果检测方面的有效性,如在 SPMS 和 PPMS 试验中,治疗组的病变体积累积量低于安慰剂组;在儿科队列中,MindGlide 成功检测了不同治疗组中病变体积的不同变化,如下图所示。
常规护理儿科数据集中脑区域和病变体积的纵向变化
在检测脑组织损失的治疗效果中,MindGlide 显示了治疗组皮质 GM 体积损失率明显低于安慰剂组。 下图为各种对比的分割示例。
在此之后,研究人员继续在 PPMS 临床实验中比较了 MindGlide 与其他分割工具和真实病变的治疗效果。实验结果显示 MindGlide 与基础真值非常接近,相比之下, SAMSEG 高估了治疗效果,WHM-Synthseg 则低估了治疗效果,表明了 MindGlide 的病变体积估计精度更高。
下图显示了三者对区域脑容量的评估,结果显示,与纵向 SAMSEG 或 WHM-Synthseg 获得的测量结果相比,MindGlide 的测量结果显示治疗组之间的治疗效果更好。
MindGlide、SAMSEG、WHM-Synthseg 纵向脑区变化及病灶体积比较
另外在常规护理临床数据集中,研究人员目视检查了 WMH-Synthseg 和 MindGlide,结果显示,前者显示出显著的失败率,尤其是扫描厚度超过 5mm 时。在视觉评估的 433 个对比中,WMH-Synthseg 未能分割 65 个扫描,而 MindGlide 仅有 6 个。 示例如下图。
MindGlide 和 WMH-Synthseg 分割示例
其中,图 (b) 显示了常规护理临床数据集 (RRMS) 中的一个厚度为 7mm 的切片,WMH-Synthseg 分割失败。这是因为大多数分割工具被设计为使用优劣采集方向,而 MindGlide 允许对任何方向获取的图像进行分割。
总而言之,MindGlide 在多方面都表现出优于现有方法的特征,并且可以从单一 MRI 对比中提取多种生物标志物,能够有效监测治疗效果,适用于多种临床场景, 为 MS 研究和临床决策提供有力支持。
AI 已成为 MS 研究中的重要手段
近年来,人工智能的快速发展,使其在神经系统疾病方面的应用不断加快,并且由于其独特的工作机制和高效的方法,为医学界通过人工智能进行 MS 研究提供了新的思路。无独有偶,针对 MS 这一危害人类健康的重大难题,不少实验室都在利用人工智能进行攻克的尝试。
比如来自多伦多大学的刘芳教授课题组曾在 Science Advances 上发表过一篇题为「Small-molecule targeting AMPA-mediated excitotoxicity has therapeutic effects in mouse models for multiple sclerosis」的文章,该研究克服了传统理论的观点,突破性地开发了一种小分子化合物,通过靶向一个新的调控 AMPA 受体介导的兴奋毒性机制发挥作用。 该研究采用了人工智能虚拟筛选靶向 AMPA 受体 GluA 2 亚基的小分子,不仅为国际上此类药物研发填补了空白,更难能可贵是为 MS 治疗提供了一种全新的思路。
论文地址:
https://www.science.org/doi/10.1126/sciadv.adj6187
除此之外,一篇发表于 NeuroImage 的研究也提出了一种用于 MS 患者 MRI 扫描中同时分割白质病变和 41 个神经解剖结构的新开源工具。这种方法正是基于上述提到的生成式模型 SAMSEG 进行扩展,能够适应不同的扫描和成像协议,无需预先分割病变即可评估萎缩, 克服了现有工具的一些局限性。相关文章以「A contrast-adaptive method for simultaneous whole-brain and lesion segmentation in multiple sclerosis」为题发表。
论文地址:
https://www.sciencedirect.com/science/article/pii/S1053811920309563?via%3Dihub
而这些种种的科技成果和前沿发现,无一不透露着人工智能在 MS 研究中的价值,虽然路途尚远,但也让人们看到了希望。正如上述文章第一作者 Philipp Goebl 博士所希冀的,通过人工智能进行临床试验来解决患者病情, 或许未来 5 到 10 年可成为现实。