《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 融合多模态分组特征处理模块的脑肿瘤分割方法
融合多模态分组特征处理模块的脑肿瘤分割方法
电子技术应用
方云翔1,王路路1,李英娜1,杜井龙2
1.昆明理工大学 云南省计算机重点实验室;2.重庆医科大学 医学信息学院
摘要: 当前脑部肿瘤分割模型大多在通道维度上简单拼接多模态MRI图像,未充分利用其多模态信息。为此,基于3D UX-Net,提出融合多模态分组特征处理模块的MGF-UX Net模型。该模型通过模态特征抽取与融合两大模块,实现多模态特征的有效利用。模态特征抽取模块针对四种MRI模态特性,采用专门的特征提取网络,以最大化保留有效信息;模态特征融合模块基于先验知识,将四个模态划分为两组,并通过模态分组交叉注意力(MGCA)机制进行深度融合。实验结果表明,在BraTS2021数据集上,MGF-UX Net的平均DSC和HD95分别达到91.01%和4.975 mm,在脑肿瘤分割任务中各项指标优于现有对比模型。
中图分类号:TTP391P 文献标志码:A DOI: 10.16157/j.issn.0258-7998.256494
中文引用格式: 方云翔,王路路,李英娜,等. 融合多模态分组特征处理模块的脑肿瘤分割方法[J]. 电子技术应用,2025,51(11):46-52.
英文引用格式: Fang Yunxiang,Wang Lulu,Li Yingna,et al. A brain tumor segmentation method with multi-modal grouped feature processing module[J]. Application of Electronic Technique,2025,51(11):46-52.
A brain tumor segmentation method with multi-modal grouped feature processing module
Fang Yunxiang1,Wang Lulu1,Li Yingna1,Du Jinglong2
1.Faculty of Information Engineering and Automation, Kunming University of Science and Technology;2.Medical Data Science Academy and College of Medical Informatics, Chongqing Medical University
Abstract: Current brain tumor segmentation models typically concatenate multi-modal MRI images along the channel dimension, failing to fully exploit their multi-modal information. To address this limitation, this paper proposes MGF-UX Net, a model based on 3D UX-Net that integrates a multi-modal grouped feature processing module. The model consists of two key components: a modality feature extraction module and a modality feature fusion module. The feature extraction module employs specialized networks tailored to the characteristics of four MRI modalities to maximize the retention of effective features. The feature fusion module, guided by prior knowledge, groups the four modalities into two sets and applies a Modality-Grouped Cross-Attention (MGCA) mechanism for deep feature fusion. Experimental results on the BraTS2021 dataset demonstrate that MGF-UX Net achieves an average DSC of 91.01% and an HD95 of 4.975 mm, outperforming existing models in brain tumor segmentation tasks.
Key words : brain tumor segmentation;U-Net;MRI;multimodal medical imaging

引言

脑部肿瘤,又称颅内肿瘤,是发生在颅腔内的神经系统肿瘤,通常由脑部正常组织病变形成。精准的肿瘤分割对于临床诊断和手术治疗至关重要。

为实现脑部肿瘤的自动分割,研究者提出了多种方法。传统方法包括基于机器学习、图谱、阈值以及区域生长的分割技术[1-4]。然而,这些方法往往依赖人工特征工程,导致特征表示能力受限,难以应对复杂的肿瘤形态。

近年来,随着深度学习技术的快速发展,卷积神经网络(CNN)在各类视觉任务中展现出卓越的性能。凭借强大的特征学习能力,CNN已被广泛应用于脑部肿瘤分割任务,并取得了显著成效[5]。

U-Net[6] 提出以来,基于U-Net架构的方法逐渐成为医学图像分割领域的主流。Çiçek等人进一步扩展了U-Net的二维卷积至三维卷积,提出3D U-Net[7],使模型能够直接处理三维医学数据。DUNet[8]则引入可变形卷积,以扩展编码器的感受野。随着Transformer的兴起,其强大的建模能力在多个领域得到广泛应用。TransUNet[9]通过将Transformer集成至U-Net架构,提升了模型的局部与全局特征提取能力。UNETR[10]进一步创新,采用预训练的视觉Transformer替代传统卷积编码器。Swin UNETR[11]则结合了Swin Transformer与U-Net架构,利用Swin Transformer的滑动窗口策略有效降低了计算成本。

然而,上述模型在处理对MRI图像的多模态信息时,仅仅是通过将MRI图像的不同模态简单地进行通道拼接,未能充分挖掘和融合多模态医学图像的潜在信息,可能导致信息冗余或关键特征的损失。针对这一问题,本文提出了一种基于3D UX-Net模型的改进的脑肿瘤MRI图像分割模型MGF-UX Net,旨在通过多模态分组特征(Multi-modal Grouped Feature,MGF)模块更深入地捕获和整合不同模态的互补特征,缓解多模态信息利用不足所导致的分割精度瓶颈,提升脑肿瘤MRI图像的分割性能。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006839


作者信息:

方云翔1,王路路1,李英娜1,杜井龙2

(1.昆明理工大学 云南省计算机重点实验室, 云南 昆明 650500;

2.重庆医科大学 医学信息学院, 重庆 400016)


官方订阅.jpg

此内容为AET网站原创,未经授权禁止转载。