17 天前

UNeXt:基于MLP的快速医学图像分割网络

Jeya Maria Jose Valanarasu, Vishal M. Patel
UNeXt:基于MLP的快速医学图像分割网络
摘要

近年来,UNet及其最新扩展模型(如TransUNet)已成为医学图像分割领域的主流方法。然而,由于这些网络参数量庞大、计算复杂度高且推理速度较慢,难以在床旁(point-of-care)等对实时性要求较高的应用场景中有效部署。为此,我们提出了一种新型网络结构——UNeXt,该模型基于卷积型多层感知机(Convolutional Multilayer Perceptron, MLP),专为高效图像分割设计。UNeXt采用一种高效的网络架构,包含早期的卷积阶段与潜在空间中的MLP阶段。我们提出了一种分 token 的MLP模块(tokenized MLP block),通过高效地对卷积特征进行分块(tokenization)与投影,并利用MLP建模特征表示。为进一步提升性能,我们在将输入送入MLP前引入通道移位机制(channel shifting),以增强模型对局部依赖关系的学习能力。在潜在空间中使用分 token 的MLP结构,不仅显著减少了模型参数量和计算复杂度,同时还能生成更具判别性的特征表示,从而提升分割精度。此外,UNeXt在网络中引入了编码器与解码器之间多层级的跳跃连接(skip connections),以保留更丰富的空间信息。我们在多个医学图像分割数据集上对UNeXt进行了全面评估,实验结果表明:相较于当前最先进的医学图像分割架构,UNeXt实现了参数量减少72倍、计算复杂度降低68倍,并推理速度提升10倍,同时在分割性能上仍优于现有方法。代码已开源,可访问:https://github.com/jeya-maria-jose/UNeXt-pytorch