2025.12.16
这篇文章发表于《Medical Image Analysis》期刊(2026 年第 108 卷),由燕山大学、中山大学、北京理工大学等机构学者联合撰写,聚焦低剂量 CT(LDCT)的金属伪影去除与去噪问题。
Title题目
01
Prompt guiding multi-scale adaptive sparse representation-driven network for low-dose CT MAR
低剂量CT金属伪影去除的提示引导多尺度自适应稀疏表示驱动网络
文献速递介绍
02
X射线计算机断层扫描(CT)在医学诊断中广泛应用,但X射线辐射可能增加患者癌症风险,尤其当累积暴露量超过阈值时。为降低辐射,低剂量CT(LDCT)被广泛使用,但这会导致投射数据被泊松噪声污染,进而影响重建图像质量。当患者体内存在金属植入物时,LDCT图像质量会因金属伪影进一步降低。因此,如何同时实现LDCT去噪和金属伪影去除(LDMAR)是一个重要挑战。现有基于深度学习的LDCT去噪或全剂量CT金属伪影去除方法主要分为投射域、图像域和双域三类,但直接应用于LDMAR任务效果不佳。此外,这些方法通常为每个特定设置训练一个模型,导致多剂量水平下的存储成本高昂且模型缺乏适应性。为解决这些瓶颈,本文提出了一种提示引导多尺度自适应稀疏表示驱动网络PMSRNet,并将其集成到双域框架中,构建了模型可解释的PDuMSRNet,旨在通过单一模型适应多种剂量。
Aastract摘要
02
低剂量CT能够减少X射线辐射暴露,但会降低图像质量,并在存在金属植入物的情况下产生金属伪影。现有的深度学习方法在同时进行低剂量CT重建和金属伪影去除(LDMAR)时面临两个主要限制:网络设计忽略多尺度和尺度内信息,以及为不同剂量训练独立模型需要大量存储空间。为解决这些问题,本文提出了一种名为PMSRNet的提示引导多尺度自适应稀疏表示驱动网络。PMSRNet通过精心设计的提示引导尺度自适应阈值生成器(PSATG)和多尺度系数融合模块(MSFuM),同时利用尺度内特征和跨尺度互补性。PSATG能够自适应捕获局部、区域和全局层面的多重上下文信息,以生成更准确的阈值。此外,本文还提出了一个模型可解释的双域LDMAR框架——PDuMSRNet,并采用提示引导策略训练单一模型以适应多种剂量水平。实验证明,所提出的方法在多种剂量水平下均优于现有LDMAR方法。
Method方法
03
本文提出了一个模型可解释的双域LDMAR网络PDuMSRNet。首先,通过优化模型将LDMAR问题表述为结合数据保真项和稀疏正则化项的优化问题。该优化问题通过交替求解正弦图域变量和图像域变量来解决,并利用近端梯度方法将迭代算法展开为深度神经网络。PDuMSRNet由T个阶段组成,每个阶段包含一个用于正弦图域处理的s-Net(由残差块组成)和一个用于图像域重建的x-Net(即PMSRNet)。PMSRNet是一个提示引导多尺度自适应稀疏表示驱动网络,它采用可学习的稀疏化框架进行去噪,并扩展到多尺度版本以增强表示能力。PMSRNet的核心组件包括:多尺度稀疏化框架,用于不同尺度的特征提取;提示引导尺度自适应阈值生成器(PSATG),通过融合局部、区域和全局信息以及结合剂量图、金属掩模和输入实例等提示信息,生成空间自适应的阈值;多尺度系数融合模块(MSFuM),基于交叉注意力机制融合高分辨率和低分辨率特征,以充分利用跨尺度互补性。这种模型驱动的架构确保了固有的可解释性,并允许单一模型适应不同的CT剂量设置。
Discussion讨论
04
本研究进一步讨论了所提出PDuMSRNet的存储需求、临床验证和对下游分割任务的影响。在存储效率方面,PDuMSRNet采用单一模型适应多剂量水平,其存储成本显著低于为每个剂量水平单独训练的DuMSRNet模型(约为后者的三分之一),展现出更高的存储效率和灵活性。尽管存储成本略高于BDuMSRNet,但PDuMSRNet的重建质量更优,这得益于其提示引导模块。在临床验证方面,模型在CTPelvic1K临床数据集上进行了评估,结果表明,尽管在模拟数据集上训练,PDuMSRNet在临床数据上也能有效减少金属伪影和噪声,并保留关键边缘信息,优于其他主流方法。特别是,PDuMSRNet在金属伪影附近组织细节的恢复上表现出色,而其他方法常出现失真或过平滑。对于下游分割任务,将PDuMSRNet的重建结果输入到Segment Anything Model (SAM) 中,与原始LDCT图像相比,重建结果能分割出更多清晰可辨的解剖结构,验证了该方法在促进诊断分析和治疗规划等关键下游应用中的有效性。
Conclusion结论
05
本文提出了一种模型可解释的提示引导多尺度自适应稀疏表示驱动网络PMSRNet,并在此基础上构建了增强的双域网络PDuMSRNet,用于同时进行低剂量CT重建和金属伪影去除(LDMAR)。PMSRNet由多尺度稀疏化框架、PSATG和MSFuM三个核心组件构成,能够同时利用尺度内特征和跨尺度互补性。PSATG能够从局部、区域和全局层面提取特征,捕获多重上下文信息,而MSFuM则融合了高分辨率特征的细节信息和低分辨率特征的上下文信息。大量的实验结果表明,所提出的DuMSRNet始终优于现有先进方法,并且PDuMSRNet在实现更高重建质量的同时,降低了模型存储成本并提供了更大的灵活性。然而,当前方法在临床数据集上仍存在模糊问题,这主要是由于模型泛化能力不足以及模拟训练数据与临床测试数据之间固有的领域差距。未来的工作将涉及使用真实世界的临床数据集来训练模型,以进一步提升重建性能。
Results结果
06
本文采用混合双域损失函数进行模型训练,并通过峰值信噪比(PSNR)、结构相似性指数(SSIM)和均方根误差(RMSE)评估重建结果。实验在DeepLesion数据集上进行模拟,并在CTPelvic1K临床数据集上进行验证。DuMSRNet在½、¼和⅛剂量水平以及不同金属尺寸下均表现出优于现有LDCT去噪和多任务学习方法的性能。双域框架(如InDuDoNet和DuMSRNet)比单域方法获得更高的PSNR值,强调了利用正弦图和图像域知识的优势。定性比较显示,DuMSRNet能更有效地抑制噪声和金属伪影,同时保留关键组织结构,这归因于其多尺度自适应稀疏表示框架和提示引导模块对尺度内特征、跨尺度互补性和金属植入物先验的建模能力。然而,在处理大型金属植入物时,网络偶尔会将大量条纹伪影与真实解剖组织混淆。消融实验证实了双域学习、尺度自适应阈值生成器(PSATG)以及提示引导策略和多尺度系数融合模块(MSFuM)的有效性,它们对模型性能的提升至关重要。
Figure图
07

图1.PDuMSRNet的概述。该架构是从求解LDMAR任务的优化迭代中展开的,包含T个阶段,对应T个迭代步骤。具体来说,正弦图域变量s(t+1)和图像域变量x(t+1)在(t+1)阶段交替更新,其中s-Net用于正弦图域处理,PMSRNet用于图像域重建。s-Net架构包含正弦图域中的三个残差块,而PMSRNet是图像域中提出的提示引导多尺度自适应稀疏表示驱动网络。这种设计明确遵循公式(9)和公式(14)中导出的更新规则,确保了模型驱动的深度学习框架。

图2.提示引导多尺度自适应稀疏表示驱动网络PMSRNet(顶部)、提示引导尺度自适应阈值生成器PSATG(中部)和多尺度系数融合模块MSFuM(底部)的概述。PMSRNet包含三个组件:多尺度稀疏化框架、PSATG和MSFuM。PSATG旨在利用提示信息先验生成忠实阈值,包含五个部分:1)浅层特征提取模块依靠卷积层;2)深层特征提取模块通过并行化卷积神经网络、窗口注意力和锚定条纹注意力在局部、区域和全局层面建模图像;3)特征选择模块利用通道注意力机制自适应地重新加权来自不同特征提取模块的信息;4)阈值生成模块通过利用来自特征选择模块的信息生成忠实阈值来增强PMSRNet的性能;5)提示引导模块利用提示信息,包括带有金属植入物的LDCT图像、金属掩模和剂量图,来引导阈值生成过程。MSFuM用于融合多尺度表示,主要包含一个交叉注意力和一个前馈网络,以有效整合不同分辨率的特征。在结构上,PMSRNet采用四尺度架构。在每个尺度上,处理流程包括可学习稀疏化框架的稀疏编码过程、带有提示信息先验的阈值处理过程以及可学习稀疏化框架的图像生成过程,它们按顺序工作以最终生成重建图像。

图3.在½剂量水平下,不同方法对带有金属植入物的LDCT图像的视觉评估。放大绿色屏幕可增强图像观看体验。PSNR和SSIM值在各自方法重建的整个图像上计算。金属植入物以红色掩模突出显示。蓝色箭头表示重建的结构信息。显示窗口为[-1000, 1000] HU。

图4.在¼剂量水平下,不同方法对带有金属植入物的LDCT图像的视觉评估。放大绿色屏幕可增强图像观看体验。PSNR和SSIM值在各自方法重建的整个图像上计算。金属植入物以红色掩模突出显示。蓝色箭头表示重建的结构信息。显示窗口为[-1000, 1000] HU。

图5.在¼剂量水平下,BDuMSRNet和PDuMSRNet在LDCT图像上的视觉评估和重建误差大小。放大绿色屏幕可增强图像观看体验。PSNR和SSIM值在各自方法重建的整个图像上计算。金属植入物以红色掩模突出显示。

图6.不同方法在带有金属植入物的临床数据集上的视觉评估。放大细节显示在绿色框中。显示窗口为[-175, 275] HU。蓝色箭头表示关键区域,例如金属伪影附近的组织,突出了所有方法在重建质量上的差异。

图7.LDCT图像和我们提出方法的SAM分割结果。不同颜色代表不同的分割区域。蓝色箭头表示关键区域,例如金属植入物和伪影附近的组织,突出了分割质量的差异。