2025.12.15
这篇文章发表于《Medical Image Analysis》期刊(2026 年第 108 卷),由多所高校及医疗机构学者联合撰写,聚焦低剂量 CT(LDCT)成像的噪声问题。
Title题目
01
NIFA: Low-dose CT imaging via noise intensity field aware networks
NIFA:基于噪声强度场感知网络的低剂量CT成像
文献速递介绍
02
计算机断层扫描(CT)在临床诊断中广泛应用,但辐射暴露带来了癌症风险担忧。低剂量CT(LDCT)旨在降低辐射剂量,同时保持诊断效果,但由于辐射剂量减少,图像信噪比降低,引入了噪声和伪影,影响图像质量和临床应用。传统的去噪方法(如基于投影域和迭代重建方法)依赖特定扫描仪硬件且计算资源需求高,并可能改变噪声纹理。基于图像域的深度学习方法在自然图像去噪中表现良好,但LDCT图像的噪声具有各向向异性和位置依赖性,且噪声的频率分布对诊断价值至关重要。本文提出了一种结合CT成像物理和数据驱动范式的新模型架构和目标函数,将噪声建模为噪声强度场,通过分别处理高低强度信息来去噪,并引入噪声强度场相似性(NIFS)损失函数,以保留梯度信息和噪声模式。
Aastract摘要
03
计算机断层扫描(CT)是临床实践中最广泛使用的成像模式之一。虽然对疾病诊断至关重要,但CT的广泛使用导致了人群辐射剂量的主要部分,引发了公众对潜在癌症风险的担忧。因此,低剂量CT(LDCT)在过去几十年中引起了广泛关注。LDCT通过降低X射线剂量来减少数据采集过程中的健康风险,但它会引入过多的图像噪声和伪影,损害图像质量,从而阻碍其临床应用。为了解决这个问题,研究人员已经探索了使用数据驱动的深度神经网络来改善LDCT图像质量。本文通过利用数据驱动范式和CT成像物理,来应对LDCT挑战,开发出更具临床相关性的预测模型。我们将LDCT图像中的噪声建模为噪声强度场,并将去噪过程视为强度值回归。基于此,提出了一种噪声强度场感知(NIFA)网络,该网络分别提取低强度和高强度信息,以在保留纹理信息和解剖细节的同时降低强度场的幅度。本文进行了广泛的实验,包括消融研究,以证明创新设计的有效性。
Method方法
04
本研究将低剂量CT(LDCT)图像的去噪问题表述为强度值回归。提出的噪声强度场感知(NIFA)网络是一个物理嵌入式架构,专门用于处理低剂量场景下的噪声,通过分别提取高强度和低强度信息,利用其内在特性提高去噪性能。NIFA模型包含三个主要部分:低强度值提取模块、高强度值提取模块和噪声嵌入式图像重建模块。低强度值提取采用扩张卷积来扩大感受野,捕捉全局上下文信息,以减少噪声幅度。高强度值提取通过级联Swin Transformer块实现多尺度特征学习和全局局部上下文处理,并通过残差连接和移位窗口自注意力机制捕获长距离依赖和结构相似性。图像重建模块聚合来自高强度和低强度分支的信息,并进行归一化。在目标函数方面,模型采用复合损失函数,包括噪声强度场相似性(NIFS)损失、Charbonnier损失、感知损失(VGG-based)和结构相似性指数度量(SSIM)损失。NIFS损失通过在傅里叶域优化噪声强度场,确保去噪图像保留真实的噪声纹理,避免噪声功率谱峰向低频区域的偏移。
Discussion讨论
05
本研究表明,所提出的NIFA方法在去噪性能方面显著优于现有基线方法,在AAPM和数值模拟数据集上均表现出色。NIFA方法不仅提供了视觉上更清晰、更令人满意的CT图像,而且在SSIM、PSNR、LFD和VIF等客观指标上也表现优异。特别是,NIFA方法在保留图像细节和噪声纹理方面的能力,预示着其在保持医学影像诊断完整性方面的潜在优势。这些结果强调了高强度和低强度值提取范式以及在目标函数设计中融入NIFS损失的有效性。与传统将图像分解为预定义频率子带并应用手工光谱滤波的频域分解方法不同,NIFA根据Hounsfield单元(HU)分布中编码的物理特性分配网络容量。此外,NIFS损失通过在降低整体噪声幅度的同时,明确保留原始CT图像的噪声功率谱特性,从而超越了传统的频域优化,确保去噪图像保持临床上真实的噪声纹理,适用于临床诊断。然而,本研究也存在局限性。数值模拟数据集无法完全复制真实世界数据的多样性和复杂性,因此未来工作需要更广泛的真实临床数据集进行验证。此外,未来研究可以探索优化网络架构或整合其他高级深度学习技术,以提高模型性能和计算效率,并与临床专家合作评估去噪图像的实际临床应用价值。
Conclusion结论
06
本研究将低剂量CT图像去噪问题表述为强度值回归。开发了NIFA网络架构,该架构结合了低强度值提取和高强度值提取,使神经网络能够根据提取到的高低强度信息检测全局信息。在目标函数中,引入了独特的NIFS损失设计,该设计根据输出图像的噪声强度进行优化,引导神经网络保留噪声强度场模式,从而生成适合常规诊断的临床可用CT图像。通过广泛的实验评估了所提方法的性能。与基线方法的比较分析表明,NIFA方法在定性和定量评估方面均优于基线方法,同时保持了噪声强度场模式和诊断价值。消融研究验证了所设计模块的有效性,尤其强调了NIFS损失的重要影响。未来工作将进一步探索利用傅里叶域信息优化神经网络,以提高低剂量CT图像质量。
Results结果
07
实验在AAPM LDCT数据集和高保真数值模拟LDCT数据集上进行,以验证所提方法的鲁棒性。定性评估显示,NIFA方法在横断面、冠状面和矢状面上均表现出最佳去噪性能,生成最清晰、最令人满意的CT图像。与U-Net和DnCNN等基线方法相比,NIFA方法在感兴趣区域(ROI)内显著减少了伪影、阴影和斑点状噪声,同时保留了病变的形态信息和背景纹理。残差图像分析表明,NIFA方法保留了最少的结构信息,表明其有效保留了空间信息并保持了原始噪声模式。傅里叶域的噪声功率谱分析显示,NIFA方法显著降低了LDCT图像的噪声功率谱幅度,同时保持了噪声谱的模式和频率分布,没有明显的低频偏移。定量评估(如表1和表2所示)进一步证实,NIFA方法在所有六个指标(SSIM、MSE、PSNR、PSNR-B、LFD、VIF)上均优于所有基线方法。消融研究(表3和图6、7)验证了NIFA设计中NIFS损失和扩张卷积的有效性。NIFS损失的缺失导致性能显著下降,尤其在傅里叶域一致性方面,证实了其在保持噪声纹理中的关键作用。
Figure图
08

图1. 我们提出的NIFA网络的流程图。输入的LDCT图像由低强度值提取模块和高强度值提取模块处理。这些模块提取相应的低强度值和高强度值,然后由图像重建模块用于重建图像。同时,LDCT图像和预测图像都被转换为傅里叶域,其各自的噪声强度场(NIF)由NIF模块提取。NIF用于计算噪声强度场相似性,指导神经网络参数的优化。

图2. 呈现了具有相同噪声强度(标准差)但低频分量不同的噪声图像。图像(a)表示标准噪声,而图像(b)包含更多能量分布在低频范围的噪声。

图3. 在AAPM数据集上,我们提出的NIFA方法在三个不同平面上的主观评估。我们提出的方法在每个平面上始终表现出最佳性能。我们方法的残差图像包含最少的结构信息,表明卓越的去噪性能。CT图像和残差图像的显示窗宽:[-300,300] HU。

图4. 在我们的数值模拟数据集上,我们提出的NIFA方法的主观评估,其中低剂量CT图像对应于标准辐射剂量的五分之一。结果显示,我们提出的方法有效地重建了光子计数减少的低质量CT图像,保留了结构信息,同时保持了原始CT图像的噪声纹理特征。CT图像和残差图像的显示窗宽:[-300,300] HU。

图5. 预测图像与原始LDCT图像的噪声功率谱比较。结果显示,我们提出的方法成功降低了噪声强度,同时保留了与原始LDCT图像相同的噪声功率峰。这表明所提出的NIFA网络在显著抑制噪声的同时,保留了对于维持医学影像分析诊断完整性至关重要的内在随机特征。

图6. 在AAPM数据集上,我们提出的各种方法的不同版本的主观评估。结果表明,我们方法的完整版本实现了最佳性能。具体而言,完整版本保留了大部分结构信息,同时提供了卓越的去噪性能。相比之下,NIFA(w/o NIFS)版本由于省略了NIFS损失,显著改变了噪声纹理,可能导致CT图像质量下降。这些发现强调了结合NIFS损失对于保留噪声模式和增强图像质量的重要性。CT图像和残差图像的显示窗宽:[-300,300] HU。

图7. 预测图像与原始LDCT图像的噪声功率谱比较。结果显示,我们方法的完整版本实现了最低的噪声强度水平,同时保留了原始LDCT图像的噪声模式。如残差图像所示,NIFA(w/o NIFS)版本未能阻止噪声模式的改变,进一步强调了结合NIFS损失对于保持原始噪声特征的重要性。