多超声系统下甲状腺结节的定量成像文献速递/多模态医学影像最新进展

Oldlee

2026.6.17

本文提出QIT-net，在多种超声系统中从RF信号和B-mode图像重建甲状腺结节的衰减与声速定量图。

Title题目

多超声系统下甲状腺结节的定量成像

Quantification of thyroid nodules in multiple ultrasonography systems

文献速递介绍

论文首先指出，传统B-mode超声虽然实时、廉价且无辐射，但主要呈现病灶形态和回声等定性信息，诊断结果容易受操作者经验影响。定量超声QUS试图从脉冲回波信号中恢复组织的物理声学参数，例如声学衰减和声速，从而为病灶评估提供更客观的指标。近年来深度神经网络已被用于求解QUS的非线性逆问题，但许多方法依赖平面波发射，而临床常规系统更多使用单线发射SLT；此外，不同超声设备的中心频率、探头间距、焦深、波束形成和图像后处理都会导致RF信号和B-mode图像分布明显不同。作者因此提出QIT-net，目标是在研究级设备和商用设备之间实现可迁移的甲状腺结节定量成像，并通过B-mode结构引导、跨系统参数共享和设备特异性微调来缓解域差异。

Aastract摘要

本文面向甲状腺结节评估中的定量超声成像问题，提出QIT-net，用于在不同超声设备和采集条件下估计组织声学衰减系数和声速。方法采用CNN-Transformer混合架构，从RF回波中同时提取局部细节与跨扫线全局上下文，并引入B-mode形态编码器为定量图重建提供结构先验。针对不同设备B-mode图像在纹理、对比度和噪声上的域差异，作者设计了参数共享、多系统联合训练以及按设备微调的策略。数值仿真、离体仿体和91例临床甲状腺结节测试表明，该方法在重建精度和结构一致性上优于多种基线模型，联合ATT和SOS指标区分良恶性结节的AUC达到0.943。

Method方法

方法部分首先构建了两类仿真训练体模。第一类为通用软组织体模，由随机椭圆组织区域和散斑组成，用于覆盖较宽的衰减、声速和密度分布；第二类为甲状腺仿真体模，基于Visible Human Project的颈部横断面手工分割甲状腺、气管、软骨、血管、肌肉和脂肪等结构，并随机插入来自DDTI数据集的结节掩膜，使训练数据更符合颈部解剖特征。仿真采用k-wave工具箱，分别模拟5 MHz、0.30 mm阵元间距、30 mm焦深的环境I，以及10 MHz、0.20 mm阵元间距、20 mm焦深的环境II，二者均使用单线发射，并采用¼扫线下采样以降低仿真成本。QIT-net由四个主要模块组成：卷积RF模式编码器、层级Transformer上下文编码器、B-mode形态编码器和定量图像合成器。卷积编码器利用SLT扫线间发射模式一致的特点提取局部回波模式，Transformer通过空间降采样注意力建模跨扫线长程依赖，B-mode形态编码器从DAS重建的B-mode图像中提取多尺度结构先验，定量图像合成器则通过SPADE模块把RF声学特征和B-mode形态特征融合，输出ATT图、SOS图和中值滤波后的B-mode结构图。训练时，作者对RF信号进行发射延迟校正、ROI截取、TGC补偿、有符号动态范围压缩和归一化，并使用扫线增强随机抽取扫线子集来扩大训练样本。模型先在两个环境的融合数据上联合训练以学习共享物理规律，再针对特定环境和特定设备B-mode风格进行小学习率微调，从而提高跨设备部署的稳定性。

实验

实验首先在1500个仿真测试样本上用PSNR、MAE和SSIM评估重建质量。有效感受野分析显示，纯CNN模型更偏局部且感受区域有限，纯Transformer能捕捉更广的扫线相关性但缺乏RF局部模式建模能力，而CNN-Transformer混合结构兼顾局部回波细节和全局上下文。架构消融实验表明，HR-Net式多分辨率合成器提升了QUS重建质量，引入Transformer后平均PSNR和SSIM进一步提高；纯Transformer表现较差，说明卷积层对RF局部特征仍不可替代。最终的Hybrid + B-mode + SPADE方案在Dataset I和Dataset II上均取得最佳或接近最佳结果，例如ATT的PSNR分别为26.06 dB和26.80 dB，SOS的PSNR分别为23.78 dB和24.22 dB，说明B-mode形态先验和SPADE空间调制有助于提高结构一致性。随后作者比较训练策略，发现两个系统数据融合训练优于分别训练，尤其对Transformer混合模型提升更明显；在融合模型基础上按环境微调后，10 MHz环境下ATT和SOS的PSNR进一步达到27.35 dB和24.70 dB。离体甲状腺仿体实验显示，仅依赖RF信号的重建结构不准确、病灶与背景对比度低；加入目标设备B-mode图像可改善轮廓，但若不做风格适配会出现背景噪声和不稳定；使用5000张目标设备B-mode图像微调后，QIT-net能够产生更清晰、更稳定、病灶分离度更高的定量图。临床测试纳入91名经细针穿刺确认的受试者，其中良性66例、恶性25例，分别由研究级Verasonics Vantage 64和商用Alpinion X-Cube 90采集。结果显示，恶性结节的ATT和SOS整体高于良性结节，单独使用ATT的AUC为0.933，单独使用SOS的AUC为0.785，将归一化ATT和SOS相加作为联合指标后AUC提高到0.943，显示出较强的良恶性鉴别潜力。

Conclusion结论

论文总结认为，QIT-net证明了在常规单线发射超声系统中进行甲状腺结节定量成像的可行性。其核心优势来自CNN对RF局部模式的提取、Transformer对跨扫线全局依赖的建模、B-mode形态信息对复杂颈部解剖结构的约束，以及跨系统参数共享和设备特异性微调带来的迁移能力。作者强调，B-mode图像虽然能提供关键结构信息，但不同设备的B-mode风格差异会造成重建不稳定，因此针对目标设备的B-mode适配是临床部署的关键步骤。研究也承认当前临床验证依赖每个结节10次重复采集取平均，这会影响实际工作流效率；未来还需要发展更通用的RF编码器和域适应技术，以减少面对新探头、新频率响应和新波束形成配置时的重新训练需求。

Figure图

图1.该图比较了仿真DAS、研究级设备和商用设备生成的B-mode图像。可以看到三者在纹理、对比度、噪声和组织边界表现上差异明显，这正是QUS模型跨设备泛化困难的重要来源，也直接支持了本文提出B-mode设备特异性微调策略的必要性。