目前,尽管许多研究倾向于固定的bin数而非固定的bin宽度,但并没有硬性证据表明在所有情况下固定的bin宽度或固定的bin数更优。因此,PyRadiomics实现了设置固定的bin数(binCount)和固定的bin宽度(binWidth,默认值)两种选项。
之所以选择固定的bin宽度作为默认参数,部分原因在于PET研究表明,采用固定的bin宽度能更好地保证特征的可重复性[1]。此外,以下示例最能说明我们的理由:假设有两幅图像和两个ROI,第一幅图像的灰度值范围为{0-100},第二幅图像的灰度值范围为{0-10}。如果您使用固定的bin数,则1(离散化)灰度值差异的“意义”是不同的(在第一个ROI中,它表示10个灰度值的差异,在第二个ROI中只是1)。这意味着您所看到的基于纹理的对比度有很大不同。
这个例子假设两个图像的原始灰度值意义相同,在灰度值明确/绝对的图像(如CT的HU值、PET成像中的SUV值)中,这是成立的。但是,在任意/相对灰度值的图像中(例如MR中的信号强度),这不一定成立。在后一种情况下,我们仍然建议采用固定的bin宽度,但要进行额外的预处理(例如归一化),以确保更好的灰度值可比性。在这种情况下,使用固定的bin数也是可能的,但计算出的特征仍可能受到图像中灰度值范围的影响,以及由于原始灰度值不太可比而产生的噪声。此外,无论采用什么类型的灰度值离散化方法,都必须采取措施确保良好的可比性,因为一阶特征主要使用原始灰度值(无离散化)。
最后,有一个关于每个bin宽度该选择多少的问题。目前文献中并没有具体的指导建议,而我们尝试选择一个bin宽度,以便最终的bin数量在30到130之间,这在文献中针对固定的bin数显示了很好的可重复性和性能[2]。这允许ROI中强度的不同范围,同时仍然保持纹理特征的信息性(和病变之间的可比性)。