(1) 我的问题是?
→我有150+数据作为本院训练集,2个外院测试集:一个14例外院测试集,另一个55例外院测试集。我在训练集上交叉验证auc结果0.9+,14例外院auc结果0.8+,55例外院auc结果0.5左右。(分类结局变量均匀)我这是过拟合问题还是多中心数据差异的问题?过拟合问题如何解决,多中心数据差异如何解决?(预处理阶段,已经做过了图像标准化)
(2) 为解决此问题我查阅过哪些资料?
→我使用KS检验发现,55例外院数据的特征和训练集特征差别很大。(2500个特征中有2100个具有显著差异)
(3) 我做过哪些尝试解决该问题?
→
(4) 目前我对该问题的反思和猜测是?
→是不是多中心影像差异问题?