前几天折腾了半年多的第一篇影像组学文章终于修回了,审稿人最主要的问题是相对总样本量我保留的特征数较多(比10:1低)。我初步的想法是先做一些能反映出是否过拟合的图,如果看上去过拟合的问题不明显,那么我就可以借此回答审稿人的问题,而不用重新整理数据。 这是我根据使用的分类器做出的模型得分-样本量的学习曲线图 (用的是sklearn包) 我看着感觉在样本量提高后训练和验证集的得分差距在0.1左右,我要用这张图说明没有明显的过拟合是否充分呢?
hfsg 独立验证集和训练集结果相近一般不会过拟合