今天看了李老师B站上的一节课“用随机森林的方法聊聊爱情&t检验+lasso+随机森林走通影像组学的路”,我理解里面的代码是现在所有数据上进行特征筛选,做分类器的时候才拆分数据集。这样做选的特征肯定在训练和测试集上都是表现的很好呀?为啥不能是在特征筛选前一步就进行数据集的划分呀?
XPMeng 你说的对,是应是训练集上筛选。我只是为了演示之便,没有进行数据集划分。