(1) 我的问题是? →经过T检验后还有40个特征,但是经过lasso之后只有4个了,多次尝试之后,最终余下的特征在4到10之间,很少超过10。我的疑问是:
(2) 为解决此问题我查阅过哪些资料? →
(3) 我做过哪些尝试解决该问题? →
(4) 目前我对该问题的反思和猜测是? →
我遇到的问题刚好相反 我是单因素分析后 数据标准化 再经过lasso 最后提取的特征是18个左右,之后建立模型 训练组AUC高 验证组AUC低
考虑是过拟合了 参数选择最好的参数
想问下 后面该如何做才能解决这个问题