(1) 我的问题是?
→在二分类研究中,由于两组的数据不平衡,且两组目前的患者比例也不合适,存在其中一组患者偏多的情况,就想要删掉一部分患者,但是不是很清楚应该是先把这批患者进行数据处理,得到最终的模型结果再根据结果的好坏,对可能会对结果不友好的患者进行删除,还是在数据处理前就删掉一部分患者,然后再进行后续的数据处理和建模。被这个问题困扰了好久,本人是个菜鸟小白,以前也没有这方面的经验,对数据处理也不是很了解,有点迷茫😭
(2) 为解决此问题我查阅过哪些资料?
→我查阅了相关的文献,但感觉文献中很少提及这一方面
(3) 我做过哪些尝试解决该问题?
→询问了老师和师长,但大家给的答案不一样😭;目前我是打算两种方法都试试,但是因为对数据处理这方面不是很熟悉,所以尝试的过程肯定会花费不少时间,所以想来问问有经验的小伙伴有没有什么建议
(4) 目前我对该问题的反思和猜测是?
→我目前是觉得应该先删掉一部分患者再进行后续的处理,但我又不知道应该根据什么去选择要删除的患者😭