判断离群值是否应该舍弃 剔除离群值的目的是什么


判断离群值是否应该舍弃 剔除离群值的目的是什么

文章插图
【判断离群值是否应该舍弃 剔除离群值的目的是什么】剔除离群值的目的是更真实地反应数值 。离群值,也称逸出值,是指在数据中有一个或多个数值与其他数值相比差异较大 。chanwennt准则规定,如果某个数值偏离观测平均值的概率小于等于1/(2n),n为观察例数,则该数据应当舍弃 。当出现离群值的时候,要慎重处理,要将专业知识和统计学方法结合起来,首先应认真检查原始数据,看能否从专业上加以合理的解释,如数据存在逻辑错误而原始记录又确实如此,又无法在找到该观察对象进行核实,则只能将该观测值删除 。