在上一篇文章中,我讨论了异常值的理论概念,并试图回答一个问题:“什么时候应该删除异常值,什么时候应该保留它们?”在本文中,我将重点介绍异常值检测及其不同的处理方法。对于数据科学家来说,在训练机器学习算法进行预测建模之前,找到异常值并将其从数据集中移除是特征工程的重要部分。分类或回归数据集中的异常值可