挑战3:寻找异常值
说明
在前面的实验中我们学习过四分位数。四分位数,是指将一组数据值按大小排序后分成四等分,每一部分包含 1/4 的数据,这种划分的分割点就是四分位数。其中第1部分和第2部分的分割点称为第1分位数 $Q_1$, 也被称为第25百分位数(上四分位),第3部分和第4部分的分割点称为第3四分位数 $Q_3$,也被称为第75百分位数(下四分位)。而第二部分和第三部分的分割点是第2四分数,也就是中位数。其中四分位距 $IQR$ 是指第三四分位数和第一分四分位数的差,也就是 $IQR = Q_3 - Q_1$ 所有小于 $Q_1 - 1.5IQR$ 或 大于 $Q_3 + 1.5IQR$ 的数据项被称为异常值。
在本挑战中,你需要在 ~/Code/outlier.py Python 文件中编写一个查找上文中定义的异常值的函数 find_outerlier,find_outlier 函数接受一个列表参数,代表数据序列。函数将查找列表中的所有异常值,并将所有异常值作为列表返回。
示例代码:
# -- coding:utf-8 --
def find_outlier(data):
outlier = []
# 完成剩余代码
return outlier
要求
- 函数名必须是 find_outlier ;
- 代码必须写入 ~/Code/outlier.py 文件中;
- 如果没有找到任何异常值,则返回空列表;