您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
箱线图怎么看(箱线图怎么看离散程度)
线图,数据,异常箱线图怎么看(箱线图怎么看离散程度)
发布时间:2016-12-08加入收藏来源:互联网点击:
很多朋友想了解关于箱线图怎么看的一些资料信息,下面是小编整理的与箱线图怎么看相关的内容分享给大家,一起来看看吧。
一、箱线图箱线图(Box-plot)又称盒须图、盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,在数据分析中经常被使用到,可以被用于异常值的检测。
通过箱线图可以很容易找到数据中的异常值。
二、使用python绘制箱线图数据集地址:http://archive.ics.uci.edu/ml/machine-learning-databases/abalone/abalone.data
1、未标准化的箱线图
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltif __name__ == "__main__":data = pd.read_csv("G:/dataset/abalone.csv")#需要绘制箱形图的列,不包括ID列和第一列box_data = np.array(data.ix[:,2:10])#绘制箱线图plt.boxplot(box_data)plt.xlabel("特征索引")plt.ylabel("四分位间距")plt.show()matplotlib的boxplot默认的上边缘到上四分位数的间距是1.5IQR,可以通过whis参数进行调节,超过了上边缘Q3+1.5IQR和下边缘Q1-1.5IQR的部分视为异常值也就是图中的圆圈所表示的点。通过上面的箱线图可以发现,由于第8个属的取值区间比较广,导致其他属的箱线图被压缩。
2、标准化的箱线图
通过将数据进行标准化,可以解决箱线图被压缩的问题。
#对数据进行标准化box_data = (box_data - np.mean(box_data,axis=0)) / np.std(box_data,axis=0)plt.boxplot(box_data)标准化后的数据均值为0,方差为1。标准化之后可以清楚的看到,每个特征的异常值分布情况。
本文到此结束,希望对大家有所帮助呢。
上一篇:人格独立(公司人格独立)
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |