箱体图Boxplot及Python绘制方
短信预约 -IT技能 免费直播动态提醒
箱体图Boxplot是一种表示数据分布的方法(wiki:boxplot),一个基本的箱体图从上到下分别表示最大值,上四分位,均值,下四分位,最小值。有的箱体图中还会加入异常值等。
箱体图有以下几个优点:
1. 可以直观明了地识别数据中的异常值
2. 利用箱体图可以判断数据的偏态和尾重
3. 利用箱体图可以比较不同批次的数据形状
2.1 环境介绍
系统环境:mac
编程环境:pycharm
所需要的包:numpy,matplotlib,pandas
2.2 安装pandas
sudo pip install pandas
2.3 Python绘制箱体图
# -*- coding:utf-8 -*-
"""
绘制箱体图
Created on 2017.09.04 by ForestNeo
"""
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
"""
generate data from min to max
"""
def list_generator(number, min, max):
dataList = list()
for i in range(1, number):
dataList.append(np.random.randint(min, max))
return dataList
#generate 4 lists to draw
list1 = list_generator(100, 20, 80)
list2 = list_generator(100, 20, 50)
list3 = list_generator(100, 50, 100)
list4 = list_generator(100, 5, 60)
data = pd.DataFrame({
"dataSet1":list1,
"dataSet2":list2,
"dataSet3":list3,
"dataSet4":list4,
})
#draw
data.boxplot()
plt.ylabel("ylabel")
plt.xlabel("different datasets")
plt.show()
2.4 结果展示
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341