简单介绍一下箱形图,以及面对一个箱形图,你可以作哪些分析?

文章完善进度100%

需求&方法1

简单介绍一下箱形图?

笔记

箱形图又称“盒图”、“箱线图”,主要用于比较不同组/类别的数据分布情况!下面给出某一组的箱形图如下:

• 中间那箱子的“上四分位数(Q3)”、“中位数(Q2)”、“下四分位数(Q1)”就是把该组所有数据均分成4份,这三个数据就是切的“三刀”!
• “上限值”与“下限值”就是除了“异常值”外的所有数据中的“最大/小值”!
• “异常值”是这样定义的:上限是Q3+1.5×IQR,下限是Q1−1.5×IQR,剩下不属于上下限之间的就是异常值!

名称含义
Q1数据中25%位置的数值(即第25百分位数)。
Q3数据中75%位置的数值(即第75百分位数)。
IQRIQR = Q3 - Q1,反映中间50%数据的分布范围。

• 中间那个与“异常值”一个类型的点是所有数据的“平均值”!

需求&方法2

对于一个箱形图,你如何进行分析?

笔记

以各班的高考总成绩为例:班级有A、B、C三个班,Y轴为各班的高考成绩!

• 看中位数 ,可以得出”各班整体成绩排行“。
• IQR对比(箱子的高矮),可以得出”各班成绩的稳定情况,越矮越稳定(鲁棒性的强弱)“。
……