简单介绍一下箱形图,以及面对一个箱形图,你可以作哪些分析?

箱形图介绍

箱形图又称“盒图”、“箱线图”,主要用于比较不同组/类别的数据分布情况!下面给出某一组的箱形图如下:

  • 中间那箱子的“上四分位数(Q3)”、“中位数(Q2)”、“下四分位数(Q1)”就是把该组所有数据均分成4份,这三个数据就是切的“三刀”!
  • “上限值”与“下限值”就是除了“异常值”外的所有数据中的“最大/小值”!
  • “异常值”是这样定义的:上限是Q3+1.5×IQR,下限是Q1−1.5×IQR,剩下不属于上下限之间的就是异常值!
    | 名称 | 含义 |
    | -------- | -------- |
    | Q1 | 数据中25%位置的数值(即第25百分位数)。 |
    | Q3 | 数据中75%位置的数值(即第75百分位数)。 |
    | IQR | IQR = Q3 - Q1,反映中间50%数据的分布范围。 |
  • 中间那个与“异常值”一个类型的点是所有数据的“平均值”!

箱形图分析

以各班的高考总成绩为例:班级有A、B、C三个班,Y轴为各班的高考成绩!

  1. 看中位数 ,可以得出”各班整体成绩排行“。
  2. IQR对比(箱子的高矮),可以得出”各班成绩的稳定情况,越矮越稳定(鲁棒性的强弱)“。
    ……