变异程度的度量如全距,四分位间距,方差,标准差以及相关系数之间有什么差异?各有什么优缺点?

1个回答

  • 变异程度一般用间距或者方差来描述.

    boxplot 箱线图就是显示全距(最大值-最小值)和

    四分位间距(把数组分为最小值点,上四分位点,中位数,下四分位点和最大值点) 每两个之间就是四分位间距 .

    优点:直观,各组线段是各包括了25%的数据,因此,线段长度实际反映了数据的密度.

    你随机输入任意的一组超过30个的数据,做一个箱线图,就会发现,那个箱体不会是总是均匀的.

    缺点:没有把样本容量考虑进去

    方差标准差是一回事儿,只不过标准差和均值的单位是一样的,所以大家偏向于用标准差.

    标准差把样本容量和离散程度结合考虑,给出变异程度.

    优点:类似一个综合指标,大体上结合样本容量告诉你的变异程度.适合初步筛选用

    缺点:方差相同的两组数,可以相差十万八千里,所以要了解细致的东西必须得画boxplot