什么情况用均值作为代表,什么情况用中位数作为代表好呢
什么情况下用均值作为位置状况的代表,什么情况下用中位数作为位置状况的代表好呢?
一个对称分布,均值与中位数相差不大,用哪个都无所谓,都可以代表整体状况,比如,下面这种对称分布:
但是,如果一个分布状况偏斜的很严重,该如何选择呢?
事实上,由于偏斜严重,平均值将受到尾部数据的强烈影响,因此,均值的代表性会比较差,这个时候用中位数更有代表性,比如下图:
比如,我们经常被平均的工资;比如,我们经常被平均的住房面积......太多太多的惨痛教训,让别人误以为我们的收入很高,住房面积有多大,岂不知......
那么,怎么判断分布状况是否严重偏斜呢?
个人觉得用直方图就行了,简单粗暴,而且视觉冲击强烈。
暂无评论