俄罗斯数学家切比雪夫在用标准差来度量离差的情况下,提出并证明了以下不等式。

切比雪夫不等式:对有限方差的任何变量,算数均值的k个标准差内,观测值的数量比例最少是1-1/k^2。其中k大于1。

多元一次函数实证分析(切比雪夫不等式与变异系数)(1)

例如当k=1.25,根据不等式,位于正负1.25个标准差内的观测值占总体观测值的比例不低于36%。最常用的是,围绕均值的两个标准差区间内至少包含75%的观测值。三个标准差区间内至少包含89%的观测值。以上并不用考虑观测值是如何分布的。

切比雪夫不等式重要性来自于他的普适性,不等式不管分布形状如何,不管是对样本还是总体,不管是连续还是离散都成立。当然,如果我们知道分布的具体情况,例如是正态分布,那么得到的区间可能会更精确。

多元一次函数实证分析(切比雪夫不等式与变异系数)(2)

我们注意到标准方差相比方差更容易解释,因为标准方差使用与观测值相同的测量单位。在不同数据集之间解释相对变异程度时,有时候我们可能很难解释标准差意味着什么,这是因为数据集之间均值可能有很大的不同,也有可能数据集之间的测量单位不同。在这部分,我们引入一种相对偏离程度的测量方法,变异系数,这种方法在以上问题中会发挥很大作用。相对偏离程度是相对一个参考值或基准的偏离程度值。

我们可以设计一个例子,第一个样本全部是小公司的年生产规模,分别是50万、75万、65万、90万。第二个样本全部是大公司的年生产规模,分别是800万、825万、815万、840万。我们可以计算,这两个样本的标准方差都是16.8万。在第一个样本中最大观测值比最小观测值大90%,第二个只大5%。通常以上数据署名,标准方差16.8万表示,第一个样本中,相对均值70万有16.8万的变异程度,第二样本中,相对均值820万有168万的变异程度,显然第一个样本的风险比第二个样本的风险更高。变异系数在描述上面两个样本风险大小时会很有用。

多元一次函数实证分析(切比雪夫不等式与变异系数)(3)

变异系数的定义:变异系数是观测集合的标准差于均值的比值。

当观测值是回报率,变异系数测量每单位均值的风险(标准方差)值。变异系数的

含义在投资上还可以演变为夏普比率,夏普比率测量证券在单位方差下的风险回报溢价。

,