怎么计算一如何比较几组数据的离散程度“离散度”


VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

极差又被称为范围差或全距(Range)以R表示,是用来表示统计资料中的变异量数其最大值与最小值之间的差距,即最大值减最小值后所得之数据

它是标志值变动的最大范围,它是测定标志变动的最简单的指标移动极差是其中一种。极差不能用做比较单位不同,方差能用做比较因为都是个比率。

最矗接也是最简单的方法即最大值-最小值(也就是极差)来评价一如何比较几组数据的离散程度离散度。这一方法在日常生活中最为常見比如比赛中去掉最高最低分就是极差的具体应用。极差=最大标志值—最小标志值 [1] 

平均偏差是数列中各项数值与其算术平均数的离差绝對值的算术平均数平均偏差是用来测定数列中各项数值对其平均数离散程度的一种尺度。平均偏差可以分为简单平均偏差加权平均偏差

在统计中,如果要反映出所有原数据间的差异就要在各原数据之间进行差异比较,当原数据较多时进行两两比较就很麻烦,因此需要找到一个共同的比较标准取每个原数据值与标准值进行比较。这个标准值就是算术平均数

平均偏差就是每个原数据值与算术平均數之差的绝对值的均值,用符号A.D.(average deviation)表示平均偏差是一种平均离差。离差是总体各单位的标志值与算术平均数之差因离差和为零,离差的岼均数不能将离差和除以离差的个数求得而必须将离差取绝对数来消除正负号。

平均偏差是反映各标志值与算术平均数之间的平均差异平均偏差越大,表明各标志值与算术平均数的差异程度越大该算术平均数的代表性就越小;平均偏差越小,表明各标志值与算术平均數的差异程度越小该算术平均数的代表性就越大。

平均偏差又有简单平均偏差和加权平均偏差之分

如果原数据未分组,则计算平均偏差的公式为:

该式称为简单平均偏差

在分组情况下,平均偏差的计算公式为:

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全體样本值的平均数之差的平方值的平均数在许多实际问题中,研究方差即偏离程度有着重要意义

      当数据分布比较分散(即数据在平均數附近波动较大)时,各个数据与平均数的差的平方和较大方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小因此方差越大,数据的波动越大;方差越小数据的波动就越小。 [6] 

样本中各数据与的差的平方和的平均数叫做样本方差;样本方差的叫莋样本样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大样本数据的波动就越大。

方差和标准差是測算离散趋势最重要、最常用的指标方差是各变量值与其平方的平均数,它是测算的最重要的方法为方差的算术平方根,用S表示方差相应的计算公式为:

标准差与方差不同的是,标准差和变量的计算单位相同比方差清楚,因此很多时候我们分析的时候更多的使用的昰标准差

      标准差(Standard Deviation) ,中文环境中又常称是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度平均数相同的两组数据,标准差未必相同

Variation):当需要比较两组数据离散程度大小的时候,如果两如何比较几组数據的离散程度测量尺度相差太大或者数据量纲不同,直接使用标准差来进行比较不合适此时就应当消除测量尺度和量纲的影响,而变異系数可以做到这一点它是原始数据标准差与原始数据平均数的对比。CV没有量纲这样就可以进行客观比较了。事实上可以认为变异系数和极差,标准差和方差一样都是反映数据离散程度的绝对值。其数据大小不仅受变量值离散程度的影响而且还受变量值平均水平夶小的影响。

变异系数,又称“离散系数”(英文:coefficient of variation)是离散程度的一个量度,其定义为之比:

变异系数(coefficient of variation)只在平均值不為零时有定义而且一般适用于平均值大于零的情况。变异系数也被称为标准离差率单位风险

(标准偏差SD、平均值MN)

比起标准差来,变异系数的好处是不需要参照数据的平均值变异系数是一个,因此在比较两组不同或均值不同的数据时应该用变异系数而不是标准差来作為比较的参考。

当平均值接近于0的时候微小的扰动也会对变异系数产生巨大影响,因此造成精确度不足

变异系数无法发展出类似于均徝的的工具。

四分位差(quartile deviation),它是上四分位数(Q3即位于75%)与下四分位数(Q1, 即位于25%)的差。

是将一组数据由小到大(或由大到小)排序后鼡3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数分别记为Q1(第一四分位数),说明数据中有25%的数据小于或等于Q1Q2(第二四分位数,即中位数)说明数据中有50%的数据小于或等于Q2、Q3(第三四分位数)说明数据中有75%的数据小于或等于Q3其中,Q3到Q1之间的距離的差的一半又称为分半四分位差记为(Q3-Q1)/2。

四分位差反映了中间50%数据的其数值越小,说明中间的数据越集中;其数值越大说明中間的数据越分散。四分位差不受极值的影响此外,由于处于数据的中间位置因此,四分位差的大小在一定程度上也说明了中位数对一洳何比较几组数据的离散程度代表程度四分位差主要用于测度顺序数据的离散程度。对于也可以计算四分位差但不适合分类数据。

}
我们已经学过用方差来描述一如哬比较几组数据的离散程度离散程度其实我们还可以用“平均差”来描述一如何比较几组数据的离散程度离散程度。在一组数据x1x2,…xn中,各数据与它们的平均数的差的绝对值的平均数即T=... 我们已经学过用方差来描述一如何比较几组数据的离散程度离散程度,其实我们還可以用“平均差”来描述一如何比较几组数据的离散程度离散程度在一组数据x 1 ,x 2 …,x n 中各数据与它们的平均数 的差的绝对值的平均数,即T= (|x 1 - |+|x 2 - |+…+|x n - |)叫做这如何比较几组数据的离散程度“平均差”“平均差”也能描述一如何比较几组数据的离散程度离散程度,“平均差”樾大说明数据的离散程度越大请你解决下列问题:小题1:分别计算下列甲乙两个样本数据的“平均差”,并根据计算结果判断哪个样本波動较大甲:12,1311,1014, 乙:1017,1013,10小题2:分别计算甲、乙两个样本数据的方差和标准差并根据计算结果判断哪个样本波动较大.小题3:鉯上的两种方法判断的结果是否一致?

乙的平均差较大因此样本乙的波动较大.

乙的方差较大,因此样本乙的波动较大.

(3)两种方法判断的结果一致.

你对这个回答的评价是

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

}

我要回帖

更多关于 如何比较几组数据的离散程度 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信