数值描述图像相似性度量量 选择题

统计学习题03_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
统计学习题03
阅读已结束,下载文档到电脑
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,方便使用
还剩13页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢【图文】数值描述度量_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
数值描述度量
大小:2.55MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢知识要点:第一章:导论;1、什么是统计学?统计方法可以分为哪两大类?统计;按照所采用的计量尺度不同,分为分类数据、顺序数据;按计量尺度分时:分数数据中各类别之间是平等的并上;抽样误差主要是指在样本数据进行推断时所产生的随机;5、统计数据的质量评价标准:精度,即最低的抽样误;3、举例说明总体、样本、参数、统计量、变量这几个;总体是包含研究的全部个体的集合;第二
知识要点: 第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查和典型调查。 4、统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差和非抽样误差两类。 抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。
第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。 2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。
第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。 2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。 5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。 2、简述众数、中位数和均值的特点和应用场合及关系。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。 均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。 个。 2、简述相关系数的取值及其意义,并说明相关程度的几种情况。 相关系数-1≤r≤1 。若0≤r≤1 ,表明x与y之间存在正线性相关关系;若-1≤r<0 ,表明x与y之间存在负线性相关关系;若r=1,表明x与y之间为完全正线性相关关系;若r=-1 ,表明x与y之间为完全负线性相关关系。 |r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱。 3、解释回归模型、回归方程、估计的回归方程的含义 关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即Mo=Me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar<Me<Mo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则Mo<Me<xbar(图) 3、为什么要计算离散系数? 第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。 4、均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。 5、四分位差主要用于测度顺序数据的离散程度,数值型数据也可以计算四分位差,但不适合于分类数据。 6、方差是各变量值与其均值离差平方的平均数。方差的平方根是标准差。 方差、标准差计算公式(分组数据、未分组数据两种,自己写) 样本方差和标准差计算公式(同上) 7、对于分类数据,主要用异众比率来测度其离散程度;对于顺序数据,主要用四分位差来测度其离散程度;对于数值型数据,主要用方差或标准差来测度其离散程度。 8、经验法则:68%-1;95%-2;99%-3
第五章:抽样与参数估计 1、常用的概率抽样方法主要有:简单随机抽样,分层抽样,系统抽样,整群抽样 2、置信水平(P115)
第七章:相关与回归分析 1、解释相关关系的含义,并说明其特点。 相关关系是变量与变量之间存在的不确定的数量关系。特点是:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。 4、简述参数最小二乘估计的基本原理。 ?y???0???1x 这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数???0和?1的方法称为最小二乘法,即:nn?(yi?y?)2??(yi???0???1xi)2?最小i?1i?1 5、简述判定系数的含义和作用 回归平方和占总平方和的比例,称为判定系数。它测度了回归直线对观测数据的拟合程度,它反映了在因变量y的总变量差中由于x与y之间的线性关系所解释的比例。
第八章:时间序列分析和预测 1、利用增长率分析时间序列时应注意哪些问题? 首先,当时间序列中的观察值出现0或负数时,不宜计算增长率;其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。 第九章:指数 1、什么是指数?它有哪些性质? 反映复杂现象在不同场合下综合变动的一种特殊相对数,称为指数。 性质:相对性;综合性;平均性;动态和静态兼有的特性。 2、指数有哪些类型? 根据对比场合不同,分为动态指数和静态指数;根据指数研究对象的范围不同,分为个体指数和总指数。;根据编制方法的不同,总指数分为综合指数和平均指数;根据指数反映的性质不同,分为质量指数、数量指数;根据比较时所采用的基期不同,分为定基指数和环比指数;根据计算采用权数与否,分为简单指数和加权指数。 名词解释 1.统计总体:凡是客观存在的并至少具有某一相同性质结合起来的许多个别事物构成的整体,当它作为统计的研究对象时,就称为统计总体。 2.统计分组:根据统计研究的需要,将统计总体按一定标志区分为若干个组成部分的一种统计方法。 3.次数分布:总体中各单位数在各组间的分布。 4.总量指标:反映社会经济现象在一定时间、地点条件下总的规模、水平的统计指标。 5.时期指标:又称时期数,是反映总体现象在一定时期内的累计总量水平的指标。 6.平均值标:也称平均数,是将同质总体内各单位某一数量标志的差异抽象化,用以反映同类现象在具体条件下一般水平的指标。 7.标志变异指标:又称标志变动度,是反映总体各单位标志值之间差异大小的综合指标。 8.标准差:
总体各单位标志值与其平均数离差方差的算术平均数的平方根。 9.动态数列:又称时间数列、时序数列,即将某种现象的指标数值按时间先后顺序排列而成的统计数列。 10平均发展速度:又称序时平均数、动态平均数,即将不同时期的发展水平加以平均而得到的平均数。 11.狭义指数:用来说明不能直接相加的复杂社会经济现象在数量上综合变动程度的相对数。 12.综合指数:从数量上表明不能直接相加的社会经济现象的总指数。 13.平均指数:以个体指数为基础,通过平均形式编制的总指数。 14.抽样推断:依据随机原则,从总体中随机抽取一部分单位组成样本进行调查,并根据样本资料计算的特征值,对总体特征值作出具有一定可靠程度的估计,以达到认识总体数量特征的目的。 15.抽样误差:由于随机抽样的偶然因素使样本不足以代表总体而引起的样本指标与被估计的相应总体指标的离差。
有问必答 1. 标志与指标的区别与联系? 区别:①说明对象不同:标志是说明总体单位特征的名称,而指标是总体数量特征的概念和数值;②表示方法有差异:标志有能用数字表示的数量标志及用文字表示的品质标志,而指标都是用数字表示的。 联系:①存在变换关系:随着统计研究目的的改变,在一定条件下,标志与指标可以转化;②很多指标的数值可由总体单位的数量标志简单汇总而得。 2.统计分组的作用? ①划分现象的类型;
②揭示现象的内部结构;
③分析现象间依从关系 3.应用平均指标的原则? ①只能运用于同质总体;②用组平均数补充说明总平均数;③用分配数列补充说说明平均数 4.标志变异指标的作用? ①衡量平均值标代表性大小;②研究现象的稳定性与均衡性;③提供确定抽样数目和计算抽样误差的依据
5.编制动态数列的原则? ①时间长度应相等; ②总体范围应一致; ③指标内容应相同; ④计算口径应统一 6.影响动态数列的因素? ①长期趋势;
②季节变动;
③循环变动;
④不规则变动 7.指数的作用? ①综合反映复杂现象总体变动方向与变动程度; ②分析和测定总变动中各因素变动的影响方向及影响程度; ③分析复杂经济现象总体的长期变化趋势;④对社会经济现象进行综合评价。 8.影响抽样误差的因素? ①总体各单位标志值的差异程度 ②样本容量大小;③抽样方法不同; ④抽样组织形式不同 9.影响样本容量的决定因素? ①总体各单位的标志变异程度; ②允许误差的范围; ③抽样推断的可靠程度;
④抽样的方法及组织形式
统计学基础知识: 1. 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。P2 2. 数据分析所用的方法可分为描述统计方法(数据收集、处理、汇总、图标描述、概括与分析等统计方法)和推断统计方法(研究如何利用样本数据来推断总体特征的统计方法)。P2 3. 统计学的基本概念:总体和样本,参数和统计量,变量。(总体是包含所研究的全部个体的集合,它通常有所研究的一些个性组成,如由多个企业构成的集合。
样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。
参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征量。
统计量是用来描述样本特征的概括性数字度量。
变量是说明现象某种特征的概念,特点是从一次观察结果到下一次观察结果会呈现出差别或变化。)P7―P9 4. 按照所采用的计量尺度不同,可以将数据分为分类数据、顺序数据和数值型数据。(分类数据特点:各个类别平等,顺序也可以改变;可用数字表达,但数字只能是代号,例如男性、女性。
顺序数据:这些数据是有序的,例如产品可分为一等品、二等品、三等品。数值型数据:多带有度量衡单位,人数不属于数值型数据。)P5 5. 数值型变量:分为离散型变量(只能取整数)和连续型变量(小数位数可以一直取下去,即可以取到数轴上的每一点。)P10 6. 一手资料(数据的直接来源):通过调查的方法和实验的方法直接获得一手资料。 二手资料(数据的间接来源):如果与研究内容有关的原信息已经存在,我们只是对这些信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据。P14―P15 7. 概率抽样与非概率抽样的特点: 概率抽样: (1) 简单随机抽样:简单、直观(优点)
在总体单位很多时不方便、抽出单位分散,实施调查增加了困难、效率相对低(缺点)P17 (2) 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来,对总体的目标量进行估计。
层与层之间差别大、各层内部差别小。误差最小P18 (3) 整群抽样:将总体中若干个单位合并成组,这样的组称为群。抽样时直接抽取群,然后对选中的所有单位全部实施调查,这样的抽样方法称为整群抽样。
误差最大、简化了工作量。P19 (4) 系统抽样:将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。P19 (5) 多阶段抽样:采用类似整群抽样额方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。因为取得这些接受吊车的定单位需要两个步骤,所以将这种抽样方式称为二阶段抽样。这里,群是初级抽样单位,第二个阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。P19 非概率抽样: (1) 方便抽样:调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。例如调查员拦截式调查、厂家对路过的顾客进行调查。P20 (2) 判断抽样:研究人员根据经验、判断和对研究对象的了解,有目的的选择一些单位作为样本,实施时根据不同的目的有重点选择、典型抽样、代表抽样等方式。P20 (3) 自愿样本:指被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。P21 (4) (5) 滚雪球抽样:用于对稀少群体的调查。P21 配额抽样:类似于分层抽样,并不是依据随机原则,属于非随机抽样。P21 8. 抽样误差:是由于抽样的随机性引起的样本结果与总体真值之间的误差。只存在概率抽样。P33 非抽样误差:是相对抽样误差而言,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。存在概率抽样与非概率抽样。P34 9. 频数是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式 4 表现出来,称为频数分布。P51 10. 向上累积:从类别顺序的开始一方向类别顺序的最后一方累加频数。 向下累积:从类别顺序的最后一方向类别顺序的开始一方累加频数。P59 11. 在数值型数据中先分组再计算。P61 12. 组中值是每一组中下限值与上限值中间的值。P64 13. 条、饼、环、直、箱的作法。P65―P66 14. 经验法则
当一组数据对称分布时,经验法则表明: 约有68%的数据在平均数±1个标准差范围之内; 约有95%的数据在平均数±1.96个标准差范围之内; 约有99%的数据在平均数±2.58个标准差的范围之内。P101 15. 离散系数,也成变异系数:对于平均水平不同或者计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。P103 16. 中心极限定理P165 17. 95%的可信区间的含义:根据某个资料,计算了可信区间,其中95%就是可信区间。P182 18. 单双侧检验P209例:现在情况如何(双侧检验:提高、降低);现在情况是否比以前情况提高(单侧检验:现在情况比以前有所提高)。 19. 原假设是一定带有等号的(肯定的),如“是相同”。 20. 两类错误:原假设Ho为真却被我们拒绝,犯这种错误的概率即为弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误我们就叫取伪错误P211。 项目 Ho为真 Ho为伪 没有拒绝Ho 1―α(正确决策) β(取伪错误) 拒绝Ho α(弃真错误) 1―β(正确决策) 21. 相关系数:是根据数据计算的度量两个变量之间线性关系强度的统计量。 性质:①r的取值范围在-1到+1之间,即-1?r?1;
②r具有对称性,x与y之间的相关系数与y与x的相关系数相等;
③r数值大小与x和y的原点及尺度无关;
④r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系;
⑤r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。P304 22. 回归系数与相关系数关系:β与r正同正,负同负。P310 23. 判定系数:回归平方和占总平方和的比例称为判定系数,记做R2,它的取值范围是〔0,1〕,R2越接近0,回归直线的拟合程度就越差。P316 24. 对于同一资料,相关系数的假设检验=回归系数的假设检验。P321 25. 居民消费价格指数:是度量居民消费品和服务项目价格水平随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平变动的情况。 编制过程:选择代表规格品;先和调查点选择调查市县和调查点;价格的调查与计算;全书的确定。 作用:居民消费价格指数除了能反映城乡居民所购买的生活消费品和服务项目价格的变动趋势和程度;反映通货膨胀状况;反映居民购买力水平;测定职工实际工资水平,实际工资=名义工资M消费价格指数。P424
《统计学》练习题(1)
一、单项选择题(在每小题的四个备选答案中选出一个正确的答案,并将正确答案的号码填在题干后的括号内,每题小题1分,共15分) l、某商店有职工50人,把他们的工资加起来除以50,这是(
A、对50个变量求平均数
B、对50个变量值求平均数
C、对50个标志求平均数
D、对50个指标求平均数
2、重点调查中的重点单位是指(
5 三亿文库包含各类专业文献、行业资料、生活休闲娱乐、中学教育、文学作品欣赏、各类资格考试、幼儿教育、小学教育、统计学及习题40等内容。 
 《统计学》习题汇编(附答案)_理学_高等教育_教育专区。练习一一、单项选择: (...21 五、计算题: 1、某地区各厂工人劳动生产率与利润资料如下: 厂序号 工人...  《统计学习题集》含答案_理学_高等教育_教育专区。第一章 绪论 一、填空题 1...11、统计学按其理论与实践的关系不同,可分为理论统计学和应用统计学。 12、...  《统计学原理习题集》 第一章 复习思考题 绪论 1.从统计工作的产生和发展说明统计工作的性质和作用。 2.试说明统计工作与统计学的关系。 3.我国统计工作的基本...  统计学习题及参考答案 第一章 绪论 一、 单项选择题 1、在整个统计工作过程中处于基础地位的是( ) A、统计学 B、统计数据搜集 C、统计分析 D、统计数据的...  统计学练习题及答案_经济学_高等教育_教育专区。第一章 1.单选题 (1)统计研究对象的特点包括( A、总体性 同一性 导论练习题) 。 C、总体性和具体性 D、 ...  统计学习题及答案_财会/金融考试_资格考试/认证_教育专区。统计学练习 判断 1、社会经济统计的研究对象是社会经济现象总体数量特征的各个方面。(√) (×) 2、在...  《统计学》练习题及答案_教育学_高等教育_教育专区。统计学练习题 《统计学》 习题集 《统计学》习题集 PART:1 导论《第一套》 一、填空 1、统计的研究对象...  “十二五”普通高等教育规划教材 统 计 学 习题与答案刘树 邵淑贤 刘广永主编 主审 单昭祥 中国铁道出版社 第一章 练习题 一、单项选择题 1.统计的含义有三种...广东住院医师考试统计试题集(中山医版) - 医护临床考核与继续教育版 - 爱爱医医学论坛
查看: 3901|回复: 11
广东住院医师考试统计试题集(中山医版)
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
才可以下载或查看,没有帐号?
朋友给我的,希望对大家有点帮助咯.
选择题& &单选题
1、& && &&&统计中所说的样本是指-E、以上都不是
2、& && &&&统计学上说的总体是指-C、根据研究目的确定的研究对象全体
3、& && &&&下列资料中属于计量资料的是-D、10只小鼠染毒后细胞转化率分别为20%、75%….
4、& && &&&关于标准正态分布曲线下面积,错误的是-C、大于1.645的曲线下面积是2.5%
5、& && &&&编制频数表中错误的做法是-C、写组段时组段可重叠,如2~4,4~6…
6、& && &&&用均数和标准差可全面描述――资料的特征-C、正态分布和近似正态分布
7、& && &&&反映计量资料集中趋势的指标是--E、均数
8、& && &&&正态曲线下总面积是-C、100%
9、& && &&&在服从正态分布条件下,样本的标准差的值-E、与个体的变异程度有关
10、μ+1.96σ范围内占正态曲线面积的-E、47.5%
11、抽样误差是由-C、抽样引起
12、测定某地130名正常男子红细胞数,要估计该地正常男子红细胞数95%置信范围用-D、χ+-1.96Sx
13、在抽样研究中“总体均数”和“总体标准差”-B、不知道,但可以由样本推论
14、当n≠ω时,标准正态分布(u分布)与t分布(自由毒为v)比较,下列关系正确的是-B、U0.05<t0.05(v)
15、在抽样研究中,均数标准误-B、比标准差小
16、配对设计计量资料,用配对比较方法计算出Tm值,并用两组比较方法计算出Tc值,一般情况下有-D、Tm≥Tc
17、t检验的作用为-C、检验均数的实际差异是否由随机抽样误差引起
18、计算得t>t0.05(v),则推算概率P值为-B、P<0.05
19、公式&&适用于-B. 配对资料差值的均数的检验
20、配对计量资料作t检验时,其自由度为-C、对子数-1
21、计算得计算得t>t0.05(v),可认为-B、这么大差异有抽样误差所致的可能性小于0.05
22、自由度为50,得t=1.96,则推算概率P值为-A、P>0.05
23、配对设计t检验的统计假设为-B、差数的均数来自μ=0的总体
24、当求得t=t0.05(v)结论为-D、P=0.05,拒绝H0,差异有统计学意义
25、两组比较作t检验的统计假设为-D、 来自m1=m2的两个总体
26、样本均数与总体均数比较的假设检验,其统计假设为-C、样本均数来自已知总体均数为μ=0的总体
27、抽样误差是由-A、个体变异引起
28、在服从正态分布的条件下,抽样误差大小-E、与标准差及观察例数有关
29、假设检验中当P=0.05时,结论为-A、差异有统计学意义
30、反映样本均数代表性的指标是-D、标准误
31、比较A、B两种药物疗效时,作单侧t检验的条件是,从理论和经验上推断,-D、已知A药不会比B药差
32、计算麻疹疫苗接种后血清检查的阳性率,分母为-C、麻疹疫苗接种人数
33、已知男性的钩虫感染率高于女性,今欲比较甲、乙两乡居民的感染率,但甲乡女性多于男性,乙乡女性少于甲乡男性,适当的比较方法是-D、对性别进行标准化后再比较
34、从甲、乙两文中,查到同类研究的两个率比较的四格表资料,其c2检验甲文c2>c20.01(v)乙文c2>c20.05(v),可认为-A、甲文结果更可信
35、四个样本率作比较,c2>c20.01(v),可认为-A、各总体率不等或不全相等
36、标准化率反映了事物发生的-B、相对水平
37、医学统计中所指的各种率实际上是指-B、概率的估计值
38、对合计率进行标准化的某的是-A、消除内部构成的差异,使率具有可比性
39、反映某一事件发生强度的指标应选用-D、率
40、构成比之重要特点是各组成部分的百分比总和-C、必等于1.00
41、某日门诊各科的疾病分类统计资料,可以作为-C、计算构成比的基础
42、对3个均数作方差分析,结果有统计学意义,可认为-E、2个或3个总体均数不同
43、方差分析中,离均数平方和为SS,方差为MS,下标T、B、W分别表示总的、组间和组内,则必有-E、SST=SSB+SSW
44、方差分析中的组间均方是-D、表示处理作用与抽样误差两者的大小
45、方差分析中-B、F值不可能是负数
46、方差分析中,获得P<0.05时,结论是-D、可认为各总体均数不全相等
47、最小二乘法是指-D、各点到直线的纵向距离的平方和最小
48、由样本均数算得相关系数r、t检验P<0.01,说明-D、r来自总体相关系数不为0 的总体
49、两变量(x和y)作相关分析时,算得r=0.95,可以说-D、不能确定x和y的相关程度,因不知道n的大小
50、两变量(x和y)作相关分析时,算得r=0.38,可以说-C、不能确定x和y的相关密切程度,因不知道n的大小
51、相关系数r=0.85作假设检验P<0.05,可以认为两变量之间-D、有正相关系数
52、反映某病发病水平的指标有-A、发病率、患病率、感染率
53、正态曲线是由――所决定-B.总体均数 和总体标准差
54、医学研究中, 设立对照组的目的是-A.分离处理因素的效应
55、95%正常值范围或参考值范围指的是-A. 95%的正常人在此范围内
56、关于计量资料频数表与直方图,正确的是-C.频数表比直方图精确
57、习惯上讲的“平均寿命”是指-E. 出生时的预期寿命
58、在相关分析中,得到相关系数为0.83,错误的解释是-C.X与Y有函数关系
59、实验设计的原则为-B. 对照、均衡、随机、重复
60、在两组样本比较的秩和检验中,实验组的观察值为0,3,7,14,32,对照组的观察植为 0,0,2,4,4,8。编秩中零值的秩应编为(分号之前为实验组数据)-C. 2; 2,2
61、下列变量属于分类变量的是-D、血型
62、关于计量资料的统计描述,错误的是-D、四分位数间距可描述个体变异数
63、正态曲线是由――所决定-B、总体均数μ和总体标准差σ
64、假设检验的步骤是-A、作假设、假设统计量、查界值表作结论
65、将90名患者随机等分成三组后分别用A、B、C方法治疗,疗效指标为降低血糖多少,欲比较三种方法的效果是否相同,正确的是-B、作3个样本比较的方差分析
66、四格表c2检验的无效假设H0是-E、总体构成比相等
67、平均发展速度实质是发展速度的――表示-C、几何均数
68、方差分析要求-A、各总体方差相等
69、作3个样本率比较的c2检验,若拒绝H0,则可认为-C、2个或3个总体均数不同
70、配对比较t检验的无效假设H0是-E、差值的总体均数为0
71、总体是指-D、由研究目的确定的研究对象的全体
72、均数的抽样误差表示-E、样本均数的标准差
73、标准化率适用于-B、比较量医院的总治愈率
74、关于t检验的说法中,正确的是-D、两样本比较时,要求两组方差齐性
75、由样本算得相关系数r=0.88,说明-E、以上都不对
76、调查表的项目包括-C、分析项目和参考项目
77、以下抽样方法中,属于系统抽样的是-B、52名学生按座位顺序编号1~52,凡编号为1.4.7的同学被抽取
78、在两组样本比较的秩和检验中,试验组的观察值为0,3,7,14,32,对照组的观察值为0,0,2,4,4,8,编秩中零值的秩应编为-C、2,2,2
79、血清抗体滴度治疗,常有-B、均数小于中位数
80、老龄化人口是指--B、65岁以上占10%
81、关于试验研究中估计样本量大小的依据,正确的是-E、以上都不对
82、以下不能服从Poisson分布的实例是-C、家庭中结核病发生数分布
统计学上的变异是指什么?许多医学现象因人而异,称之为变异
简述什么叫总体和样本,医学研究中样本有什么要求?同质的研究对象的全体称为
总体。用随机方法从总体中抽出的、有代表的一部分个体称为样本,医学研究中的样本必须是随机样本
医学统计学的基本内容有那些?研究设计、收集资料、统计分析资料
统计描述的基本方法有哪些,各有何特点?1、统计图表,较具体客观的描述一组数据特征;便于发现可疑异常值;有助于正确选用统计指标和便于计算 2描述性统计量,可以用来定量的刻画统计分布的特征,常用的有三类描述集中趋势的有算术均数、几何中数、中位数;描述离散趋势的有极差、四分位间距、方差、标准差、变异系数;描述分布类型的偏度系数有峰度系数3百分位数是一种位置参数既可用于描述离散趋势又可描述集中趋势可用于各种连续型分布
统计描述的意义是什么?用统计指标、统计表或统计图来描述资料的分布规律及其数量特征。例如有三组同年龄男孩体重如下,其平均体重是30kg,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等
简述如何正确选用计量资料的统计描述指标1根据分布类型选择指标2正态分布资料选用均数与标准差3对数正态分布资料选用几何均数4一般偏态分布资料选用中位数与四分位数间距
举例论述正确选用计量资料的统计描述指标?
正态分布——均数与标准差;算术均数适用于对称分布或偏斜度不大的整理。尤其适用于态
分布整理,例如某地用随机抽样方法检查了140名成年男子的红细胞为了解样本红细胞之间
的变异程度就需要用标准差;对数正态分布——几何均数。例如抗体滴度、细菌拘束等其数
据特点是观察间按照倍数关系变化就用几何均数;偏态分布——中位数与四分位数间距。当
频数表对称性很差时,不了正偏态或是负偏态都采用中位数来度量平均水平,用四分位数间
距来衡量变异度大小。如对某地600名50~60岁正常女性血清甘油三脂含量的测定
举例说明统计资料的三种类型。1计量或测量或数值资料,如身高、体重等2计数或分类资料,如性别、血型等3等级资料,如尿蛋白含量-、+、++、+++、…
统计设计的基本原则有哪些?1、对照,以排除偶然的非处理因素的干扰2、随机,是指总体
中每个都有同等的机会被抽中,其目的为使样品具有代表性3、均衡,即处理组与对照组的
内部构成一致如年龄一致等4、重复,样品小难说明问题,一般要求30例
怎样正确描述一组计量资料(的平均水平)?先观察资料的分布状态,正态分布资料可选用算术均数描述;偏态分布资料可用几何均数描述;分布不明可用中位数描述
若数据呈偏态分布,如潜伏期天数,可计算中位数,将观察值从小到大排列,位于正中位置的观察值为中为数,它反映偏态分布的水平;若数据服从或近似对数正态分布,如抗体滴度,可计算几何均数,即观察值的乘积开n次方,反映对数正态分布的平均水平;若数据服从或近似正态分布,如儿童身高,可计算均数,均数即观察值的总和除以n,他反映正态分布的平均水平;首先制作频数表或频数图,以考察数据分布的形状和对称性,再根据数据分布的类型选择合适的平均数,以反映数据分布的平均水平,选择平均数类型的原则
简述常用的四种随机抽样方法。1完全随机抽样,即总体中每一个体有同等的机会被抽中或分配到某一组,如抽签或随机数字表法2系统抽样或等距抽样或机械抽样,首先将总体中的个体按某种顺序编码并分为n个组段,间隔为k,接着用完全随机方法在第一组段中抽出一个号码,往后各组依次递加k个号码的个体被抽中3整群抽样,首先将总体分为K群,而后从中抽取k个群体作为样本4分层随机抽样,首先将总体按个体特征分为K层,而后分别从每一层中随机抽样
怎样正确描述一组计量资料?1、根据分布类型选择指标2、正态分布资料选用均数和标准差3、对数正态分布资料选用几何均数4、偏态分布资料选用中位数与四分位数间距
描述计量资料集中趋势(一般水平)的指标有哪些?各适用什么情况?常用指标用均数、几何均数、中位数&&均数:适用于对称分布,尤其正态分布&&几何均数适用于等比资料、对数正态分布& &中位数适用于偏态分布,未端无确定值
描述计量资料离散程度(差别大小)的指标有哪些?各适用什么情况?1、极差一般适用于偏态小样本数据的变异程度2、四分位数间距适用于偏态分布特别是未端没有具体数据的资料3、方差和标准差适用于正态分布或近似正态分布对称分布的数据资料4、变异系数适用于比较度量单位不同或均数相差悬殊的两组资料的变异度
标准正态分布的主要特征有那些?
1、& && &&&曲线外观:左右对称、吊锥型2、分布参数:中心位置是均数,形状由标准差决定3、曲
线下面积为1%或100%,其中任意区间内的面积均可用公式计算或通过查表求得。常用的区间及其面积有1、居中加减1.96标准差范围内面积占95%,对应两头尾巴面积共5%各占2.5%2、居中加减2.58个标准差范围面积99%,对应两头尾巴面积占1%个占0.5%
对同一资料,标准误是否小于标准差,为什么?1是2因为“标准误=标准差÷ ,通常n&1
简述标准差和标准误的意义?标准差反映个体的变异程度(平均差别)标准误反映抽样误差的大小(样本均数的标准差)
两组样本均数比较时,为什么要做假设检验?假设检验可以回答什么问题?造成两样本均数不等可能有两中原因1两个样本的总体均数相同,但有抽样误差2两个总本均数不同& &假设检验可以回答,在无效假设成立的情况下,由抽样误差造成的可能性大
假设检验的基本步骤有哪些,每一步骤的意义是什么?(1).检验假设或无效假设,其意义为在“无效假设”下,将误差视为随机误差,服从某种分布(2).计算统计量,根据变量的分布选择统计量,如两组5岁男孩平均身高的比较可作t检验(3).确定P值并作出推论 P£0.05时拒绝H0,接受H1,反之不拒绝H0,当接受H1时,必须说明其实际意义
假设检验的功效是什么,影响功效的因素及其作用有哪些?当假设检验不拒绝H0时,推断正确的概率称为检验功效;影响功效的因素有:客观差异,标准差,样本量,α;作用:1客观差异越大,功效越大2个体标准差越小,功效越大3样本量越大,功效越大4α值越大,功效越大
假设检验结论拒绝H0时,是否P值愈小愈好,为什么?是,因为P值反映样本信息支持H0的概率,P值愈小则H0成立的可能性愈小
假设检验中第一类错误和第二类错误是指什么?第一类错误:拒绝了实际成立的H0,为“弃真”的错误,其概率通常用α表示,α可取单尾或双尾,假设检验时研究者可以根据需要确定α值的大小,一般规定α=0.05或α=0.01,其意义为假设检验中如果拒绝H0时,发生1型错误的概率为5%或%1%,即100次拒绝H0的结论中平均有5或1次是错误的。第二类错误:不拒绝实际上不成立的H0,为“存伪”的错误,其概率用β表示,β只取单尾,假设检验时β值一般不知道,在一定情况下可以测算出,如已知量总的体差δ、样本含量n和检验水准α
两组比较的t检验,结论拒绝H0时,是否证明了两总体均数不同,为什么?否,因为假设检验拒绝拒绝H0时可能犯一类错误,不能说证明了….
评价某人某生理指标是否正常,用什么范围来衡量?用95%正常人分布的范围来衡量,若某人的该指标落在此范围内,则当作正常,反之当作异常
怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料为分类资料,常用相对数描述样本数据的分布特征
举例说明抽样误差是什么?1样本指标与总体参数的差异称为抽样误差2例如从广州市随机抽取60名5岁男孩,测量其身高,这60名男孩的平均身高通常不会恰好等于全广州市5岁男孩的平均身高,两者的差别称为抽样误差
常用相对数指标有那些,他们在意义和计算上有何差别?构成比、率、相对比。构成比表示某部分所占的比例或比重,以各部分的合计数作分母;率表示某医学现象发生的频率或强度,以可能发生该现象的个体数作分母;相对比用于两个数据的直接比较,以作为基数的数据为分母
分类资料怎样描述?常用相对数描述样本数据的分布特征
X2检验的条件有那些?T<确切概率法:1≤T<5的格子数不大于1/5总格子数不用校正,四格表有一格1≤T<5要校正
标准化率的意义是什么?合计率比较时,将它换算为标准化率,可校正内部构成不一致所造成的干扰作用
两组均数差别的假设检验能否作方差分析,为什么?能,因为两个均数比较是多个均数比较的一个特例(t2=F)
方差分析中,组内误差MSW是来源于那些方面的误差?来源于个体变异引起的抽样误差
简述直线相关系数意义?直线相关系数表示两个变量直线关系的密切程度和方向(同方向或反方向)
两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系?否,因相关是直线相关的简称,相关系数等于0说明两个变量之间无直线相关性,但他们之间有可能存在曲线相关性
举例说明直线回归的意义,以及在医学中的应用?例如研究儿童年龄与体重的直线回归关系,若样本很大并且研究质量很好,所获得的直线回归方程可用于估计儿童的体重,计算用药量
对多组均数作方差分析的主要步骤有那些?1估计统计描述指标2计算组内、组间及离均差平方和,以及相应
骨科刘潮坚(:43:56
住院医师培训统计学部分资料
绪&&论三、医学统计的基本概念
1.变异:每个观察个体之间测量指标的差异就是变异。
2.总体与样本:根据研究目的确定的全部观察个体称总体(population)。从总体中随机抽取有代表性的一部分,称为样本。在其它研究方式中可以有非随机的样本,但如果希望做统计分析时,则必须是随机样本。
3.变量:对研究对象的某些特征进行观察或测量,这些特征在个体之间存在变异,反映这些特征的指标称变量。根据测量的精确程度和特点又将变量分成以下类型:
数值变量(numerical variable):又称计量资料,是定量地测量观察个体某项指标所得数据。
& & 如: 年龄& && &&&身高&&体重&&脉搏&&血细胞计数
分类变量(categorical variable):又称计数资料,是定性地测量观察个体某项指标所得数据。
& & 如:&&性别 --- 男 、女
& && && &职业 --- 工 、农 、商 、学 、兵
有序分类变量(ordinal variable):又称等级资料,是测量精度处于定量和定性之间的指标。
& && && && && & 如:心功能分级& && && && && & 疾病临床分期& && && && && && && && &尿蛋白的半定量测定
等级资料的特点是虽然各等级有量的层次,但等级间量的差别未知。
四、学习医学统计学的方法和要求
1.活学活用,掌握基本概念、基本思想和基本技能,不要死记硬背。
2.通过讨论理解统计基本理论和应用。
第一章&&描述性统计
统计描述的任务就是用表、图和数字的形式概括原始资料的主要信息。
一、& && &&&频数表与直方图:
频数表与直方图是最常用的综合描述样本资料的方法, 形象直观,可大致看出分布。
1. 频数表的制作:
& & 例1.3 某地随机抽取正常成年男子120名, 其红细胞计数值(1012 /L)如下:
&&5.12&&5.13&&4.58&&4.31&&4.09&&4.41&&4.33&&4.58&&4.24&&5.45&&4.32&&4.84
&&4.16&&4.58&&5.35&&3.71&&5.27&&4.52&&5.21&&4.37&&4.80&&4.75&&3.86&&5.69
试作该批样本的频数表。
对计量资料则要按以下步骤制作频数表:
&&(1)找出最大和最小值,计算极差。
&&本例最大值=6.18, 最小值=3.29,极差为R=6.18-3.29=2.89
(2)确定组距和列出分组计划:一般设10~15组;组距取整。&&
i= R /10=2.89/10=0.289≈0.30
& && & 第一组包括最小值,最后一组包括最大值。
(3)将原始数据整理后,得到各组频数
2.频数表的用途:
&&(1)描述资料特征: 集中趋势及离散趋势。
&&(2)确定变量的分布类型
&&(3)发现异常值
二、样本平均水平的度量:
& & 用更精确的一、两个数字(指标)描述原始资料的信息,对于计量资料一般用两个数字(指标)分别描述资料的平均水平和变异性。
常用描述平均水平的指标有算术均数、几何均数和中位数。
1. 算术均数(arithmetic mean),简称均数。
适用:对称资料,最好是近似正态分布的资料。
①直接法:
例如:测量7名正常8岁女孩身高(cm)分别为:
& && && &122&&129&&128&&135&&132&&125&&133
& && & 平均身高为:(122+ 129+128+135+132+125+133)/7=129(cm)
②加权法:当数据量太大时或资料已经整理成频数表时。
2. 几何均数
& & 适用:原始数据经对数转换后近似对称分布的资料,医学上常用于微生物学和免疫学指标。
几何均数的计算可参考算术均数的计算,唯一不同的是需要在计算前将变量取对数,最后将结果反对数转换回其真值。
3. 中位数 (median)
& &中位数:将一组观察值从小到大排列,位置居中的那个数值为中位数。
& &适用:数据为非对称分布﹑分布不清楚或资料未闭口的情形。
①直接法:将原始数据 ,由小到大排序,
例:1,1,2,2,3,4,6,9,10&&( n = 9, 为奇数)
& && && & Md = 第5位 = 3
例: 1 ,&&1 ,&&2 ,&&2 ,&&3 ,&&4 ,&&6 ,&&9 ,&&10 ,&&13&&( n=10, 为偶数)
& && && & Md = 第5位和第6位的平均 = (3+4)/2
②频数表法:
组段& && &&&频数& && &&&累积频数& && &&&组中值
1~& && &&&20& && &&&20& && &&&2
3~& && &&&66& && &&&86(fa)& && &&&4
5~& && &&&60& && &&&146(fb)& && &&&6
7~& && &&&48& && &&&194& && &&&8
9~& && &&&18& && &&&212& && &&&10
...& && &&&...& && &&&...& && &&&
19~21& && &&&3& && &&&239& && &&&20
& && && && &&&合计& && &&&239
(1) 中位数的名次& && && && &n / 2 = 239 /2 = 119.5
(2) 该名次所在组段& && && &&&a ~ b&&=& &5 ~ 7
(3) 用插入法 :
& & a 和 b 所对应的累积频数& &&&fa =86 ,& & fb = 146
& & 在a 和 b 中作插值估计& &&&
& && && && && &
三、样本变异性的度量:
例:三组同年龄﹑同性别儿童体重(kg)数据如下:
& & 甲组& &&&26&&28&&30&&32&&34
& & 乙组& &&&24&&27&&30&&33&&36
& & 丙组& &&&26&&29&&30&&31&&34
常见的几种:极差或全距,四分位数差距,方差与标准差,变异系数
1. 极差或全距R
& &极差 = 最大值 - 最小值
2. 四分位数差距Q
& &四分位数差距 = X75 - X25
& &中位数是50%位数,因此四分位数的计算类似中位数。
3. 方差S2与标准差S
& &适用:对称分布或近似正态分布资料,能充分利用全部个体的信息。
离均差 = 个体值- 总体均数 =&&
& & 离均差平方和 = S ( )2
& & 总体方差:& &=S ( )2 /n
& & 总体标准差& &&&
& & 总体均数常不知道,用样本均数& &代替&&
& & 离均差 = 个体值 -样本均数 =&&
& & 离均差平方和 =& &&&(变小了)
& & 样本方差:& && &&&其中,n-1 称为自由度。
样本标准差的计算:&&
& && && && && &
4. 变异系数 (coefficient of variation , CV )
适用:当比较两组或多组资料的变异程度大小时,如果变量的度量衡单位不同或均数差别较大时,应用变异系数比较。
& && && && &&&CV&&
例 :& && && && &均数& && &标准差& && &变异系数
& && && &男子身高& &170 cm& &&&6 cm& && && &0.035
& && && && & 体重& & 60 kg& && &7 kg& && && &0.117
四、相对数与率的标准化:
(一)比、比率和速率
& &1.比 (ratio)&&任意两个数之比值
& &例: 新生儿性别比 = 男性新生儿数 / 女性新生儿数
& && && &&&体块指数 = 体重 / ( 身高 )2
& &2.比率 ( proportion )
& & 分子和分母均为计数值;分子是分母的一部分;无量纲;百分比;分母较大时,近似地反映某事件发生的机会大小。
例 :&&医治1000例病人,900例痊愈,
& &&&治愈率 = 900/1000 = 90%
&&3.速率 (rate):单位时间内某事件出现的机会大小,分母含时间量纲。
例:&&某年死亡率= 该年死亡人数/同年暴露于死亡危险的人年数
& && & 死亡率的量纲为1/年或人/人年。
(二)率的标准化方法
表1.9 两个地区的年龄别死亡率资料
(岁)& && &&&A 地 区& && &&&B 地 区
& && &&&人口数(千人)& && &&&死亡数
(千人)& && &&&死亡率
(1/千)& && &&&人口数(千人)& && &&&死亡数
(千人)& && &&&死亡率
0~& && && &400& && && &2& && && & 5.0& && && &288& && && & 1& && && & 3.5
15~& && &&&2000& && &&&10& && && & 5.0& && && &238& && && & 1& && && & 4.2
30~& && &&&2000& && &&&15& && && & 7.5& && && &794& && && & 5& && && & 6.3
45~& && && &800& && && &8& && && &10.0& && &&&2000& && && &18& && && & 9.0
60~& && && &400& && &&&16& && && &40.0& && &&&2000& && && &70& && && &35.0
75+& && && & 80& && &&&12& && &&&150.0& && && &300& && && &36& && &&&120.0
合计& && &&&5680& && &&&63& && && &11.1& && &&&5618& && &&&131& && && &23.3
& & 分别在各年龄组中比较死亡率较为合理,但如果各年龄组结果不一致,无法作出总的结论,标准化方法旨在产生一个可比的综合指标。
1.直接法标准化:
&&适用条件:①已知有稳定的年龄别死亡率,②有合适的标准人口。
&&选择“标准人口”: 统一人口 或 合并人口
&&方法:估计当地年龄别死亡率应用于“ 标准人口”得到标化死亡率。
&&注意:直接标化率是以标准人口为权重的加权平均率。
表1.10 两个地区的直接法标准化死亡率
年龄组(岁)& && &&&标准人口数(千人)& && &&&甲死亡率(‰)& && &&&甲期望死亡数
(千人)& && &&&乙死亡率(‰)& && &&&乙期望死亡数
(1)& && &&&(2)& && &&&(3)& && &&&(4)=(2)×(3)& && &&&(5)& && &&&(6)=(2)×(5)
0~& && && & 686& && && & 5.0& && && & 3.43& && && & 3.5& && && & 2.40
15~& && && &2238& && && & 5.0& && && &11.19& && && & 4.2& && && & 9.40
30~& && && &2794& && && & 7.5& && && &20.96& && && & 6.3& && && &17.60
45~& && && &2800& && && &10.0& && && &28.00& && && & 9.0& && && &25.20
60~& && && &2400& && && &40.0& && && &96.00& && && &35.0& && && &84.00
75+& && && & 380& && &&&150.0& && && &57.00& && &&&120.0& && && &45.00
合计& && &&&11298& && && &19.2& && &&&216.58& && && &16.3& && &&&184.20
2.间接法标准化
& &适用条件:①年龄别死亡率未知或年龄别死亡率不稳定,②有各组实际死亡数和年龄别人口数,③有合适的“标准年龄别死亡率”。
方法:①估计标准年龄别死亡率应用于当地人口的期望死亡数,
& && && &②计算标准死亡比(standard mortality ratio):
& && && &&&SMR= 实际死亡数/期望死亡数
& && && &③间接法标准化死亡率= SMR′标准粗死亡率
标化率不反映当地实际情况,仅用于比较资料间的相对水平。
选用的标准不同,所得的标化率不同。
第二章& & 概率与分布
统计学的一项重要任务就是由样本推断总体, 从样本推断总体带有不确定性,总体中各种可能事件出现的机会需用概率和概率分布来度量和描述。
2.1 概率的意义
1.& && &&&概率
随机试验: 结局事先不能肯定的某项活动。简称试验。
随机事件: 表示某试验可能的结局,简称为事件,记为E。
概率: 一次试验中,某事件出现的机会大小,记为P(E)。
& && && && && && &
不可能事件& && && &
必然事件& && && && &
随机事件& && && && &
小概率事件: 。
(1) 古典定义:以模型为基础的概率。
例: 掷钱币&&正面朝上的概率是0.5
& & 掷骰子&&“3”点朝上的概率是1/6
(2) 频率定义:以频率为基础的概率。
例 : 小学生色盲: 调查n名,色盲m名
& &&&当n足够大时,小学生色盲的概率 ≈& &
在医学研究中多根据大样本资料,由频率估计概率。
2.2& && && &随机变量的分布特征
1.离散型随机变量的概率分布。
列出:* 各种可能的取值
* 各种可能值的概率
例:掷骰子:& &
可能取值& && &&&1& && &&&2& && &&&3& && &&&4& && &&&5& && &&&6
概率& && &&&1/6& && &&&1/6& && &&&1/6& && &&&1/6& && &&&1/6& && &&&1/6
2.连续型变量的概率分布
连续型变量:取值范围是一个连续的区间。
可能的取值无法一一列出;
用直方图反映概率分布。
2.3 二项分布
1. 概率函数
条件:①每一次试验结果只能是对立的结果,
& && &②其中某事件出现的概率为 。
& && &③n次试验独立。
该事件共出现X次的概率函数为:
& && && && &
则称X为服从二项分布的变量,记为
& &&&二项分布的概率分布函数为
3. 总体均数和总体标准差
用频率表示,见下表的右则:
& && && && && && && && && && &&&
总体均数& && && &
总体方差& && && &
总体标准差& && && &
& && && && && && && && && && && && && &样本率:p=X/n
2.4&&Poisson分布
1.概率函数
& & 应用:罕见事件发生的随机分布规律,如生物在单位面积或容积中的分布,放射质点在时间轴分布,罕见疾病在人群中的分布。可视为二项分布的特例:n很大, 很小。
& &例: 放射性脉冲计数。时间:& && && && && && && && &&&
假定:(1)将时间轴分割成n小段(n很大),每小段内可能不放
& &&&射,可能放射一次,但不可能放射2次或更多(大量、有或无);
& && && & (2)每小段内放射的概率为& &(重复、小概率);
& && && & (3)各小段内放射与否是独立的(独立)。
& && &则称X服从参数为 的Poisson分布,记为
3. 总体均数和总体方差
& && &&&二项分布& && && &很小, 很大,
Poisson分布
总体均数& && && &
总体方差& && && &
Poisson 分布的特征:&&总体均数 =&&总体方差 =&&
& &设 互相独立,则
& && && && &
例:设10分钟内放射性脉冲数服从Poisson分布,独立重复2次& && && && &&&
则两次测定结果相加(相当于测定20分钟)
& && && && &&&
2.5 正态分布
& & 在大自然中,许多连续型的随机变量的频数分布是中间频数多,两边频数少,且左右对称。法国统计学家De Movoire提出正态分布,Gaussian应用正态分
喜欢他/她就送朵鲜花吧,赠人玫瑰,手有余香!
+1虽然不知道是不是今年的,但还是感谢
+6对于好人,我从不吝啬鲜花~
广东住院医师考试统计试题集(中山医版)
广东住院医师考试统计试题集(中山医版)
先顶上去,让大家可以及时看到:P :P
阅读权限20
广东住院医师考试统计试题集(中山医版)
去年的吧?????
广东住院医师考试统计试题集(中山医版)
今年的还是去年的啊??今年的我就送你鲜花啊
广东住院医师考试统计试题集(中山医版)
确是是感谢!:handshake
广东住院医师考试统计试题集(中山医版)
感谢中啊!!!!!!!!!!!!
广东住院医师考试统计试题集(中山医版)
真伟大,谢谢啦
广东住院医师考试统计试题集(中山医版)
我 还真不 知道是 今年还是去年的 ,只是收集到就立刻发上来跟大家分享
广东住院医师考试统计试题集(中山医版)
谢谢楼主 了!正需要啊!
广东住院医师考试统计试题集(中山医版)
非常感谢楼主,无论去年的还是今年的题,楼主的精神是值得仰慕和学习的。向楼主致敬!:handshake
广东住院医师考试统计试题集(中山医版)
太感谢了!!!!!不管是去年的还是今年的都很感谢!!
Powered by}

我要回帖

更多关于 ps度量工具怎么看数值 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信