联系:二者都是标准差
区别:某个随机变量的标准差(standard deviation),衡量的是该随机变量的离散度
标准误(standard error),也叫抽样标准误是样本统计量的标准差,衡量的是抽样分布的离散度对应的随机变量是样本统计量。比如样本均值的标准误(standard error of sample mean)衡量的就是样本均值的离散度。
平均数(1+2+7+9+5+6+8+11+7+3)/10=5.9,只能描述他们的总体趋势不足以表达他们各自的离散程度。因此标准差就是这样登场的
我们想象一下我们第一次先随机抓10000只,记下数据后放掉再随机抓10000只……重复n(n理想中取无数次)次,这样就会有无穷多个样本抽样数据得到的平均数。
我们把这无穷多次取样本的数据结果平均数的集合视为一个新的样本集合这个样夲代表的是进行无数次抽样的结果。
对于这个样本的标准差我们称之为标准误。
标准误所代表的是在无数次抽样结果中,一次抽样的結果可能偏离无数次抽样结果这一总体的程度标准误越小,用这一次抽样结果来代表这无数次抽样结果的可靠性就越好
标准误的大小與你每次取样的个数有关,每次抽样个数越多标准误就越小,样本的可靠性越高
当然,一次性抽只(趋于无穷)时标准误为0,这一次总體抽样代表总体的可靠性当然是最准确哒~
联系:二者都是标准差
区别:某个随机变量的标准差(standard deviation),衡量的是该随机变量的离散度
标准误(standard error),也叫抽样标准误是样本统计量的标准差,衡量的是抽样分布的离散度对应的随机变量是样本统计量。比如样本均值的标准误(standard error of sample mean)衡量嘚就是样本均值的离散度。
平均数(1+2+7+9+5+6+8+11+7+3)/10=5.9,只能描述他们的总体趋势不足以表达他们各自的离散程度。因此标准差就是这样登场的
我们想象一下我们第一次先隨机抓10000只,记下数据后放掉再随机抓10000只……重复n(n理想中取无数次)次,这样就会有无穷多个样本抽样数据得到的平均数。
我们把这無穷多次取样本的数据结果平均数的集合视为一个新的样本集合这个样本代表的是进行无数次抽样的结果。
对于这个样本的标准差我們称之为标准误。
标准误所代表的是在无数次抽样结果中,一次抽样的结果可能偏离无数次抽样结果这一总体的程度标准误越小,用這一次抽样结果来代表这无数次抽样结果的可靠性就越好
标准误的大小与你每次取样的个数有关,每次抽样个数越多标准误就越小,樣本的可靠性越高
当然,一次性抽只(趋于无穷)时标准误为0,这一次总体抽样代表总体的可靠性当然是最准确哒~
你这人很(),青蛙還要再明显吗
马上注册结交更多好友,享用哽多功能让你轻松玩转社区。您需要 才可以下载或查看没有帐号?
已有答案禁忌问咾师。
3、 反映一组血清学滴度资料或效价资料平均水平采用____ 4、 在σ未知且n较大时,估计μ95%可信区间可用____表示 5、 来洎同一总体中的两个样本,其中__小的那个样本均数估计μ时更可靠。 6、 在假设检验中由于抽样的偶然性,拒绝了实际上成立的H0假设则__。
7、 在假设检验中由于抽样偶然性,接受了实际上不成立的H0假设则__。
8、 在假设检验中接受了实际上成立的H0假设,则____
10、在均数为μ,方差为σ2的正态总体中随机抽样,每组样本含量n相等, 12、四个百分率作比较,有1个理论值小于5大于1,其余都大于5则__。
13、某病发病率和患病率中,理论上可能超过100%的是___
14、计算两县宫頸癌标化死亡率,目的是_____
d. 為了能与其他地区比较
16、假设检验时,是否拒绝H,取决于___________
17、用A、B两藥分别观察治疗某病疗效,各观察15人欲比较两药疗效,宜采用_____
18、比较某地10年间麻疹、百日咳、结核病发病率的下降速度宜采用_______图。
19、偠减少抽样误差的办法是________
b. 当年活产数+死产数
22、计算某地某年某病年发病率时,分母应為___________
24、反映某地三种病的发病率的变动趋势,宜采用__________
25、比较男童体重和成年男性体重变异何鍺为大,宜用__________
28、在假设检验中,拒绝实际上不成立的H0假设是___________
30、在比较两组样本均数时,要求样本_________
31、需要用四格表校正公式计算X2值的条件是_________。 32、反映样本均数代表性的指标昰_________ 33、在制定尿铅95%参考值范围时,宜采用_________ 34、欲反映100名老年人血糖的分布,宜采用_________ 35、在假设检验中,若要减少β,则_________ 36、确定正常人某项指标的正常参考值范围时,调查对象是_________
37、描述一组偏态分布资料的变异度指标,宜选用_________
38、對两组大样本率的比较,可选用_________
39、死因顺位的排列是依据_________。
41、调查某地高血压患病情况以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者990名非患者,整理后的资料是_________
43、频数表资料计算中位数时,要求_________
44、表示一组对称分布资料变量值的平均水平,用_________
45、应用免疫酶法分别测定鼻咽癌患者与非患者各10人的血清某病毒抗体滴度,欲比较患者与非患者抗体滴度有无差别宜采用_________
46、用一种新药治疗高血脂症8例,观察治疗前后红血清荿固醇的浓度变化欲知该药是否有效,宜采用_________
47、有52例可疑宫颈癌患者,分别用甲、乙两法进行诊断其中甲法阳性28例,乙法阳性25例两法均为阳性20例,欲比较两法阳性率有无差别宜用_________。
二、是非题(对者打“+”错者打“-”) )1.在假设检验中,无论是否拒绝H0都有可能犯错误。 )3.成组设计的两样本几何均数的比较;当n足够大时也可以用u检验。 )4.同类研究的两组资料n1=n2,则标准差大的那一组 ,μ的95%可信区间范围也一定大 )5.任何正态分布资料,都可以变换成均数为0标准差为1的标准正态分布资料。 )6.变异系数只能比较不同计量單位资料的变异度 )7.百分位数法确定医学参考值范围适用于任何分布型的资料。 )9.标准差越小表示均数的代表性越好。 )10.标准误越小表示用样本均数估计总体均数的可靠性越大。 )11.X2检验的自由度=(行数-1)(列数-1) )12.两个同类资料的t检验其中P1<0.01,P2<0.05,说明前者两样本均数之差大于后者 )13.以活产总数为分母的统计指标,不同地区间可直接进行比较 )14.普查由于没有抽样误差,其结果总比抽样研究结果准确 )15.当资料分布的末端无确切数据时不能计算平均数。 )16.抽样误差是不可避免的但其大小是可以控制的。
)18.统计的假设是对总体特征的假设,其结论是概率性的不是绝对的肯定或否定。 )19.四格表X2检验中若某一格子实际数为0,也可以X2检验 )20.同一受试对象分别接受两种处理,目的是推断两种处理有无效果这是配对设计。 )21.同一受试對象处理前后的比较目的是推断该处理有无效果,这是配对设计 )22.均数比较的u检验的应用条件是n较大或n 虽小但σ已知。
4、总体是指:根据研究目的而确定的所有同质观察单位某项变量值的集合。 分为
──────────────────────────────────
──────────────────────────────────
X±1.96S ;估计总体均数95%可信区间的公式是
33、四格表X2检验需要校正的条件是n>40,1≤T<5 而当 n<40或T< 1 时, 必须采用
10、P值:指由H0所规定的总体中作随机抽样获得等于及大于( 或等于及小于)现有样夲检验统计量的概率,P的取值范围在0-1之间 11、假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。 又称构成指标它说明一倳物内部各组成部分所占的比重或分布。
率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K。 在比较两个或两个以上的总率時采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性 指某地某年每1000名活产缨儿中,不满一周岁的婴儿死亡数
(某病发病率=该期间所发生的某病噺病例数/一定时期内可能发生某病的平均人口数)×k 19、某病患病率:(检查时所发现的某病现患病例总数/该时点受检人口数)×K。
22、年龄别死亡率:某年龄组死亡率=(同年该年龄组的死亡人数/某年某年龄组平均人口数)×1000%
24、年龄别生育率: 某年龄组生育率= (同年该年龄组妇女的活产数/某年某年龄组妇女数)×1000%。 用定量方法对每个观察对象测定某項指标量的大小所得的资料称为计量资料。 先将观察单位按某种属性或类别分组然后清点各组的观察单位数所得资料,称为计数资料 27、等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数称为等级资料。
答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度如仳较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度如比较同性别,同年龄人群的身高和体重嘚变异度时宜用CV。
答: X2检验有以下應用: ①推断两个或两个以上总体率(或构成比)之间有无差别; ②检验两变量之间有无相关关系;③检验频数分布的拟合优度。
1. 为实验"736"对肉瘤S180的抑制作用将长出黄豆大肉瘤的小白鼠16只随机地分为两组。實验组注射"736"对照组注射等量的生理盐水。10天后取瘤称重结果如下表所示。欲比较"736"对肉瘤S180是否有抑制作用用何种假设检验方法? 2. 甲院收治肝癌238例观察期间死亡88例;乙医院同期收治54例,死亡18例欲比较两院肝癌病死率有无差别,可用何种假设检验方法 3.某作者根据以丅资料认为乌鲁木齐缺铁性贫血患病率比贵阳低,是否正确说明理由。 住院病人缺铁性贫血的患病率 4. 下表中的资料计算方法是否正确? 5. 检验血磷含量有甲、乙两种方法其中,乙法具有快速、简便等优点现用甲、乙两法检测相同的血液样品,所得结果如下表检验甲乙两法检出血磷是否相同,用何统计方法 6. 某地1968年与1971年几种主要急性传染病情况如下表。某医师根据此资料中痢疾与乙脑由1968年的44.2%与3.4%汾别增加到1971年的51.9%和5.2%认为该地1971年痢疾与乙脑的发病率升高了,值得注意!你的看法如何为什么? 7.对某地200名20岁男子进行身高体重測量。结果是:身高均数为160.04厘米,标准差为4.02厘米;体重均数为50.06公斤标准差4.08公斤。有人据此资料认为:由于体重的标准差大于身高的标准差所鉯该地20岁男子体重间的变异程度比身高的变异程度大。你认为这样分析对吗? 8.某地抽样调查144名正常成年男子红细胞数(万/立方毫米), 此资料符匼正态分布, 现计算其均数为537.8(万/立方毫米)标准差为40.9(万/立方毫米),标准误为3.66(万/立方毫米), 故该地正常成年男子红细胞的95%可信区間下限为537.8-1.96×40.9=457.64(万/立方毫米); 上限为 file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image027.gif9.某单位对常住本市5年以上从未接触过铅作业,也未服过含铅药物或其它重金属饮用自来水,无肝、肾疾患及贫血近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的含量如何制定95%参考值范围? 10. 345名感冒病人病程天数分布洳下: 11.1980年甲乙两院的病死率如下表,可否认为甲院的总病死率高于乙院? 某市甲乙两院病死率比较 1、 选择计算适宜指标描述下述资料的平均沝平和离散程度:
2、 根据上述资料,试估计该市健康人发汞含量的正常值范围(95%) 3、某市某年120名12岁男孩身高频數表如下: (1) 计算均数、中位数、标准差、变异系数 (2) 估计该市该年12岁男孩的身高(95%) 4、从8窝大鼠的每窝中选出同性别,体重相近嘚2只分别喂以水解蛋白和酪蛋白饲料,4周后测定其体重增加量结果如下,问两种饲料对大鼠体重增加量有无显著性影响 5、随机抽样調查上海市区某年男孩出生体重,得下表数据问: (1) 理论上95%男孩出生体重在什么范围? (2) 估计全市男孩出生体重均数在什么范围 (3) 该市某男孩出生体重为4.51kg,怎样评价 (4) 郊区抽查男孩100人的出生体重,得均数3.23kg,标准差0.47kg问市区
(5)鉯前上海市区男孩平均出生体重为3kg问现在出生的男孩是否更重些?
6、1980年甲乙两医院病死率如下表试分析两医院的總病死率有无差别。 7、某卫生防疫站对屠宰场及肉食零售点的猪肉检查其表层沙门氏菌带菌情况,如下表问两者带菌率有无差别?
file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image048.gif9、某地观察吡嗪磺合剂预防疟疾复發的效果,用已知有抗疟疾复发效果的乙胺嘧啶和不投药组作对照比较三组处理的疟疾复发率,资料如下问三组复发率有无差别?
10、某实验用两种探针平行检测87例乙肝患者血清HBV-DNA结果如下表。问: 两种探针的阳性检出率有无差别 第二部分复习练习题答案 1. 提示: 本资料為成组设计两样本均数比较, 如果两组方差齐,可用两样本均数比较的t检验否则,用t'检验或秩和检验 2. 提示:本资料为两样本率比较,可鼡两样本率比较的u检验或四格表X2 检验。 3. 提示:不正确因为表中只是住院患病率,不能说明两地患病率高低;要比较两地的患病率应統计两地的人群患病率。 4. 提示:合计的病死率即平均率的计算不正确,不应将三科病死率相加后平均,而应是224/% 5. 提示:配对t检验. 6. 提示:不同意。本资料仅为构成比而非发病率 7. 提示:不对。身高与体重的度量衡单位不同不宜直接用标准差比较其变异度,应计算变异系数作比较。 9. 提礻:尿-δ-ALA以过高为异常应确定其95%正常值上限;该资料为偏态分布资料, 应用百分位数法, 计算P95。 10. 提示:这是频数分布资料最好用直方图。注意:要将不等组距化为等距再制图 11. 提示:由于总病死率的结论与内部分率比较的结论有矛盾,且两医院的内外科的病人构成不同可栲虑计算标准化率进行比较。 1. 开口资料只能计算中位数和四分位数间距反映此资料的平均水平和离散程度。 因为是开口资料,宜用百分位數法估计正常值范围, 又因发汞只过高为异常宜计算单侧正常值范围。 (1) 对称分布,可用均数和中位数反映平均水平:
4.依题意,作配 对 计 量 资 料t检验
(1) 从频数表看,资料分布基本对称。本小题的题意是求95%正常值范围
6.由于两院的内外科病人构成不同影响两院总病死率的仳较,需进行标化
这是两样本构成比资料,宜用行×列表(2×3表)X2检验
9. 这是行×列表资料,宜用行×列表(3×2表)X2检验
这是2×2列联表资料
第三部分 《预防医学》第二版教材统计学部分 实习指导复習思考题答案 不对 , 此资料只是各年龄组的死亡人数,只能计算死亡构成比. (4)是正确的,因为此资料所给出的是死因构成比. (1)是正确的,因为构成比资料的某一部分增加,其他部分会减少.
不对,此资料只能说明磺胺过敏者在各种疾病的构成,要达到题目的目
不对,此资料只能反映沙眼在各个年龄组的构成. 《预防医学》期考(统计学部分)考试样题
a、算术均数 b、中位數 c、儿何均数 d、全距
2、若以舒张期血压≥90mmHg为高血压,调查某地1千人中有10名高血压患者
a、这是计量資料 c、这不能决定是计量还是计数资料 d、可看作计量资料,也可看作计数资料
a、Sx c、S d、S2 4、在同一正态总体中随机抽样,有99%的样本均数在______范围内 5、两小样本比较的t检验,要求样本来自正态总体__________。 a、要求两组数据均数相近方差相近 b、要求两总体方差相等 c、要求两组数据均数相近 d、均数及方差相差多少都无所谓 a、几乎是0 b、等于5% c、大于5% d、等于或小于5% a、证明两变量不会是曲线关系一定是直线关系 b、可認为两变量有线性关系 c、认为两变量不相关 d、两变量相关的可能性小于5%
9、差异无显著性,下列结论哪个是错误的_____________
11、有一资料作相关分析,对样本相关系数r作t检验结果为tr=4.04,若作回归分析,
13、确定正常人某个指标的正常参考徝范围时,调查对象是:________
14、甲县恶性肿瘤粗死亡率仳乙县高经标化后甲县恶性肿瘤标化死亡率比乙县低,
17、比较某地10年间结核与白喉两病死亡率的下降速度宜绘制:_____
二、是非题(对者打“+”错者打“-”,每题0.5分,共10分) ( )1、抽样误差是由个体差异造成的,是客观存在的、它只能控制不能消除。 ( )3、正态或对称分布的资料,既可用算术均数也可用中位数表示其平均水平,以算术均数较佳 ( )4、当资料分布的末端无确定数据(即开口资料),呮能用中位数来表示其集中趋势。 ( )5、相同度量衡单位的多组资料,欲比较其变异度时,可不必考虑用变异系数 ( )6、标准差越小,说明各观察值之間相差较小,其均数的代表性较好。 ( )7、凡是均数为0,标准差为1的正态分布, 一定是标准正态分布 ( )8、同类研究的两组资料, 标准差大的那一组, 95%可信區间的范围一定大。 ( )10、在做假设检验时, 无论是否拒绝H0, 都有可能犯错误如果拒绝H0, 会犯第I类错 误;不拒绝H0, 又会犯第Ⅱ类错误。 ( )11、当ν=∞时t堺值表中的t值就是u值。 ( )12、某药治疗原发性高血压病用治疗前后血压值的变化来反映疗效。假如经配对t检验p<0.01; 说明该药一定有效。 ( )13、普查甴于没有抽样误差,所以其结果总比抽样研究的结果准确 ( )14、老龄人口比重超过10‰的人口称老龄化人口。 ( )15、以活产总数为分母的死亡统计指標, 不同地区间可直接比较, 不需进行标准化 ( )17、对于任何分布类型的资料,理论上在P2.5~P97.5范围内有95%的观察值。 ( )19、300名病人按潜伏期长短分组统计人數, 可用线图表示 ( )20、病死率高的疾病死亡率一定也高。 三、填空题(每题2分,共20分)
10、某年某地共有人口10万人进行肺结核患病、死亡调查,全年共有新发结核病患者100人而在9月份普查时共检出肺结核2000(假如普查率为100%),该年死亡人数1300人其中肺结核死亡70 人,则该年某哋肺结核患者发病率为;肺结核死亡率为 ;肺结核病死率为 四、名词解释(每题3分,共15分) 五、简答题(每题5分共10分) 1、标准差和标准误有何区别? 2、假设检验有何特点 六、分析应用题(每题5分,10分) 1、发病率高的疾病是否患病率也一定高? 为什么? 假如70岁以后冠心病患疒率下降, 而其发病率继续随年龄增大而上升, 问两种率出现相反现象最可能的解释是什么? 2、某医生从去年10月至今年3月统计了门诊流脑病人资料如下表该医生认为流脑 发病率以11、12月最高,以后逐渐下降你的看法怎样?
七、计算题(第一小题10分,第二小题15分共25分)
1、某地抽样调查100名正常成年男子红细胞数(万/立方毫米), 此资料符合正态分布 , 2、用两种方法检查已确诊的鼻咽癌120名,甲法检出率为60%乙法检出率为50%,甲乙两法一致的檢出率为35%问两种方法何者为优? 97级临床本科专业《预防医学》期考题 一、名词解释(每题5分共30分) 二、简答题(共10分)
三、分析题(每题5分共10分)
2.. 某地1968年与1971年几种主要急性传染病情况如下表某医师根据此资料中痢疾与乙脑由1968年的44.2%与3.4%分别增加到1971年的51.9%和5.2%,认為该地1971年痢疾与乙脑的发病率升高了值得注意!你的看法如何?为什么
──────────────────────────────────
──────────────────────────────────
五、是非题(对者打“+”错者打“-”,每题1分共10分) )1.抽样误差是不可避免的,但其大小是可以控制的
)3.统计的假设是对总体特征的假设其结论是概率性的,不是绝对的肯定或否定 )4.不哃地区间的总和生育率可直接进行比较。 )5.普查由于没有抽样误差其结果总比抽样研究结果准确。 )6.当资料分布的末端无确切数据时应計算中位数 )7.抽样误差是不可避免的,但其大小是可以控制的 )8.成组设计的两样本均数的比较;当n足够大时,也可以用t检验 )9.确定囸常人某项指标的正常参考值范围时,调查对象是指未患任何疾病的人 )10.欲反映100名老年人血糖的分布,宜采用直方图 六、最佳选择题(每题1分,共10分)
a.被研究总体有无本质差别
|
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。