医学统计学第七版课后答案及解析

来源：意榕旅游网

医学统计学第七版部分课后答案及解析

第二章

1. 答：统计学中用来描述集中趋势的体系是平均数，包括算术均数，几何均数，中位数。均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数：有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化（等比关系），此时不宜用算术均数描述其集中位置，而应该使用几何均数（ geometric mean）。几何均数一般用 G表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。

中位数和百分位数：

中位数（ median）就是将一组观察值按升序或降序排列，位次居中的数，常用 M表示。理论上数据集中有一半数比中位数小，另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。所谓“开口”资料，是指数据的一端或者两端有不确定值。

百分位数（percentile ）是一种位置指标，以 PX表示，一个百分位数 PX将全部观察值分为两个部分，理论上有 X％的观察值比 PX小，有（ 100- X）％观察值比 PX大。故百分位数是一个界值，也是分布数列的一百等份分割值。显然，中位数即是 P50 分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。

2. 答：常用来描述数据离散程度的指标有：极差、四分位数间距、标准差、方差、及变异系数，尤以方差和标准差最为常用。

极差（range ，记为 R），又称全距，是指一组数据中最大值与最小值之差。极差大，说明资料的离散程度大。用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是： 1. 不灵敏； 2. 不稳定。四分位数间距（ inter-quartile range ）就是上四分位数与下四分位数之差，即： Q＝QU－QL , 其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。常用于描述偏态分布资料的离散程度。

极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反映资料的离散程度。

方差（ variance ）和标准差（ standard deviation ）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。

3. 答：常用的相对数指标有：比，构成比和率。

比（ ratio ），又称相对比，是 A、B两个有关指标之比，说明 A为 B的若干倍或百分之几，它是对比的最简单形式。其计算公式为比＝ A/B

率（rate）又称频率指标，用以说明某现象发生的频率或强度。常以百分率（％）、千分率（‰）、万分率（1/ 万）、十万分率（1/10 万）等表示。计算公式为：

率

实际发生某现象的观察单位数

比例基数（ K ）

可能发生某现象的观察单位总数

构成比（proportion）又称构成指标，它说明一种事物内部各组成部分所占的比重

或分布，常以百分数表示，其计算公式为：

某一组成部分的观察单位数

构成比

同一事物内各组成部分的观察单位总数

4. 答：当比较两类事物的总率时，如果此两同类事物的内部构成，特别是某项能影响指标水

100%

平的重要特征在构成上不同，往往会高估或低估总率。在这种情况下，直接进行两个总率的比较，会产生错误的结论。此时，必须首先设法消除这种内部构成上的差别，才能进行比较。统计学上将这种方法称为率的标准化 (standardization method of rate) ，即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法，调整后的率为标准化率，简称为标化率。

1) 编制频数分布表并绘制频数分布图，简述这组数据的分布特征；

ycneuqer

108.00 111.00 114.00 117.00 120.00 123.00 126.00 129.00 132.00 135.00

''height (cm)''

组段

108 111~ 114~ 117~ 120~ 123` 126~ 129~132

频数

3 10 22 38 20 18 7 2 120

; 累计频数组中值

频率 (%) (%) 2.5 8.33 18.33 31.67 16.67 15 5.83 1.67

2.5 10.83 29.17 60.83 77.5 92.5 98.33 100

109.5 112.5 115.5 118.5 121.5 124.5 126.5 129.5

合计

100

(2) 计算中位数、均数、几何均数，用何者表示这组数据的集中位置好？答:

X 3 109.5 10 112.5 22 115.5 38 118.5 20 121.5 18 124.5 7 126.5 2 139.5 /120

=119.4135

Xg lg lg3 109.5 lg10 112.5 lg22 115.5 lg38 118.5 lg20 121.5 lg18 124.5 lg7 126.5 lg2 139.5 /120 =119.25125

Md 116.63

用均数较好 .

(3) 计算极差、标准差，用何者表示这组数据的离散趋势好？答: 极差： 22.62

四分位数间距： 5.915 标准差： 4.380736 用标准差表示较好 .

6．答：本例频数分布为偏态分布，长尾拖向 x 轴正方向，故为正偏态。适宜用中位数表示其平均水平，中位数为 4，四分位数间距为 4。

7.40 名麻疹易感儿童接种麻疹疫苗后个月，血凝抑制抗体滴度如下

试计算平

均滴度。

抗体滴度 1:4

人数 1

几何

exp((ln(4) +5×ln(8)+16 ×ln(16)+2

1:8 5

1:16 1:32 1:64 1:128 6

2 7 10

1:256 1:512

4 5

均数

：

×ln(32)+7 ×ln(64)+10 × ln(128)+4 ×ln(256)+5

×ln(512))/40) ＝128

观察结果不会影响到其他观察单位的结果。

7 二项分布和正态分布之间的关系：随着 n 的增大，二项分布逐渐逼近正态分布。当 nπ 较大时，二项分布 B(n, π) 近似正态分布。

举例：病人的治愈与不治愈，理化检验结果的阴性与阳性，个体的发病与不发病等属于二项分布资料；某地区 12 岁男孩的身高，某学校同年级女生的体重等属于正态分布。第四章

标准差标准误描述样本均数的离散称度 1、标准误越小，说明样本不同：意义上：应用上：描述一组变量值的离散程度 1、标准差越小，说明变量值围绕均值分布越紧密，均均数和总体均数的差异越数的代表性越好。小，用样本均数估计总体均数的可靠性越大。 2、 x u s 估计变量值的分 2、用 x t sx 估计总体均数的与 n 的关系：相同：布范围。 n 越大，标准差越稳定可信区间。 n 越大，标准误越小 1、都是描述变异度的统计指标 2、 x x x 与 x 成正比，与 n 成反比； 3、n 一定时，同一组资料，标准差越大，标准误也越大。 2 α 水准是在假设检验之前确定的，说明按不超过多大的误差为条件作结论，是犯Ⅰ型错误

的最大风险，是事前概率； P 值是指由 H0所规定的总体作随机抽样，获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝 H0，是事后概率。

两均数差值的总体均数的可信区间表达公式：

x1 x2

d t ,n 1sd

nnn

2 2

3 ①配对设计的差值的总体均数的可信区间表达公

式：可以用可信区间回答假设检验的问题。可信区间估计与假设检验时统计学中两种重要的、②

独特的思维方式，它们在原理上相通，均基于抽样误差理论，只是考虑问题的角度不同。例如：样本均数与总体均数的比较，用可信区间的估计方法，观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数，即可推断该样本是否来自已知均数的总体；用假设检验的方法，先假设样本均数代表的总体均数等于某已知的总体均数，再判断样本提供的信息是否支持这种假设。

拒绝实际上成立的 H0，这类“弃真”的错误称为Ⅰ型错误或第一类错误；不拒绝

实际上是不成立的 H0，这类“存伪”的错误称为Ⅱ型错误或第二类错误。第一类错误的概率用 α 表示，第二类错误的概率用 β 表示。α 越大，β 越小；反之，α 越小，β 越大。

拒绝 H0，只可能犯第一类错误，不可能犯第二类错误；不拒绝 H0，只可能犯第二类

错误，不可能犯第一类错误。

由于假设检验中可能犯第一类错误或第二类错误，所以结论不能绝对化。 5 t 检验的应用条件：独立性、正态性、方差齐性。 u 检验的应用条件：适用于大样本资料。

t 检验和 u 检验的关系：随自由度的增加， t 分布逐渐趋向于标准正态分布。因此 u 检验是 t 检验的一种近似检验方法。当自由度大于 50 时，近似程度比较满意。

6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体，并对总体做出适当的结论。

假设检验应注意的问题：

① 要有严密的抽样研究计划：要保证样本是从同质总体中随机抽取，除了对比的因素外，其

他影响结果的因素应一致。

② 选用的假设检验方法应符合应用条件。 ③ 结论不能绝对化。

④ 正确理解差别有无显著性的统计意义：差别有统计意义或有显著性，指我们有很大的把握

认为原假设不成立，并非是说它们有较大差别；差别无统计学意义或无显著性，我们只是认为以很大的把握拒绝原假设的理由还不够充分，并不意味着我们很相信它。 ⑤ 统计学意义与其他专业上的意义不同。

7 H 0：矽肺患者的血红蛋白与健康人相同，即 H 1：矽肺患者的血红蛋白与健康人不同，即

=μ 0

μ≠μ 0

α=0.05

|12.59 14.02 | 1.63/ 10

2.7743

ν= 10 -1=9 ，t 0.05,9 =2.262认为矽肺患者的血红蛋白与健康人不同。

8 H0：新药与常规药物的疗效没有差别，即 μ 1=μ2 1= H 1：新药与常规药物的疗效不同，即 μ1≠μ 2 α=0.05 t

x 1 x

=1.2823

22 1

2 2

1 1

ν=n1+n2-2=20-2=18 ，t 0.05,18 =2.1010.05 ，不拒绝 H0，差别无统计学意义，尚

不能认为新药与常规药物的疗效不同。

1 不满足正态近似条件，所以采用直接计算概率法

H0：加维生素 C的治愈率与不加相同，即 π=π 0=0.6

H1：加维生素 C的治愈率高于不加维生素 C，即 π>π 0 α=0.05

P(X≤8)=1 - P(X≥9)=1 -P(X=9)-P(X=10)=1-C 109*0.6 9*0.4 1-C1010*0.6 10*0.4 0= 0.9536>0.05 不拒绝 H0，差别无统计学意义，可以认为加维生素 2 满足正态近似条件，采用正态近似法。

H0：经健康教育后的高血压患病率与以前相同，即 π=π 0=0.6 H1：经健康教育后的高血压患病率比以前降低，即 π<π 0

C 的治愈率与不加相同。

单侧 α=0.05

1 0 /n

4.9453536

u>u0.05, 单侧 =1.64

p<0.05 ，拒绝 H0 ，接受 H1，差别有统计学意义，可以认为经健康教育后的高血压患病率与以前有差别。

3①建立检验假设和确定检验水准

H 0：男女大学生 HBV感染对其心理影响相同，即 π1 =π2 H 1：男女大学生 HBV感染对其心理影响不同，即 π1≠π2 检验水准 α=0.05 ② 计算检验统计量

χ 2=( ad-bd )2*n/(a+b)(c+d)(a+c)(b+d) =(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651

ν=1

③ 确定 p 值

查 χ 2届值表，得 p<0.05 ④ 统计推断

按 α =0.05 水准，拒绝 HO，接受 H1，差别有统计学意义，可以认为 HBV感染对不同性别的大学生在心理行为方面的影响不同。 4①建立检验假设和确定检验水准 H 0：两组的治愈率相等，即 π1 =π2 H 1：两组的治愈率不等，即 π1≠π2 检验水准 α=0.05 ②Fisher 精确概率法

P(i) = 0.280>0.05

③ 统计推断

按 α =0.05 水准，不拒绝 H0，差别无统计学意义，尚不能认为两组治愈率有差别。

5①建立检验假设和确定检验水准

H 0：治疗三种类型病人的有效率相同，即 π1 =π2 =π3

H 1：治疗三种类型病人的有效率不等或不全相等。检验水准 α=0.05

②计算检验统计量

Ai Ti n Ti

A2 1

RnC

2+ 42 2 + 24 2 +1042 = 286* 712 + 27

199*98 87*98 199*146 87*146 199*42 87*42

+182 -1 )=3.6389

③确定 p 值

查 χ 2界值表，得 p>0.05 ④ 统计推断

按 α=0.05 水准，不拒绝 H0，拒绝 H1 ，差别无统计学意义，尚不能认为治疗三种类型病人的有效率有差别。

6①建立检验假设和确定检验水准

H 0：该三种人群有相同的血型分布，即 π1 =π2 =π3 H 1：该三种人群的血型分布不等或不全相等。

检验水准 α=0.05 ②计算检验统计量

Ai Ti 2 A2

2 i i

n 1

2 2

nRnC

＝ 9312* ( 6792 +134 2 + ⋯⋯ 3720*1883 788*1883 546*6522 ③ 确定 p 值

+ 4352

- 1

)= 71.180

查 χ 2界值表，得 p<0.05 ④ 统计推断

按 α =0.05 水准，拒绝 H0，接受 H1，差别有统计学意义，可以认为三种人群的血型分布不等或不全相等。第八章

1 答：适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。

2 答：属于非参数检验。因为参数检验针对的是总体变量服从某种分布，即具有某个已知的函数形式，而其中的参数是未知的，统计分析的目的就是对这些未知参数进行估计或检验。但本题即使 n1 > 10， n2－ n1 > 10 时采用的是 u 检验，但它比较的是分布而不是参数，所以它还是属于非差数检验。

3 答：有序分类资料可做秩和检验、等级相关分析。

4 答：（一）建立检验假设 H0：两种药的治疗效果总体分布相同；

H 1：两种药的治疗效果总体分布不同；

α＝ 0.05 ；

（二）编秩和求秩和 T

两组治疗心绞痛疗效比较人数合计秩次疗效（1）缓释片普通片（2）（ 3）平均秩次（6）（7）秩和缓释片普通片（8）范围（4）（5）显效有效无效加重

62 18 5 3 n1＝88

35 31 14 4 n2＝84

97 49 19 7

1－97 98－146 147－165 166－172

49 122 156 169

3038 2196 780 507 6521

1715 3782 2184 676 8357

合计

172

（三）计算检验统计量 T 由于 n1 > n 2 , 则取 n2 组的秩和为 T，故检验统计量

T＝T2＝8357。

（四）确定 P 值，做出推断结论

由于 n2>10 ，T分布已接近均数为 n1 （N＋1）/2 ，方差为 n1 n2 （N＋1）/12 的正态分布，按

书上式（ 8.3 ）（8.4 ）求出 uc =3.7439

u c > 2.56, P<0.01, 按 α＝ 0.05 水准拒绝 H0 ，接受 H1，差异有统计学意义。可以认为缓释片和普通片治疗心绞痛的疗效有差别。

5 答：（一）建立检验假设 H0：治疗前后 HCG值的总体分布相同；

H 1：治疗前后 HCG值的总体分布不同；

α＝ 0.05 ；

（二）计算检验统计量 T

肿瘤患者灌注治疗前后 HCG值病例号治疗前治疗后（1） 1 2 3 4 5 6 7 8 差值（4） 1070000 72200 10240 1499907 7500 8497 10763 3309 7 6 4 8 2 3 5 1 秩次（5）（2） 1280000 75500 12450 1500000 10000 9700 15588 4223 （3） 210000 3300 2210 93 2500 1203 4825 914 T ＋＝36 T －＝ 0

本例 T＋＝36 ，T－＝0，任取 T＋或（T－）作为检验统计量 T，本例取 T＋＝36 。（三）确定 P 值，做出推断结论

由于 n<50 ，查附表 9，T 界值表。本例 n＝8，T＝36，查附表 9，得 α＝ 0.05 时的 T界值为 5－ 31，T在双侧界值范围外，故 P<0.05 。按 α＝ 0.05 水准拒绝 H0，接受 H1，差异有统计学意义。可以认为肿瘤患者灌注治疗前后 HCG值有差别。

6 答：（一）建立检验假设 H0：三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同；

H 1 三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同；

α＝ 0.05 ；

（二）计算检验统计量 T

卵巢功能异常患者血清中促黄体素的含量

卵巢发育不良（1） 44.10 42.50 40.50 38.31 35.76 35.12 33.60 31.38 R i n i 秩次（2） 24 23 22 21 20 19 18 17 丘脑性闭经（3） 6.71 3.32 4.59 1.67 10.51 9.45 1.74 10.21 秩次（4） 10 6 7.5 1 14 11.5 2 13 垂体性闭经（5） 4.59 2.75 11.14 5.98 1.90 2.10 9.45 10.86 秩次（6） 7.5 5 16 9 3 4 11.5 15 71 8 164 65 8 8 按书上式（ 8.5 ）求出 H=15.4184

（三）确定 P 值，做出推断结论

由于 k=3, 每组例数 ni ＝9 ，查附表 11，H界值表得 P<0.01。按 α＝ 0.05 水准拒

绝 H0 ，接受 H1，差异有统计学意义。可以认为三种卵巢功能异常患者血清中促黄体素的含量有差别。

7 答：（一）建立检验假设 H0：针刺三个穴位的镇痛效果的总体分布相同；

：针刺三个穴位的镇痛效果的总体分布不全相同或全不相同；

α＝ 0.05 ；

（二）计算检验统计量 T

针刺三个穴位的镇痛效果各穴位的观察频数合计镇痛效果＋＋＋＋＋＋＋＋＋＋合计合谷（1） 38 44 12 24 118 足三里扶突（2）（ 3） 53 29 28 16 126 47 23 19 33 122 秩次范围（4）（5） 138 96 59 73 各穴位的观察频数平均秩次合谷足三里扶突（6）（1）（2）（3） 69.5 2641 8206 3168 7920 21935 3683.5 5408.5 7392 5280 21764 3266.5 4289.5 5016 10890 23462 1－138 139－ 234 186.5 235－ 293 264 294－ 366 330 366 按书上式（ 8.5 ）求出 H=2.4143

（三）确定 P 值，做出推断结论

由于 k=3, 每组例数 ni>9 ，已超出附表 11的范围，故按 v＝k－1＝2，查附表 8， χ2界值表，得 P>0.05。按 α＝ 0.05 水准不拒绝 H0，差异无统计学意义。故尚不能认为针刺不同穴位的镇痛效果有差别。

第三章

1 正态分布与标准正态分布的区别：

正态分布是一簇单峰分布的曲线，μ 和 σ 可以有任意取值；标准正态分布是一条单峰曲线，μ 和 σ 有固定的值，μ =0，σ =1。

2 u = (x- μ )/ σ = ( μ - σ - μ )/ σ = -1

查标准正态分布表，得 Φ(-1)=0.1587 ，所以小于 μ- σ 者所占的比例为 15.87%。

3 医学参考值范围的含义：是根据正常人的数据估计绝大多数正常人某项指标所在的范围。选定同质的正常人作为研究对象。所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。

确定原则：①选定同质的正常人群作为研究对象

② 控制检测误差 ③ 判断是否分组 ④ 单、双侧问题 ⑤ 选择百分界值

⑥ 确定可疑范围方法：①正态分布法：适用于服从正态分布或近似正态分布的资料

②百分位数法：适用于不服从正态分布的资料 ③对数正态分布法：适用于对数正态分布的资料 4 如果资料服从正态分布，那么双侧 95%正常值范围为 μ±1.96 σ；如果资料不服从正态分布，那么双侧 95%正常值范围就不能用正态分布来做。

0 0 10 1 1 9

5 1 人以下的概率： P(x≤1)=P(0)+P(1)=C 1000.2 00.8 10+C10* 10.2 10.8 9 =0.375 8 人以上的概率：

P(X≥8)=P(8)+P(9)+P(10)=C 1080.2 80.8 2+C1090.2 90.8 1+C10100.2 10 40.8 0 =7.79 ×105 6 *

6 二项分布的应用条件：

①观察单位只能有互相对立的两种结果之一。

② 已知发生某一结果的概率 π 不变，其对立结果的概率则为 1- π

③ n 次试验在相同的条件下进行，且各观察单位的结果互相独立，即每个观察单位的

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文