您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页统计学第五版课后练答案章

统计学第五版课后练答案章

来源:意榕旅游网


第四章 统计数据的概括性度量

4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:

(1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。 解:

Statistics

汽车销售数量 N Mean Median Mode Std. Deviation Percentiles

25 50 75 Valid Missing

10 0 9.60 10.00 10 4.169 6.25 10.00 12.50 Histogram32Frequency1Mean =9.6 Std. Dev. =4.169 N =1002.557.51012.515汽车销售数量 4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 单位:周岁

19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23

要求;

(1)计算众数、中位数:

排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄

Frequency Percent Cumulative Frequency Cumulative Percent 1

15 16 17 18 19 20 21 22 23 Valid 24 25 27 29 30 31 34 38 41 Total 1 1 1 1 3 2 1 2 3 2 1 1 1 1 1 1 1 1 25 4.0 4.0 4.0 4.0 12.0 8.0 4.0 8.0 12.0 8.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 4.0 100.0 1 2 3 4 7 9 10 12 15 17 18 19 20 21 22 23 24 25 4.0 8.0 12.0 16.0 28.0 36.0 40.0 48.0 60.0 68.0 72.0 76.0 80.0 84.0 88.0 92.0 96.0 100.0 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差;

Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773

(5)对网民年龄的分布特征进行综合分析:

分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图: 32Count10151617181920212223242527293031343841网络用户的年龄为分组情况下的概率密度曲线: 2

3.02.5Count2.01.51.0151617181920212223242527293031343841网络用户的年龄 分组: 1、确定组数:

lg25lg(n)1.398115.,取k=6 K1lg(2)lg20.301032、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5

3、分组频数表

网络用户的年龄 (Binned)

<= 15 16 - 20 21 - 25 Valid 26 - 30 31 - 35 36 - 40 41+ Total Frequency 1 8 9 3 2 1 1 25 Percent 4.0 32.0 36.0 12.0 8.0 4.0 4.0 100.0 Mean Std. Deviation Variance Skewness Kurtosis Cumulative Frequency 1 9 18 21 23 24 25 23.3000 7.02377 49.333 1.163 1.302 Cumulative Percent 4.0 36.0 72.0 84.0 92.0 96.0 100.0 分组后的均值与方差:

分组后的直方图:

3

108Frequency2Mean =23.30 Std. Dev. =7.024 N =25010.0015.0020.0025.0030.0035.0040.0045.0050.00组中值 4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:

5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求:

(1)画出第二种排队方式等待时间的茎叶图。

第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot

Frequency Stem & Leaf

1.00 Extremes (=<5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88 Stem width: 1.00

Each leaf: 1 case(s)

(2)计算第二种排队时间的平均数和标准差。

Mean 7 Std. Deviation 0.714143 Variance 0.51

(3)比较两种排队方式等待时间的离散程度。 第二种排队方式的离散程度小。

(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,均值小,离散程度小。

4.4 某百货公司6月份各天的销售额数据如下: 单位:万元

257 276 297 252 238 310 240 236 271 292 261 281 301 274 267 280 272 284 268 303 273 263 322 249

要求:

(1)计算该百货公司日销售额的平均数和中位数。 (2)按定义公式计算四分位数。 (3)计算日销售额的标准差。 解:

Statistics

百货公司每天的销售额(万元)

265 291 269 278 258 295

4

N Mean Median Std. Deviation Percentiles

Valid Missing

30 0

274.1000 272.5000 21.17472

25 50 75

260.2500 272.5000 291.2500

4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 单位成本 总成本(元) 名称 A B C (元) 15 20 30 甲企业 2 100 3 000 1 500 乙企业 3 255 1 500 1 500 要求:比较两个企业的总平均成本,哪个高,并分析其原因。 甲企业 乙企业 产品名称 单位成本(元) 总成本(元) 产品数 总成本(元) 产品数 A 15 2100 140 3255 217 B 20 3000 150 1500 75 C 30 1500 50 1500 50 平均成本(元) 19.411771 18.247368 调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。

4.6 在某地区抽取120家企业,按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200~300 300~400 400~500 500~600 600以上 合 计 要求: (1)计算120家企业利润额的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解:

Statistics

企业利润组中值Mi(万元) N Mean Std. Deviation Skewness

Std. Error of Skewness Kurtosis

Std. Error of Kurtosis

Valid Missing

120 0

426.6667 116.48445

0.208 0.221 -0.625 0.438 19 30 42 18 11 120

5

Histogram5040Frequency302010Mean =426.67 Std. Dev. =116.484 N =120200.00300.00400.00500.00600.00700.000企业利润组中值Mi(万元)Cases weighted by 企业个数 4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。

(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大? (2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?

(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大? 解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。 (2)不一定相同,样本量少的标准差大的可能性大。

(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。

4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?为什么?

女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。 (2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? 计算标准分数: Z1=

xx5560xx6560==-1;Z2===1,根据经验规则,男生大约有68%的人体重在55kgs5s5一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 计算标准分数: Z1=

xx4050xx6050==-2;Z2===2,根据经验规则,女生大约有95%的人体重在40kgs5s5一60kg之间。

4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想? 解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。 ZA=

xx115100xx425400==1;ZB===0.5 s15s50因此,A项测试结果理想。

6

4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制? 时间 周一 周二 周三 周四 周五 周六 周日 产量(件) 时间 周一 周二 周三 周四 周五 周六 周日 产量(件) 3850 3670 3690 3720 3610 3590 3700 日平均产量 3700 日产量标准差 50 标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 -2 -2 -2 -2 -2 -2 -2 标准分数界限 2 2 2 2 2 2 2 周六超出界限,失去控制。

4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求: (1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大? 成年组 幼儿组 平均 172.1 平均 71.3 标准差 4.201851 标准差 2.4966 离散系数 0.024415 离散系数 0.035016 幼儿组的身高差异大。

4.12 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:

单位:个 方法A 方法B 方法C 1 167 168 165 170 165 1 168 1 162 163 166 167 166 165 129 130 129 130 131 ]30 129 127 128 128 127 128 128 125 132 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 3 850 3 670 3 690 3 720 3 610 3 590 3 700 7

要求:

(1)你准备采用什么方法来评价组装方法的优劣? 均值不相等,用离散系数衡量身高差异。

(2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:对比均值和离散系数的方法,选择均值大,离散程度小的。

方法A 方法B 方法C

128.733333125.533333

平均 165.6 平均 平均

3 3

标准2.13139793标准标准2.77402921

1.751190072

2 7 差 差 差

离散系数: VA=0.01287076,VB= 0.013603237,VC= 0.022097949 均值A方法最大,同时A的离散系数也最小,因此选择A方法。

4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险? 标准差或者离散系数。

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 选择离散系数小的股票,则选择商业股票。

(3)如果进行股票投资,你会选择商业类股票还是高科技类股票? 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

第五章 概率与概率分布

5.1 略

5.2 P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35%

5.3 因为PABPABP(AB)=1/3;PBP(A(B+B))=P(AB)PAB=1/3

PAP(A(B+B))=P(AB)PAB=1/3-1/9=2/9

5.4

PABPABP(AB)P(AB)=1;

PA|BPAB/P(B)1/6; PAB1/6*1/31/18

PAP(A(B+B))=P(AB)PAB;PAB1/31/185/18

同理PBP(B(A+A))=P(AB)PAB;PAB=5/18

11/185/185/187/12

11/35.5 (1)P(A)PB0.8*0.70.56;(2)PA+BP(A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94 PA|BPAB/P(B) (3)PA+BP(A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38 5.6 P(B)P(A)PB|A96%*75%=0.72 5.7 PA|BPAB/P(B)1/22/3 3/4 8

5.8 贝叶斯公式:

PAk|BPAk|BPAk)P(B|Ak50%*50%45.45%

PAPB|A10%*20%50%*50%40%*70%PAk)P(B|Ak10%*20%3.63%

PAPB|A10%*20%50%*50%40%*70%PAk)P(B|Ak40%*70%PAk|B50.9%

PAPB|A10%*20%50%*50%40%*70%

5.9 贝叶斯公式:

PAk)P(B|Ak30%*0.1PAk|B0.249

PAPB|A30%*0.127%*0.0525%*0.218%*0.15PAk)P(B|Ak27%*0.05PAk|B0.112

PAPB|A30%*0.127%*0.0525%*0.218%*0.155.10 P(x=0)=0.25; P(x=1)=0.5; P(x=2)=0.25

5.11 (1) P(x=1)=0.20; P(x=10)=0.01; P(x=100)=0.001 (2)Ex=1*0.2+10*0.01+100*0.001=0.4

323x23x47dx,2 (2) Exdx1.5;Dx5.12 (1) dx0.15 13181885.13 xB(5,0.25),学生凭猜测至少答对4道的概率为:

150.2550.750= P(x4)P(x5)=C0.20.751C53x25.14 P(x=k)=λ^k×e^(-λ)/k!①

P(x=k+1)=λ^(k+1)×e^(-λ)/(k+1)!② ②/①得 P(x=k+1)/P(x=k)=λ/(k+1)

令P(x=k+1)/P(x=k)>1, 则λ>k+1, k<λ-1 令P(x=k+1)/P(x=k)<1, 则λλ-1

若λ<2, 则P(x=k)随着k增大而减小, ∴k=1时最大

若λ>2, 则P(x=1)<……P(x=[λ-1]+2)>……, ∴k=[λ-1]+1=[λ]是最大

综上, λ<2时,k=1;λ>2时,k=[λ](写成分段的形式,[]是取整符号) 5.16 (1)0.6997 (2)0.5 5.17 173.913

5.18 (1)0.9332 (2)0.383

第六章 统计量及其抽样分布

6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差1.0盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从N标准正态分布:z=,n的正态分布,由正态分布,标准化得到

2x~N0,1,因此,样本均值不超过总体均值的概率P为:

nx0.3x0.30.3Px0.3=P=P

nn19n19=P0.9z0.9=20.9-1,查标准正态分布表得0.9=0.8159

9

因此,Px0.3=0.6318

Y0.3x0.30.36.2 PY0.3=P=P nn1nn1n=P|z|0.3n=20.3n1=0.95

查表得:0.3n1.96 因此n=43

6.3 Z1,Z2,……,Z6表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使62得PZib0.95

i1解:由于卡方分布是由标准正态分布的平方和构成的: 设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量

22Z12Z22Zn

服从自由度为n的χ2分布,记为χ2~ χ2(n) 因此,令Z,则Z22i2i1i1210.95662i626,那么由概率PZib0.95,可知:

i12b=6,查概率表得:b=12.59

6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样

1n22(YiY)2),确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,本方差S(Sn1i1试求b1,b2,使得 p(b1S2b2)0.90

解:更加样本方差的抽样分布知识可知,样本统计量:

(n1)s22~2(n1)

此处,n=10,21,所以统计量

(n1)s22(101)s29s2~2(n1)

1根据卡方分布的可知:

Pb1S2b2P9b19S29b20.90

又因为:

2P122n19S22n11

因此:

2P9b19S29b2P122n19S22n110.90 2P9b19S29b2P122n19S22n1 22P0.9599S20.0590.90

则: 9b120.959,9b29b120.0520.9520.959查概率表:b120.9599=3.325,920.0599=19.919,则

,b220.0599

9=0.369,b220.059=1.88

10

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务