您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页《社会统计学》作业(共享含部份答案).doc

《社会统计学》作业(共享含部份答案).doc

来源:意榕旅游网
《社会统计学》作业(共享含部份答案).doc

社会统计学作业⼀、单项选择题

L为了解IT⾏业从业者收⼊⽔平,某研究机构从全市IT⾏业从业者随机抽取800 ⼈作为样本进⾏调查,其中44%回答他们的⽉收⼊在6000元以上,30%回答他们每⽉⽤于娱乐消费在1000元以上。此处800⼈是(A )A.样本B.总体0.统计量D.变量

2.在频数分布表中,将各个有序类别或组的百分⽐逐级累加起来称为(C )A.频率B.累积频数C.累积频率D.⽐率

3.离散系数的主要⽬的是(D )A.反映⼀组数据的平均⽔平B.⽐较多组数据的平均⽔平C.反映⼀组数据的离散程度D.⽐较多组数据的离散程度

4.经验法则表明,当⼀组数据正态分布时,在平均数加减1个标准差的范围之内⼤约有(B )A.50%的数据B.68%的数据C.95%的数据D.99%的数据

5.在某市随机抽取10家企业,7⽉份利润额(单位:万元)分别为72.0、63.

1、20.0、23.0、54. 7. 54.3、23.9、25.0、26.9、29.0,那么这10 家企业7 ⽉份利润额均值为(A )A.39. 19B.28. 90C.19. 54D.27. 95

6.⽤样本统计量的值直接作为总体参数的估计值,这种⽅法称为(A )A.点估计B.区间估计C.有效估计D.⽆偏估计

7.某单位对该⼚第⼀加⼯车间残品率的估计⾼达10%,⽽该军间主任认为该⽐例3偏⾼。如果要检验该说法是否正确,则假设形式应该为(B )A.: 1;勿<0.1

B.W o:勿WO. 1; H| :勿〉0. 1C.: 7T=0. 1; H,: 71 ^0. 1D.H°:勿〉0. 1;勿W0.1

8.下⾯哪…项不是⽅差分析中的假定(D )A.每个总体都服从正态分布B.观察值是相互独⽴的C.各总体的⽅差相等D.各总体的⽅差等于0

9.判断下列哪⼀?个不可能是相关系数(D )A.-0.9B.0C.0.5D. 1.2

10.⽤于说明回归⽅程中拟合优度的统计量主要是(D )A.相关系数B.离散系数C.回归系数D.判定系数

11.某地区政府想了解全市332. 1万户家庭年均收⼊⽔平,从中抽取3000户家庭进⾏调查,以推断所有家庭的年均收⼊⽔平。这项研究的总体是(A )A.332. 1万户家庭B.3000户家庭

C.332. 1户家庭的年均收⼊D.3000户家庭的年均收⼊

12.下列变量属于数值型变量的是(A )A.⼯资收⼊B.产品等级

C.学⽣对考试改⾰的态度D.企业的类型

13.如果⽤⼀个图形描述⽐较两个或多个样本或总体的结构性问题时,适合选⽤哪种图形(A )A.环形图B.饼图C.直⽅图

D.条形图

14.在频数分布表中,频率是指(C )A.各组频数与上⼀?组频数之⽐B.各组频数与下⼀组频数之⽐C.各组频数与总频数之⽐D.各组频数与最⼤⼀?组频数之⽐

15.两个定类变量之间的相关分析可以使⽤(A )A.4系数B.Q系数C.⼫系数D.Gamma 系数

16.根据⼀个样本均值求出的90%的置信区间表明(C )A.总体均值⼀?定落⼊该区|'可内

B.总体均值有90%的概率不会落⼊该区间内C.总体均值有90%的概率会落⼊该区间内D.总体均值有10%的概率会落⼊该区间内

17.⼰知某单位职⼯平均每⽉⼯资为3000元,标准差为500元。如果职⼯的⽉收⼊是正态分布,可以判断⽉收⼊在2500元⼀3500元之间的职⼯⼈数⼤约占总体的(B )A.95%B.68%C.89%D.90%

18.⽅差分析的FI的是(D )A.⽐较不同总体的⽅差是否相等B.判断总体是否存在⽅差

C.分析各样本数据之间是否存在显著差异

D.研究各分类⾃变量对数值型因变量的影响是否显著

19.对于线性回归,在因变量的总离差平⽅和中,如果回归平⽅和所占⽐例越⼤, 那么两个变量之间(A )A.相关程度越⼤B.相关程度越⼩C.完全相关D.完全不相关

20.正态分布中,b值越⼩,贝ij ( B )A.离散趋势越⼩B.离散趋势越⼤C.曲线越低平

D.变量值越分散

21.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会⼊选样本,这样的抽样⽅式称为(A )A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样

22.某地区2001-2010年⼈⼝总量(单位:万⼈)分别为98, 102, 103, 106, 108, 109, 110, 111, 114, 115,下列哪种图形最适合描述这些数据(D )A.茎叶图B.环形图C.饼图D.线图

23.如果⼀组数据中某⼀个数值的标准分值为T. 5,这表明该数值(D )A.是平均数的T.5倍B.⽐平均数少1.5C.等于-1.5倍标准差D.⽐平均数低1.5个标准差

24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是(A )A.89B.72C.88D.95

25.某班级学⽣期末英语考试平均成绩为75分,标准差为10分。如果⼰知这个班学⽣的考试分数服从正态分布,可以判断成绩在65-85之间的学⽣⼤约占全班学⽣的(A )A.68%B.89%C.90%D.95%

26.已知某单位平均⽉收⼊为3500元,离散系数为0.2,那么他们⽉收⼊的标准差为(A )A.700B.0.2C.3500

D.175000

27.在假设检验中,不拒绝虚⽆假设意味着(D )A.虚⽆假设是肯定正确的B.虚⽆假设肯定是错误的

C.没有证据证明虚⽆假设是正确的D.没有证据证明虚⽆假设是错误的

28.在因变量的总离差平⽅和中,如果回归平⽅和所占的⽐例越⼤,则两变量之间(A )A.相关程度越⾼B.相关程度越低C.完全相关D.没有任何关系

29.从两个总体中各选取了6个观察值,得到组间平⽅和为234,组内平⽅和为484,则组间⽅差和组内⽅差分别为(?)A. 234,121B. 117,121C. 234,48. 4D. 117,81

30.在回归⽅程中,若回归系数等于0,这表明(B )A.因变量y对⾃变量x的影响是不显著的B.⾃变量x对因变量y的影响是不显著的C.因变量y对⾃变量x的影响是显著的D.⾃变量x对因变量y的影响是显著的

31.某班级有60名男⽣,40名⼥⽣,为了了解学⽣购书⽀出,从男⽣中抽取12 名学⽣,从⼥⽣中抽取8名学⽣进⾏调查。这种调查⽅法属于(C )A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样

32.某企业职⼯的⽉收⼊⽔平分为以下五组:1)1500元及以下;2) 1500-2000元;3) 2000-2500元;4) 2500-3000元;5) 3000元及以上,则3000元及以上这⼀组的组中值近似为(D )A.3000 元B.3500 元C.2500 元D.3250 元

33.对于右偏分布,平均数、中位数和众数之间的关系是(A )A.平均数>中位数〉众数

B.中位数>平均数〉众数C.众数〉中位数〉平均数D.众数〉平均数〉中位数

34.M组数据的平均数不相等,但是标准差相等。那么(C )A.平均数⼩的,离散程度⼩B.平均数⼤的,离散程度⼤C.平均数⼤的,离散程度⼩D.两组数据离散程度相同

35.在假设检验中,如果所计算出的P值越⼩,那么检验的结果(A )A.越显著B.越不显著C.越真实D.越不真实

36.如果物价与销售量之间的线性相关系数为-0.87,⽽且⼆者之间具有统计显著性,那么⼆者之间存在着(A )A.⾼度相关B.中度相关C.低度相关D.极弱相关

37.回归平⽅和(SSR)反映了y的总变差中(A )A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于X与y之间的⾮线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分

38.根据⼀个具体的样本求出的总体均值90%的置信区间(A )A.以90%的概率包含总体均值B.绝对包含总体均值

C.10%的可能性包含总体均值D.绝对不包含总体均值

39.在假设检验中,虚⽆假设和备择假设(C )A.都有可能成⽴B.都不可能成⽴C.有且只有⼀个成⽴

D.备择假设⼀定成⽴,虚⽆假设不⼀定成⽴

40.在⽅差分析中,某⼀⽔平下样本数据之间的误差称为(A )

A.组内误差B.组间误差C.组内平⽅D.组间平⽅⼆、名词解释1 .抽样单位与抽样框2.普查与抽样调查3.参数与统计量4.⽅差与标准差5.独⽴样本与配对样本6.总体与样本7.抽样分布8.⼆维表9.相关系数10.组内均⽅11.普查

12.误差减少⽐例13.散点图14.正态分布15.最⼩⼆乘法16.概率抽样17 .中位数18.相关系数19.区间估计20.中⼼极限定理21.假设检验三、简答题

1.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)⽹络供应商的姓名(2)每⽉的⽹络服务费(3)每⽉上⽹时间(4)上⽹的主要⽬的

(5)上周收到的电⼦邮件数量(6)每⽉⽤于⽹上购物的⾦额(7)上⽉⽹上购物的次数

(8)使⽤的电脑的品牌(9)上⽹是否玩游戏

(10)电脑是否带有光盘刻录机

2.调查⽅法主要包括哪⼏种?简要说明各种⽅法的优缺点。3.什么是简单⼀元线性回归分析?其作⽤是什么?4.简要说明社会研究过程。

5.按测度⽔平,变量可分为哪⼏类?并举例说明。

6.简要举例说明在分析双变量的关系⼝⼨,T检验和卡⽅检验的主要区别。7.等距分组和不等距分组有什么区别?请举例说明。8.举例说明什么是⾃变量和因变量,⼆者之间是什么关系?9.简要说明卡⽅的拟合优度检验和独⽴性检验的含义。10 .条形图和直⽅图有什么区别?

1L简述众数、中位数和平均数作为测量中⼼趋势的指标所适⽤的数据类型。13.简要举例说明在分析双变量的关系时?,T检验和卡⽅检验的主要区别。14.举例说明什么是离散变量和连续变量。15.SPSS主要有哪些功能?16.在SPSS中如何定义变量属性?17.统计表主要由哪⼏部分构成?18.简述相关系数的取值与意义。四、计算题(每题15分,共30分)

1 .某校社会学专业同学统计课成绩如下表所⽰。社会学专业同学统计课成绩表

要求:

(1)对考试成绩按由低到⾼进⾏排序,求出众数、中位数和平均数。

(2)对考试成绩进⾏适当分组,编制频数分布表,并计算累计频数和累计频率。

2.为研究某利「商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下结果:⽅差分析表

要求:

(1)计算上⾯⽅差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少?

3.某公司招聘职员时,要求对职员进⾏两项基本能⼒测试。已知,A项测试中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25分。⼀位应试者在A项测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正太

分布,该位应试者哪⼀项测试更理想?

4.某公司欲了解⼴告费⽤x对销售量y的影响,收集了20个地区的数据,并对x、y进⾏线性回归分析,得到:⽅程的截距为364,回归系数为1.42,回归平⽅和SSR= 1602708. 6,残差平⽅和SSE=40158. 07o要求:(1)写出⼴告费⽤y与销售量程x之间的线性回1归⽅程。

(2)假如⼴告费⽤投⼊50000元,根据回归⽅程估计商品销售量。(3)计算判定系数R,并解释它的意义。

5.为估计每个⽹络⽤户每天上⽹的平均时间是多少,抽取了225个⽹络⽤户的简单随机样本,得到样本均值为6. 5个⼩时,样本标准差为2.5个⼩时。

(1)试⽤95%的置信⽔平,计算⽹络⽤户每天平均上⽹时间的置信区间。

(2)在所调查的225个⽹络⽤户中,年龄在20岁以下的⽤户为90个。以95% 的置信⽔平,计算年龄在20岁以下的⽹络⽤户⽐例的置信区间。

注:Z().()25 = 1-96

6.某企业使⽤3种⽅法组装⼀种新的产品,为确定哪种⽅法⽣产效率最⾼,随机抽取30名⼯⼈,并指定每⼈使⽤其中的⼀种⽅法。通过对每个⼯⼈⽣产的产品数进⾏分析得到下⾯的⽅差分析表。请完成⽅差分析表。

7.某校社会学专业共有两个班级。期末考试⼝⼨,⼀班同学社会学理论平均成绩为86 分,标准差为12分。⼆班同学成绩如下所⽰。

⼆班同学社会学理论成绩分组数据表

要求:

(1)计算⼆班同学考试成绩的均值和标准差。

(2)⽐较⼀班和⼆班哪个班成绩的离散程度更⼤?(提⽰:使⽤离散系数)

8.某调查公司研究出租司机每天收⼊(元)与⾏驶⾥程(公⾥)之间的关系。对30位出租车司机进⾏调查,并根据每天的收⼊y、⾏驶⾥程x进⾏回归,得到:⽅程的截距为162,回归系数为0.6,回归平⽅和SSR=2600,残差平⽅和SSEW13。要求:

(I)写出每天的收⼊y与⾏驶⾥程x之间的线性回归⽅程。

(2)假如某司机某天⾏驶了300公⾥,根据回归⽅程估计他该天的收⼊。(3)计算判定系数R2,并解释它的意义。计算题答案:计算题1答案:

答:(注:⽼师要求作业答案必须⼿写)

(1)社会学专业同学统计课成绩表按由低到⾼的成绩进⾏排序得出众数是76分、中位数是83分;平均数是83.1分。(2)社会学专业同学统计课成绩的频数分布表如下频数分布表

计算题2答案:

答:(注:⽼师要求作业答案必须⼿写)

解:(1): SST=SSR+SSE

=1642866. 67-205158. 07=1437708. 60(2)判定系数公式:

昨迎⼆143-0S.6⼆°。8倾颈.5顶SST 1642866.62

答:商品销售量的变差中有87.51%是由价格的差异引起的。(3)相关系数 R* r= 7^ := 70.8751 :=0. 94答:销售量与价格之间的相关系数是0.94.计算题3答案:

(注:⽼师要求作业答案必⼿写)解:N (|1, b;)

第⼀组测试s X-X(90, 12:)第⼆组测试:y-M(200, 25:)

标准正态:Z A⼆⼆=1。」⼆90⼆]查表得①A(1) =0. 8413=84.13%<7 12

Z B21~—2lJ°=0. 6 查表得中5(0. 6)=0. 7257=72. 57%(7 25

答:两项测试的成绩均服从正态分布,A项测试的成绩更理想。计算题4答案:

(注:⽼雌求作业答案必须⼿写)

解:⼰知:⽅程的截距为364,回归系数为1.42(1)根据线性回归⽅程公式:⼴加+ S.XV = 364 + 1.42 Z

(2)根据回归⽅程计算商品销售量:⼰知:万⼆50000

V = 364 + 1.42 X= 364 + 1.42X50000 = 71364(3)判定系数R:

⼰知:SSR为回归平⽅和:1602708. 6SSE为残差平⽅和:40158. 07

SST ⼆SSR + SSE = 1602708.6 + 40158.07=1642866.67 RJ箜⼆1602708.6 =0. 9花6=97. 56%SST 1642866.67

答:销售量是靠⼴告费⽤收⼊的。P(l- P)

廿⼀ ~n~ ' P ⼀ *P(1 - P)

Ta

计算题5答案:

(注,⽼师要求作业答案馈⼿写)b b

W :⑴均值的置信区间:(⼜-Zcg, X+ZaJ^)⼰知:Z ; ::5 =1.96, b ⼆2. 5, n=225,b 2.5

Z £j^=1.96xj225 =0.323 ■

⼰知:X=6.5, [6. 5-0. 323, 6. 5+0.323]=[6.17, 6. 82] 答:在95%的置信⽔平,⽹络⽤户每天平均上⽹时间的置信区间为6.17, 6. 82 之间。

(2)⼰知:Z?=Z 0025 =1.96 , n ⼆2252

根据⽐例的置信区间公式计算:⼫整*。”如%

P(l-P) 0.4(1-0.4) ------ =1.96X J -------------- -- = 0. 064 = 6. 4% n V 225

代⼊公式计算:[0. 4-0. 064, 0.4-0. 064]=[0. 336, 0. 464] 答:以95%的置信⽔平,年龄在20岁以下的⽹络⽤户⽐例的置信区间为

0. 336, 0. 464。

①根据蛆间均⽅公式计耸:MSA =蛆间平⽅和_ SS.4⾃由度

②根据组内均⽅公式计算:甄SE =

③在计耸出组间均⽅MSA和组内均⽅后■ F =XISA210 _ 142.074 =1.478计算题6答案:

解:《注;考膜求作业答案姒⼿写)⽅差分析表变差来源SS Df\\AAzMS F Sig.

组间SSA k-1MSA=210MSAJlSE0.000

蛆内SSE=3836n-k, 1■ ■

总计SST n-l=29———?解:根据⽅差分析表,⼰知:SSE=3836,MSA=210, nT=29,n=30, k=3, 210 =三,SSA = 2X210 =4203836

黄SE = —T = 142.0743U — 3

<3) SST = SSA + SSESST= 420 + 3836 = 4256根据⽅差分析计算得出=变差来源SS Df MS F Sig.

蛆间SSA =420虹MSA=210顽伽0.000组内SSE=3836n-kWT总计SST E256n-l=29—蛆内平⽅和⾃由度

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务