您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页3.1 独立性检验教案(1)

3.1 独立性检验教案(1)

来源:意榕旅游网
数学选修2-3[苏教版]

§3.1 独立性检验(1)

教学目标

(1)通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方

法及初步应用;

(2)经历由实际问题建立数学模型的过程,体会其基本方法.

教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境

5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:

1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515

个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.

问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动

为了研究这个问题,(1)引导学生将上述数据用下表来表示: 吸烟 不吸烟 合计 患病 37 21 58 未患病 183 274 457 合计 220 295 515 (2)估计吸烟者与不吸烟者患病的可能性差异:

在吸烟的人中,有

3716.82%的人患病,在不吸烟的人中,有217.12%的人患病. 220295问题:由上述结论能否得出患病与吸烟有关?把握有多大?

三.建构数学 1.独立性检验:

(1)假设H0:患病与吸烟没有关系.

若将表中“观测值”用字母表示,则得下表:

吸烟 不吸烟 合计 患病 a 未患病 合计 c ac b d bd ab cd abcd (近似的判断方法:设nabcd,如果H0成立,则在吸烟的人中患病的比例与

- 1 -

数学选修2-3[苏教版]

不吸烟的人中患病的比例应差不多,由此可得

ac,即abcda(cd)c(a)b弱,否则,关系越强.) 设nabcd,

ad,因此,b0c|adbc|越小,患病与吸烟之间的关系越

在假设H0成立的条件下,可以通过求 “吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率),将各种人群的估计人数用a,b,c,d,n表示出来.

例如:“吸烟且患病”的估计人数为nP(AB)nabac; nnabbd“吸烟但未患病” 的估计人数为nP(AB)n; nncdac“不吸烟但患病”的估计人数为nP(AB)n; nncdbd“不吸烟且未患病”的估计人数为nP(AB)n. nn如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能

否定假设H0.否则,应认为假设H0不能接受,即可作出与假设H0相反的结论. (2)卡方统计量:

为了消除样本对上式的影响,通常用卡方统计量(χ行估计.

2

卡方χ统计量公式:

cdaccdbdabacabbdcndn2anbnχnnnn nnnncdaccdbdabacabbdnnnnnnnnnnnn222

(观测值预期值)2预期值)来进

22nadbc(其中nabcd) abcdacbd2由此若H0成立,即患病与吸烟没有关系,则χ2的值应该很小.把

统计学中有明确的结论,在H0a37,b183,c21,d274代入计算得χ211.8634,成立的情况下,随机事件“6.635”

- 2 -

2数学选修2-3[苏教版]

发生的概率约为0.01,即P(26.635)0.01,也就是说,在H0成立的情况下,对统计量χ2进行多次观测,观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为H0不成立,即有99%的把握认为“患病与吸烟有关系”.

象以上这种用2统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 说明:

(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据a,b,c,d取值越大,效果越好.在实际应用中,当a,b,c,d均不小于5,近似的效果才可接受.

(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”. (3)在假设H0下统计量χ2应该很小,如果由观测数据计算得到χ2的观测值很大,则在一定程度上说明假设不合理(即统计量χ2越大,“两个分类变量有关系”的可能性就越大).

2.独立性检验的一般步骤:

一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类A和类B(如吸烟与不吸烟),Ⅱ也有两类取值:类1和类2(如患呼吸道疾病与不患呼吸道疾病),得到如下表所示: Ⅰ 类A 类B 合计 类1 a Ⅱ 类2 合计 c ac b d bd ab cd abcd 推断“Ⅰ和Ⅱ有关系”的步骤为:

第一步,提出假设H0:两个分类变量Ⅰ和Ⅱ没有关系;

第二步,根据2×2列联表和公式计算χ2统计量; 第三步,查对课本中临界值表,作出判断. 3.独立性检验与反证法:

反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立; 独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立. 四.数学运用 1.例题:

- 3 -

数学选修2-3[苏教版]

例1.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?

使用血清 未使用血清 合计 未感冒 258 216 474 感冒 242 284 526 合计 500 500 1000 分析:在使用该种血清的人中,有的人中,有

24248.4%的人患过感冒;在没有使用该种血清50028456.8%的人患过感冒,使用过血清的人与没有使用过血清的人的患500病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.

解:提出假设H0:感冒与是否使用该种血清没有关系.由列联表中的数据,求得

1000(258284242216)27.075

4745265005002∵当H0成立时,26.635的概率约为0.01,∴我们有99%的把握认为:该种血清能起到预防感冒的作用.

例2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71 合计 98 95 193 分析:在口服的病人中,有

586459%的人有效;在注射的病人中,有67%的人9895有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为

用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明. 解:提出假设H0:药的效果与给药方式没有关系.由列联表中的数据,求得

193(58314064)21.38962.072

1227198952当H0成立时,1.3896的概率大于15%,这个概率比较大,所以根据目前的调查数据,不能否定假设H0,即不能作出药的效果与给药方式有关的结论.

- 4 -

2数学选修2-3[苏教版]

说明:如果观测值22.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系. 2.练习:课本第91页 练习第1、2、3题. 五.回顾小结:

1.独立性检验的思想方法及一般步骤; 2.独立性检验与反证法的关系. 六.课外作业:

课本第93页

习题3.1 第1、2、3题.

- 5 -

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务