概率论与数理统计是研究随机现象统计规律性的一门数学学科。理论严谨,应用广泛,发展迅速,在理论联系实际方面,概率是最活跃的学科之一。
什么是随机现象?用两个简单的试验来阐明,这里所说的试验是对自然现象进行一次观察或进行一次科学试验。
试验1:一袋中装有十个外形完全相同的白球,搅匀后从中任取一球。
试验2:一袋中装有四白三黑三红大小形状完全相同的球,搅匀后从中任取一球。 对于实验1,根据其条件,我们就能断定其结果取出的必是白球。象这类根据试验开始的条件,就能确定试验的结果所反映的现象称为确定性现象。确定性现象非常广泛,例如:
1.标准大气压下,水加热到1000C,必会沸腾。 2.边长为a,b的矩形,其面积必为a·b 3.实系数奇次方程必有一实根。
对于试验2,根据其条件,在球没有取出之前,不能断定其结果是白球、红球或是黑球,这类试验称为随机试验,它所对应的现象称为随机现象。随机现象在客观世界中也极为普遍,例如:
1.掷一枚均匀的硬币,考虑出现哪一面;
2.抽查流水生产线的一件产品,是正品还是次品; 3.观察一上午电话总机接到的呼叫次数。 „„
上述试验的共同特点是:试验的结果具有一种“不确定性”,即任意做一次试验时,我们不能断言其结果是什么,但是“大数次”重复这个实验,试验结果又遵循某些规律,这种规律称之为“统计规律”,正是我们“概率论与数理统计”研究的对象。
“概率与数理统计”又是两个联系紧密而有区别的东西。
概率论——从数学模型进行理论推导,从同类现象中找出规律性。
1
数理统计——着重于数据处理,在概率论理论的基础上对实践中采集得的信息与数据进行概率特征的推断。
参考书:
1.《概率论》(第一册 概率论基础,第二册 数理统计) 复旦大学编。 2.《概率论及数理统计》(第二版<上、下>两册)中山大学数学系梁之舜等编著。 3.《概率论与数理统计》 首都师范大学数学系张饴慈等编著。 4.《教育统计学》杨宗义等编。
第一章 事件与概率
教学目的:
1.使学员掌握事件与概率的公理化定义及概率的基本性质。
2.使学员熟练掌握古典概型及贝努里概型的特点。能正确求出两种概型中事件的概率。 3.使学员能熟练应用加法公式、乘法公式、全概公式及贝叶斯公式计算事件的概率。 4.使学员掌握事件独立性的概念。
通过本章的教学,提高学员分析问题、解决问题的能力。
§1.1 随机事件和样本空间
我们把在一定的条件下,对自然现象进行一次观察或进行一次科学试验称为一个试验,如试验满足以下条件:
(1)在相同的条件下可以重复进行;
(2)试验的所有可能结果是预先知道的,且不止一个。
(3)每做一次试验总会出现可能结果中的一个,但在试验之前,不能预言会出现哪个结果。
那么,就称这样的试验为随机试验,也常简称随机试验为试验。
2
试验的每一个可能结果,称为基本事件,用或i表示,若干基本事件复合而成的结果称为复杂事件,常A、B、C等表示,试验下必然会发生的结果称为必然事件,常用Ω表示,必然不会出现的结果称为不可能事件,常用φ表示,上述事件统称为随机事件,简称事件。
即
复杂事件 (随机事件)必然事件,不可能事件基本事件
例1.1 掷一颗均匀的骰子
基本事件:k{出现k点}k=1,2,„„,6 复杂事件:A={出现偶数点}, B={出现奇数点},„„ 必然事件:Ω={出现小于7的点} 不可能事件:φ={出现大于6的点}
为了便于用点集的知识描述随机事件,我们把试验下的每个基本事件抽象地看成一个点,称之为样本点,仍用或i表示。全体样本点的集合称为样本空间,用Ω表示。于是任一随便机事件都可表示为Ω的子集,特别地,样本空间Ω表示必然事件,其空子集φ表示不可能事件。
不同的试验,对应的样本空间可能相当简单,也可能较复杂。 例1.2 掷一枚硬币
令1={出现正面},2={出现反面} 则Ω={1,2}。
例1.3 观察某天到某商场购物的顾客数。 令k={来到k个顾客},k=0,1,2„„ 则Ω={k:k≥0}
3
例1.4 考查地震震源。
x——震源经度,y——震源纬度,z——震源深度。
则Ω={(x,y,z)(x,y,z)V,V为三维空间某区域}。 二、事件的关系及运算
1.事件的包含与相等:如果事件A发生必然导致B发生,则称B包含A或称A是B的特款,并记作AB或BA。
若AB且同时BA,则称A与B相等(等价),记为A=B。 2.事件的并与差
A与B的并(或和)={A与B至少一个发生}AB,推广:{A1,„„,An至少一个发
n生}=A1A2AnUAi
i1nUAilimi1nUAi
i1{事件A发生而B不发生}=A-B 3.事件的交
ABAB{A、B同时发生}={事件A发生且B也发生}
nA1AnA1AnniAi1i{A1„,An同时发生}
Ai1limnAi1i
4.互不相容事件
若AB=φ(即A、B两事件不可能同时发生),称A、B为互不相容(或互斥)事件。 5.互逆事件(互相对立事件)
记AA{A不发生},则称A为A的逆事件或A的对立事件,显然A又是A的对立事件,即
4
A与A互为对立事件AAφ,AA,此外,A=A 事件的运算满足下述规则:
(1)交换律:ABBA,AB=BA (1.1) (2)结合律:ABCABC (1.2) ABC=A(BC) (1.3) (3)分配律:ABCACBC ABCACBC (4)De Morgan 定理(对偶原理)
AkAK(1.6) AkAk (1.7)
kkkk例1.5 利用事件的关系和运算律证明(ⅰ)A-B=AB,(AABBABAB。
证:(ⅰ)A-B={A发生且B不发生}AB发生,故A-B= AB (ⅱ)AABBAABBAABB ABBABBBAB 又ABABAB 故原式成立
例6 设A、B、C是Ω中的事件,则(见书P9) {A与B发生,C不发生}=ABC
{A、B、C中至少有二个发生}=ABBCAC {A、B、C中恰好发生两个}=ABCABCABC
{A、B、C中有不多于一个事件发生}=ABCABCABC
5
(1.4) (1.5) ⅱ)
如把Ω中表示事件的子集全部归为一类,并用F表示,则称F为事件类,即FA:A,A是事件,F显然应对事件的和、差、积运算封闭,则得F应满足下述要
求:
(1)ΩF
(2)AF,则AF
(3)AiF,i=1,„n„,则AiF
i1易验,满足上述(1)、(2)、(3)的F对“”,“—”亦封闭。
故F是Ω上的域,称之为事件域,今后称F中元素,且只有F中元素为一个事件。
§1.2 概率和频率
定义1.1 设A是某试验下的一个事件,将此试验在相同的条件下重复进行n次,若其中事件A出现nA次,记fnA生的频数。
经统计发现频率fn(A)随n的增大具有稳定性,此规律为频率的稳定性。频率的稳定性说明随机事件发生的可能性有大小而言。
概率的直观描述:度量事件A发生的可能性大小的数称为事件的概率,记为P(A)。 我们可以将频率fn(A)的稳定值p定义为P(A),并将它称为事件A概率,由频率的性质可推得统计概率具有如下基本性质:
(1)(非负)P(A)≥0,对任意AF (2)(规范)P(Ω)=1
nA(3)(有限可加)若A1,A2„,An为F中两两互斥事件,则Pii1nAn。称fn(A)为事件A在n次试验中出现的频率,nA称为A发
PA。
ii1n
6
§1.3 古典概型
若随机试验满足:
(1)对应的样本空间只含有限个样本点,即 Ω={1,n} (有限性)
(2)每个样本点出现的可能性相等,即 P(1)=„„= P(n)(等可能性) 则称该试验描述的数学模型为古典概型。
对于古典概型,一般取Ω中一切子集构成F,对任意AF用如下公式计算其概率: PAA所含样本点数样本空间中样本点总数KAn (1.8)
且把它称作古典概率。
例1.7 袋中装有外形完全相同的2只白球和2只黑球,依次从中摸出两球。记A={第一次摸得白球},B={第二次摸得白球},C={两次均摸得白球}。
求A、B、C的概率。
分析与解:我们用枚举法找出该实验的全体样本点。不妨对球编号,2只白球编号为奇数1、3,而2只黑球编号为偶数2、4,对数(i,j)表第一次摸到i号球,第二次摸到j号球这一结果,于是可将试验对应的样本空间所包含的样本点一一列出:
Ω={(1,2)(1,3)(1,4)(2,1)(2,3)(2,4)(3,1)(3,2)(3,4)(4,1)(4,2)(4,3)}共有12个样本点。 由于球的外形完全相同,故样本点具有等可能性,这是一个古典概型,又 A={(1,2)(1,3)(1,4) (3,1)(3,2)(3,4)} B={(1,3) (2,1)(2,3)(3,1)(4,1)(4,3)} C={(1,3) (3,1)} 据公式(1.8)有 P(A)=
61212,P(B)=
61212,P(C)=
11216。
由上例看出,用公式(1.8)计算古典概率的关键,是要正确求出n和KA,然而并非每次
7
计算n和KA都象例1.7那样简单,许多时候是比较费神而富于技巧的,计算中经常要用到两条基本原理——乘法原理和加法原理及由之而导出的排列、组合等公式,现简介如下:
乘法原理:完成一件工作分m个步骤,第一步骤有n1种方法,第二步骤有n2种方法,„„第m个步骤有nm种方法,那么完成这件工作共有n1×n2ׄ„nm种方法。
加法原理:完成一件工作有m个独立的途径,第一个途径有n1种方法,„„第m个途径有nm种方法,那么完成这件工作共有n1+n2„„+nm种方法。
以上述两个原理为基础,可以推导出如下的排列、组合等公式。
1.排列:从n个元素中取出r个来排列,既要考虑每次取到哪个元素,又要考虑取出的顺序,根据取法分为两类:
(1)有放回选取,这时每次选取都是在全体元素中进行,同一元素可被重复选中,这种排列称为有重复排列,总数为nr种。
(2)不放回选取,这时一元素一旦被选出便立刻从总体中除去,这种排列称为选排列,
rn总数Annn1nr1,特别地Annn1321n!称为n个元素的全排
列。
2.组合
(1)从n个元素中取出r个元素的组合是不考虑元素的顺序的,其组合总数为
CrnAnnn! (1.9) rr!r!nr!r(2)若r1r2rkn,把n个不同的元素分为成k个部分,第一部分有r1个,第二部分r2个,„„第k个部分rk个,则不同的分法有
n!r1!r2!rk! (1.10)
种,此称为多项系数,因为它是x1x2xk展开式中x1xk的系数。当k=2时,
nr1rk即为(1.9)表示出的组合数()。
r
8
n(3)若n个元素中有n1个带足标“1”,n2个带足标“2”,„„,nk个带足标“k”,且
n1n2nkn,从这n个元素中取出r个,使得带足标“i”的元素有ri个(ri≤ni,1
≤i≤k),而r1r2rkr,这时不同取法的总数为
n1 n2nk „„ (1.11)r1r2rk4.一些常用等式
选排列和组合式可推广到r是正整数而n是任意实数x的场合,即有
Arxxx1xr1
xArxxx1xrrr!1r! n此外由11nnrnrr0r11得 nnn2n 01n利用幂级数乘法可推得:
a0 ban1bn1a n bab 0n 特别地有
n0nn n=2n n1 nn1nn0n
由nnknk,上式即 222nnn2n01nn 例1.8 (书P18例1.7)
9
(1.12) (1.13) 例1.9 有10个电阻,其电阻分别为1Ω,2Ω,„„,10Ω,从中任取出三个,以A表示“取出的三个电阻恰好一个小于5Ω,一个等于5Ω,一个大于5Ω”这一事件,求P(A).
分析与解:从10个电阻中任取3个而不必考虑其顺序,所有可能的取法为组合数10,3由于每个电阻被取到的机会均等,因此每种取法是等可能出现的,此为古典概型。因小于5Ω的电阻有4个,等于5Ω的只1个,大于5Ω的有5个,按公式(1.11),A所含样本点数为
4151 1 1。 4151111故P(A)=
6103例1.10 某城有N部卡车,车牌号从1到N,一人到该城去把N部卡车的牌号抄下,求A =“抄到最大牌号正好是K” 的概率(1≤K ≤N)。
分析与解:易理解,由于抄车牌号可能重复,问题归结为对N个车牌号进行n次有放回抽样,可考虑为可重复排列,样本点总数为
NNNN,由于每个车牌号是等可能被抄到的,模型为古典概型,考虑事件n个nA所含样本点数时,可以先考虑最大车牌号不大于K的抄法,共Kn种,再除去最大车牌号不大于(k-1)的抄法(k-1)n种,即得A所含样本点数。
Kn于是,PAk1Nnn
在讨论古典概型时,有时我们也可以根据考虑问题方便,适当选取样本空间,见下面的例:
例1.11 袋中有a只黑球,b只白球,它们除颜色不同外,其余无差异,现随机地把球一只一只地摸出,求
A=“第k次摸出的一只球为黑球”的概率。(1≤k≤a+b)
10
解法一:将a只黑球看作没有区别,b只白球也看作没有区别,将a+b只球一一摸出排在a+b个位置上,所有不同的摸法对应着a+b个位置中取出a个位置来摸黑球(其余为摸白球)的取法,即样本点总数n=ab,而A所含样本点数对应着不考虑第K个位置(第aab1,a1K个位置固定为黑球)的其余a+b-1个位置中取出a-1个来摸黑球的取法,即为于是
ab1a1a PAababa解法二:设想将a只黑球及b只白球编号后一一取出排成一排,则所有可能的排法为n=(a+b)!,事件A发生当且仅当第k个位置上是a只黑球中取出一个排进,其余a+b-1个位置是剩下的a-1只黑球和b只白球来排列,于是A所含样本点数KA=a×(a+b-1)!,故
PAaab1!aabab!
解三:仍设想把a只黑球, b只白球依次编号为1,„,a+b,记
i={第k次摸球摸到第i号球}则样本空间Ω={1,ab},其中各i是等可能出现的,显
然A含Ω中a个样本点,故
PAaab
三种解法答案一样,这说明对于同一随机现象,可以用不同的模型来描述,只要方法正确,结论总是一致的,上面解法一的每个样本点是由解法二的a!b!个样本点合并而成,而解法三的每个样本点则由解法二的(a+b-1)!个样本点合并而成的。
另方面,例1.11结论告诉我们,第k次摸到黑球的概率与k并无关系,这一有趣的结果具有现实意义,比如日常生活中人们常爱用“抽签”的办法解决难于确定的问题,本题结果告诉我们,抽到“中签”的概率与“抽签”的先后次序无关。
11
例1.12 一批产品共有N件,其中有M件次品(M﹤N),采用有放回和不放回两种抽样方式从中抽n件产品,问正好抽到K件次品的概率是多少?
分析与解:所求的概率显然是与抽样方式有关,下面分别加以讨论。
(1)[有回放抽样]不妨设想将N件产品进行编号,有放回抽n次的所有不同的抽法对应重复排列数Nn,其中次品正好出现k次的数目是kMnkMknkNMnk。故所求概率为
NNnMnkbknMM1kNNnk (1.14)
N(2)[不放回抽样] 从N件产品中取出n件的所有不同取法对应组合数n。据公式
(1.11)。“正好取到k件次品”对应的样本点数为nk,故所需求的概率为 k MkNMnkNnMNMhk 此概率称为超级几何分布 (1.15)
由上例看出,抽样方法不同,计算出的概率也是不同的,尤其是产品总数N不大时,bk和
hk的差别更是显而易见的。但当产品总数N较大而抽取的产品数n相对较小时,bk和hk的
差别就可以忽略。人们在实践中正是利用这一点,把抽取对象较大的不放回抽样当作有放回抽样来处理,这样用(1.14)式计算概率比用(1.15)式简便得多。
例1.l3 (书P19例1.8)
从古典概型的讨论,可得古典概率有如下基本性质: (1)非负性:对任意AF,有P(A)≥0 (2)规范性:P=1
12
n(3)有限可性:A1,An是F中两两互斥事件,则PAii1PA
ii1n推论:PA1PA (1.16)
例1.14 一袋中装有N-1个黑球及1只白球,每次从袋中摸出一球,并换入一只黑球,如此延续下去,问第k次摸球摸到黑球的概率是多大?
解:令A={第k次摸球摸到黑球}。 则A={第k次摸到白球}。
由题设条件,A发生当且仅当前k-1次都摸到黑球而第k次摸到白球,易得 PAN1Nkk111Nk111。 PA1PA11NNN1k1
例1.15(书P20例1.9) 例1.16(书P21例1.10)
§1.4几何概率、概率的公理化定义及性质
一、几何概率
如果一个随机试验对应的样本空间为n维欧氏空间的某个区域Ω,且样本点在Ω内“均匀分布”,则“点落入Ω内某可测子区域A”A的概率与A的测度A成正比,而与子区域A的位置及形状无关,即
PAA (1.17)
这里表示测度,即是长度、面积、体积等。
我们称用(1.17)计算的概率为几何概率,相应的概率模型为几何概型。 例1.17 (会面问题)(书P22例1.11)
例1.18 (Buffon投针问题)平面上画有等距离为a(a﹥0)的一些平行线,向此平面任
13
意投掷一枚长为l(l﹤a)的针,试求针与平行线相交的概率p。
解:以x表示针的中点M到最近一条平行线的距离,表示针与最近一条平行线间的交角(见书P24图1.8)
易知有0x92,0(1)
由这两式可以确定在Ox平面上的一个矩形Ω,要使针与平行线相交,必须且只需
xl2(2) sin。
表示上不等式的点(,x),由书上图1.8中阴影部分A表示,由于可以理解针是等可能地落在平面上的任一位置,故有
PPAAl021sinda2la(3)
2如果l、a为已知,则以π值代入上式即可计算得P(A)之值,反之如果已知P(A)之值,也可利用上关系式求π,其方法是投针N次,记下针与平行线相交的次数n,并以频率的近似值代入(3)即得
2NlannN作P(A)
这时实际向大家介绍了一个很有用的计算方法,即若我们想要计算一个感兴趣的量(上面这个量是π),则可适当地设计一个随机试验,使试验下某个事件的概率与感兴趣的那个有关,然后重复试验多次,以频率代事件的概率便可求出那个量的近似解来。人们称这种计算方法为随机模拟法或蒙特——卡洛(Monto—Carlo)方法。
几何概率也具有类似统计概率和古典概率的基本性质,有所不同的是,由于几何概型对应的样本空间为欧氏空间的某个可测区域,其计算涉及的是区域的测度。因此,F不能将Ω的全部子集选入,而只能取Ω的可测子集。(否则几何概率无意义)当然,F要满足它本身的三个条件,由于Ω的可测子集有无限个,故F中涉及事件的可列运算相应的几何概率也就会涉及到可列运算。
例1.19 考察在[0,1]中随机投点的随机试验,记
14
A={投点落入[0,)},An={投点落入
2111},n=1,2,„„。 ,2n12nn则APA12AN1n1An,按题设所投的点落入某区间的概率等于该区间的长度,于是有1,PAn2n1,
便有PAPA2nn1n11n112
上例说明几何概率满足可列可加性。 综上,几何概率具有如下基本性质: (1)对任何事件A,PA0 (2)P1
(3)若A1,A2,„„两两互斥,则PAnn1n1An。
二、概率的公理化定义及其基本性质
定义1.2 设试验对应的样本空间为Ω,Ω的一些子集构成—域(即事件域)为F,对每一个AF,定义实值集函数P满足:
(1)非负:对AF,均有PA0 (2)规范:P1
A(3)可列可加:若AiF,且AiAjφ(ij),则Pi1,2,,ii1 PA。
ii1则称这样的集函数P为F上的一个概率,PA就称为事件A的概率。 由上面的定义看出,P实质上是F上的一个规范化测度,我们称它为概率测度。
综上,描述一个随机试验的数学模型应有三件东西:样本空间Ω,事件域F,F上的规范测度P,我们称三元总体(Ω、F、P)为一个概率(测度)空间。
15
根据Ω的情况,可以考虑如下方式构造F,定义P:
1.若Ω={1,2,,n}(称为有限样本空间)可取Ω的所有子集构成F,定义P只要有满足:Pi0,i1,2,n,P1Pn1 对于F中任一元素
Ai1,ik,令PAPi1Pik则 P是F上一个概率。
显然,古典概率是上述情形的特例。
2.若Ω={1,2„„ }(称为离散样本空间)这时仍可取Ω的一切子集构成F,定义P只要满足
Pi0,Pi1
i1对任意AF,令PAP,则P为F上的一个概率。
iiA3.若Ω为欧氏空间的某区域(或空间),则可取Ω中全体Borel点构成F,在F上定义概率P可按定义测度的办法再作规范处理即可。显然,几何概率就是这样定义的。
例1.20 设Ω={0,1,2„„},F ={Ω的一切子集},对AF, 定义PAekAkk!(﹥0)
特别P0。
验证(Ω,F,P)为一概率空间。 证:只需验证P是F上的概率即可。
由P的定义,显然有:(1) PA0,对AF。
(2) Pkkk!eek0kk!ee1
(3)若AiF,i1,2,,且AiAjij
16
则 PAii1KAikk!ei1kekAik!PA
ii1故P为F上的一个概率。
实际上例1.18定义的P是上面情形2的特例。
概率除具有定义所述的三条基本性质外,还具有如下性质: 1.P(φ) =0 证:„„
nA2.(有限可加性),若A1,,An为F中两两互斥事件,则Pii1nPA
ii1证:„„ 系:PA1PA
3.(单调性或称可减性)若AB,则PABPAPB,从而PAPB 证„„
4.(加法公式)对任意AF,BF,有
PABPAPBPAB (1.18)证„„
一般地,若AF,i1,2,„„n,则有
nn1PASS1Sn (1.19) i12i1其中S1S2PA
ii1inPA1ijnAjPA1A2PAn1An
SnPA1A2An
(有限可加性是(1.19)的特殊意况)
17
n5.(半可加性)PAii1PA
ii1n证„„
6.(连续性)若{An}为F单调序集,则
limPAnPlimAn
nn即当A1A2An时
limPAnPAi(从下连续性) ni1当A1A2An时
limPAnPAi(从上连续性) ni1上面所述的性质中最基本的是有限可加性,它是推导可减性和加法公式的基础。此外,连续性在理论研究中起重要作用。从有限可加性的证明(见书P30)知,可列可加可以推出有限有加,但反之却不行,必须加上连续性,见下面的定理:
定理1.1 设P是F上的非负实值集函数,且P=1,则P是可列可加的充要条件是 (1)P是有限可加的;(2)P是下(或上)连续的。
例1.21 (配对问题)将n封写好的信随机装入n个写好地址的信封,求 (1)没有一封配对的概率q0; (2)恰有r封配对的概率qr(r≤n)。 解:(1)记Ai{第i封信配对}
nA则q0PA1An1Pi i1由古典概率的计算法,得PAi
1n,i1,,n
18
故S1PAii1nnn1
又PAiAj1nn1,1ijn
故S2n11 PAAij21ijnnn12!1k!类似可得:Sk,1≤k≤n
n1于是q01s1s21nsn
=k01kk!e1,当n时
(2){恰有n封配对}可以通过三步来实现:第一步:从n封信中选出r封来,共有种选
rn法。第二步:选出的r封信都配对,由(1)的分析,这种可能性是
1nn1nr1。第
nr三步:剩下的nr封没一封配对,这种可能性是
k01k!。由乘法原理,得
nrn11qrrnn1nr1k!k0knrk01kk!。
§1.5 条件概率,全概公式及Bayes公式
一、条件概率
在实际问题中,除了考虑事件A发生的概率PA,有时还需考虑在“事件B已发生”的条件下,事件A发生的概率。由于增加了新的条件“事件B已发生”,所以后者的概率一般来说不同于PA,我们称它为A对B的条件概率。记为PA|B。
19
定义1.3 若(Ω,F,P)为一概率空间,BF且PB0。则对任意AF,称 PA|BPABPB (1.20)
为在已知事件B发生的条件下,事件A发生的条件概率,或A对B的条件概率。 例1.22 已知某家三胞胎小孩中有女孩,求至少有一个男孩的概率(假定每 个小孩是男是女是等可能的)。
解:三胞胎小孩的所有可能结果不难一一列出,即
Ω={(女,女,女),(女,女,男)(女,男,女),(男,女,女),(女,男,男),(男,女,男),(男,男,女),(男,男,男)}共含8个样本点。 记A={三胞胎中至少一个是男孩},B={三胞胎中有女孩}。 由Ω看出PB故PA|B78,PAB68
PABPB67。
易验证P|B是F上的一个概率,即有:
定理 设(Ω,F,P)为概率空间,BF,PB0。对任意AF,让PA|B与之对应,则集函数P|B为F上的一个概率。
上面的定理表明(Ω,F,P|B)也构成一概率空间,称它为条件概率空间。 对于古典概型,计算条件概率除按定义式(1.20)外,还有另一种考虑法,即重新考虑样本空间为BBB,易验证,B中子集类FBAB:AF是B上的—域,将(Ω,F)上定义的P平移至(B,FB,PB)是一概率空间,这里的PB与(Ω,F,P|B)上的P|B一样。按后一种考虑,在例1.20中,B=B含7个样本点,而A包含B中6个样本点,按古典概率的计算法。
20
PBA67PA|B
二、乘法公式 由条件概率的定义
PABPAPB|A (PA0) (1.21)
PBPA|B (PB0)
一般地,有
PA1A2AnPA1PA2|A1PAn|A1A2An1(PA1A2An10)(1.22)
(1.21) (1.22)称为乘法公式,在概率计算中有重要作用。
例1.23 罐中有三个白球两个黑球,从中依次取出三个,试求取出的三个球都是白球的概率。
解:记Ai={第i次取球得白球} 易得PA135,PA2|A124,PA3|A1A21故PA1A2A3PA1PA2|A1PA3|A1A2三、全概公式和Bayes公式
31。
10定理1.2 设B1,B2是一列互不相容事件,且PBi0,则对任意
有PAABi,i1 PBPA|B (1.23)
iii1且称(1.23)为全概公式。
例1.24 某工厂有四条流水线生产同一种产品,该四条流水线的产量分别占总产量的15%,20%,30%,35%,又这四条流水线的次品率依次为0.05,0.04,0.03,0.02,现从出厂产品属任取一件,问恰好取到次品的概率为多少?
解:令A={任取一件出厂产品为次品}
Bi={所抽产品中第i条流水线生产}(i=1,2,3,4)
21
则PAPBPA|B0.150.050.200.040.300.030.350.02
iii14=0.0315=3.15%
在上面的例中,若该厂规定,出了次品要追究有关流水线经济责任,现从出厂产品中抽到一件次品,但该次品是哪一条流水线生产的标志已经脱落,问厂方应如何处理这件次品的经济责任才合理。
不难理解,可按PB4|A的大小来追究第4条流水线的经济计划责任。 PB4|APB4APAPB4PA|B40.0070.03150.222。
PBPA|Biii14这就是说第条流水线应负22.2%的责任。
上面计算实际上已告诉我们一个极为有用的公式,常称为Bayes公式或逆概公式。即有
定理1.3 若B1,B2,为列互不相容的事件,且PBi0,Bi
i则对任一事件A,有PBi|APBiPA|BiPBPA|Biii1 (1.24)
i1,2,„„ 证„„
以上面的例来说,“抽查一次产品”是进行一次试验,那么PBi是在试验之前就已经知道的概率,所以常称它们为先验概率(先于试验),实际上它是过去已经掌握的情况的反映,对试验将要出现的结果提供了一定的信息,在上面的例中,试验结果出现不合格品(A发生了),这时条件概率PBi|A反映了在试验之后,对A发生的某种“来源”(即次品的来源)的可能性大小的估计,常称为后验概率,若B1,B2,Bn是病人可能患的n种不同疾病,在诊断前先检验与这些疾病有关的某些指标(如体温、血压、白血球、转氨酶含量等)若检查结果病
22
人的某些指标偏离正常值了(即A发生了),从概率的角度考虑,若PBi|A大,则病人患Bi病的可能性也较大。但要用Bayes公式计算出PBi|A,需把过去病例史中得到的先验概率。人们常喜欢找“有经验”的医生给自己治PBi值代入(医学上称PBi为Bi病人发病率)
病,因过去的经验能帮助医生作出较准确的诊断,而Bayes公式正是利用了“经验”的知识,这类方法过去和现在都受到人们普遍重视。并称之为Bayes方法。
例1.25(书P40——41例1.19)
§1.6 事件的独立性
定义1.4 对任意两个事件A、B,若有
PABPAPB (1.25)则称事件A与B是相互独立的,简称为独立的。
独立性是概率论中一个很重要的概念,几乎遍及概率统计的各个角落。关于两个事件的独立性有如下性质:
1.若PA0(或PB0),则A与B相互独立的PBPB|A(或。 PAPA|B)
2.A与B独立,则A与B独立,A与B独立,A与B独立。 3.PA0或PA1,则A与任意事件B独立。 证„„
例1.26 从装有a只黑球,b只白球的袋中无放回地摸球两次,记A=“第一次摸到黑球”,B=“第二次摸到黑球”。试验证A与B是否独立。
二、多个事件的独立性
n定义1.5 对n个事件A1,A2An,若有下面的2n1个等式成立:
23
PAiAjPAiPAj 1ijn
PAiAjAkPAiPAjPAk ,1ijkn
„„
PA1A2AnPA1PA2PAn (1.26)则称A1,An相互独立。(书P46列出n=3的特例)
由定义看出,若n个事件相互独立,则它们中的任意m个(2≤m<n)也是相互独立的。且还有:
性质定理:若A1,A2An相互独立,则把其中任意个Ai换成Ai后所得的n个事件仍相互独立。
对于可列个事件,有如下的
定义 1.6 若可列个事件A1,A2中任意有限个事件都相互独立的,则称A1,A2相互独立。
从事件相互独立的定义及性质看出,对于独立事件,用乘法公式特别简便,但对n≥3的情形,用定义来验证n个事件是否独立都比较麻烦,人们常根据问题所反映的条件直接加以判断。
例1.26 假定每个人的血清中含有肝炎病毒的概率为0.004,混合100个人的血清,求此混合血清含肝炎病毒的概率。
分析与解:记Ai=第i个人的血清中含病毒,i1,2,100。
100A由经验可以判定Ai间是相互独立的,题目需求Pi,因{Ai}间显然不是两两相斥i1的,用加法公式计算就很麻烦,我们可以用对偶原理,将事件的并的运算转化为事件的交的运算,从而改用乘法公式。即
100100PAi1PAi1PA1PA100
i1i1
24
=1-(1-0.004)100=0.33。
独立事件的乘法公式在计算系统的可靠性上也很有用处。 例1.27 (书P46例1.23)
§1.7 贝努里概型
若试验E只有两个可能的结果:A及A,且PAp,PA1pq0p1,那么称E为一个贝努里(Bernoulli)试验。且常称A为“成功”事件。
我们把进行一次贝努里实验或独立重复地进行若干次贝努里试验的概率模型称作努里概型。特别,将一个贝努里试验E独立重复地进行n次所构成的概率模型称为n重贝努里概型或n重贝努里试验,用En表示,En的每一个可能结果可以记作
1,2,n,其中1A或A
即E的样本空间为
n1,2,n:iA或A,i1,,n,共含2个样本点。
n将试验独立地进行n次,指各次试验是相互独立的,所谓“试验是相互独立的”则理解为试验的结果是相互独立的。于是E的样本点中各分量i之间相互独立。
P12nP1P2Pn
n二、贝努里概型中重要事件的概率
1.记Bk={n重贝努里试验中A恰好出现k次}。则由试验独立性的意义及概率的有限可加性,得
nknkPnkPBk 0kn (1.27) kPq例1.27 设某人打靶的命中率为0.7,现独立重复地射击5次,求恰好命中两次的概率。
25
解:每次打靶只有两个可能结果:A=“命中”,A=“没有命中”,而pPA0.7,问题归结为5重贝努里试验,所求概率为
523P5220.70.30.132。
例1.28 对某种药物的疗效进行研究,假定这药物对某种疾病的治愈率p=0.8,有10个患此病的病人同时服用这种药,求其中至少6个病人治愈的概率P.
解:任一病人服用该药只有两种结果:治愈(A发生)或没有治愈(A发生),且 PA0.8,PA0.2
因每个病人服药后是否治愈是彼此独立的,问题可归为10重贝努里概型。由概率的有限可加性
10Pk6P10k10k10k0.80.20.97。 kk610例1.29 (书P49例1.24)
2.将贝努里试验独立重复地进行下去直到出现首次成功为止。 记Wk=“首次成功出现在第k次试验”
k1个则WkAAAA,故
PWkpqk1,k1,2 (1.28)
(1.31)所示的概率是一个几何级数的一般项,称之为几何分布,第二章将进一步的讨论它。
例1.30(书P50例1.26)
3.将贝努里试验独立重复地进行下去,直到出现r次成功为止。
记Ck=“第r次成功出现在第k次试验” k≥r,则Ck发生当且仅当第k次试验出现成功事件A,而前k-1次恰好出现r-1次,故得:
26
k1r1k1k1rkr PCkpqp,kr (1.29)r1r1pq(1.29)所示的概率称为巴斯卡分布。
例1.31 一人驾车从城中甲地到乙地,途中经过若干交通路口,设他在每个路口遇“红灯”的概率均为0.4,试求:
(1)此人过5个路口仅遇到一次“红灯”的概率; (2)此人第5次过路口才遇到“红灯”的概率; (3)此人第5过路口已是第3次遇“红灯”的概率。
解:此人每过一路口有两个结果:A=“遇红灯”或A=“遇绿灯” 且PA0.4
4(1)P1510.40.60.259
54(2)PW50.4060.052
220.40.60.40.138 (3)PC524
27
因篇幅问题不能全部显示,请点此查看更多更全内容