常见的分布及其性质
泊松分布(Poisson Distribution)
X∼P(λ)X∼π(λ)P(X=k)=k!λke−λ,k=0,1,2
性质:
-
数学期望和方差都等于参数λ
-
λ>0
-
可加性:
若随机变量 X∼π(λ1),Y∼π(λ2),且X,Y相互独立。若Z=X+Y,则Z∼π(λ1+λ2)
X∼U(a,b)
X具有概率密度
f(x)={b−a1,x∈(a,b)0,else
方差为
D(X)=12(a−b)2
指数分布(Exponential Distribution)
X∼E(λ)
X服从参数为λ的指数分布时,X具有概率密度
f(x)={λe−λx,x>00,else
X的分布函数
F(x)={1−e−λx,x>00,else
服从指数分布的随机变量X具有无记忆性,即满足
P(X>t0+t∣X>t0)=P(X>t)
数学期望和方差:
E(X)=λ1D(X)=λ21
正态分布
X∼N(μ,σ2)
服从正态分布的随机变量的概率密度函数满足
f(x)=2πσ21e−2σ2(x−μ)2,−∞<x<+∞
若Z∼N(0,1),称Z服从标准正态分布,Z的概率密度:
ϕ(x)=2π1e−2x2
普通正态分布转换为标准正态分布的计算公式
当X∼N(μ,σ2)时,σX−μ∼N(0,1)
P(x≤b)=Φ(σb−μ)
μ,σ分别是普通正态的均值和标准差。
几何分布(Geometric Distribution)
几何分布指的是在一系列伯努利试验中,第一次成功出现之前的失败次数为k-1时的概率
P(X=k)=(1−p)k−1p
性质
-
期望
E(X)=p1−p
-
方差
D(X)=p21−p
Γ函数求积分
Γ函数的表达如下
Γ(z)=∫o∞tz−1e(−t)dt
对于z为整数的时候,可以直接进行积分
-
Γ(21)=π
-
Γ(n)=(n−1)!
随机变量的分布函数
定义:X为一随机变量,对任意实数x,函数F(x)=P(X≤x)为随机变量X的概率分布函数,简称分布函数,任何随机变量都有相应的分布函数
离散型随机变量及其分布函数
一般地,离散型随机变量的分布律为P{X=xk}=pk,由此可得X的分布函数为F(x)=∑xk≤xpk,分布函数再x=xk处有跳跃,跳跃值为pk=P{X=xk}
连续型随机变量及其分布函数
定义:对于随机变量X的分布函数F(x),若存在非负函数f(x),使得对于任意实数x,有:
F(x)=∫−∞xf(t)dt
则称X为连续型随机变量,f(x)称为X的概率密度函数。
二元随机变量
离散型二元随机变量
定义:若二元随机变量(X,Y)全部可能取到的不同值是有限对或可列无限对,则称(X,Y)是离散型二元随机变量。二元随机变量的分布律如下:
P(X=xi,Y=yi)=pij
边际分布
对于上述的离散型随机变量,X,Y的边际分布律为:
P(Y=yi)=P(X<+∞,Y=yi)=i=1∑∞pijP(X=xi)=P(X=xi,Y<+∞)=j=1∑∞pij
条件分布
对于二元离散型随机变量X,Y,若P(Y=yj)=p⋅j>0,那么条件概率
P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)=P⋅jPij
为在 Y=yj条件下,随机变量X的条件分布律。
二元随机变量的分布函数
定义:设(X,Y)是二元随机变量,对于任意实数x,y,二元函数
F(x,y)=p{(X≤x)∩(Y≤y)}=P(X≤x,Y≤y)
称为二元随机变量(X,Y)的分布函数
边际分布函数
对二元分布函数进行积分,对x进行积分得到的是y的边际分布函数,反之亦然
FX(x)=F(x,∞)FY(y)=F(∞,y)
条件分布函数
若P(Y=y)>0,那么在Y=y的条件下,X的分布函数为:
F(X∣Y)(x∣y)=P(X≤x∣Y=y)=P(Y=y)P(X≤x,Y=y)
若P(Y=y)=0,但对任意给定的ϵ>0,都有P(y<Y≤y+ϵ)>0,则在Y=y的条件下,X的分布函数为:
FX∣Y(x∣y)=ϵ→0+limP(X≤x∣y<Y≤y+ϵ)=ϵ→0+limP(y<Y≤ϵ+y)P(X=x,y<Y≤ϵ+y)
也还是记作
P(X≤x∣Y=y)
联合概率密度
对于二元随机变量(X,Y)的分布函数 F(x,y),如果存在非负函数f(x,y),使对于任意x,y有
F(x,y)=∫−∞x∫−∞yf(u,v)dvdu
称(X,Y)为二元连续型随机变量,称f(x,y)为二元随机变量(X,Y)的联合概率密度
在f(x,y)的连续点(x,y),有
∂x∂y∂2F(x,y)=f(x,y)
边际概率密度
对于连续型随机变量(X,Y),联合概率密度为f(x,y),边际概率密度为
fX(x)=∫−∞+∞f(x,y)dyfY(y)=∫−∞+∞f(x,y)dx
条件概率密度
对于连续型随机变量(X,Y),联合概率密度为f(x,y),(X,Y)关于Y的边际概率密度为fY(y),若对于固定的y,fY(y)>0,则
fY(y)f(x,y)
为在Y=y的条件下,X 的条件概率密度,记为
fX∣Y(x,y)=fY(y)f(x,y)
对X=x的条件下,Y的条件概率密度,记为
fY∣X(x,y)=fX(x)f(x,y)
随机变量的独立性
设F(x,y),FX(),FY(y)分别是二元随机变量 (X,Y)的分布函数和边际分布函数,若对所有的(x,y)都有P(X≤x,Y≤y)=P(X≤x)P(Y≤y)即
F(x,y)=FX(x)FY(y)
称随机变量X,Y相互独立
- 若随机变量X,Y是离散型的,那么pij=pipj对一切i,j都成立
- 若随机变量X,Y是连续型的,那么f(x,y)=fX(x)fY(y)处处成立
随机变量函数的分布
问题:已知随机变量X的分布,且已知Y=g(x),求Y的概率分布。
一般,上述问题的求解方法为:等价变换法
- 对于离散型随随机变量X,只需找到 Y的等价事件即可,即先写出Y的可能取值,再找出(Y=yj)的等价事件Xi,然后进行概率对应
- 若为离散型的随机变量X,那么先写出Y的概率分布函数FY(y)=P(Y≤y),找到Y≤y的等价时间X∈D,得到FY(y)=P(X∈D),再求出Y的概率密度函数fY(y)
定理 反函数法
设X∼fX(x),−∞<x<+∞,g′(x)>0或(g′(x)<0),Y=g(X),则 Y具有概率密度函数为
fY(y)={fX(h(y))⋅∣h′(y)∣,α<y<β0,else
这里 α,β是Y的取值范围,h是g的反函数h(y)=x.
二元随机变量函数的分布
问题:设二元离散型随机变量(X,Y)具有概率分布P(X=xi,Y=yj)=pij,设U=u(X,Y),V=v(X,Y),则 (U,V)的分布律是什么,Z=g(X,Y)的分布律是什么?
- 对于 U,V,Z为离散型的情况,只要找到对应的等价事件就可以了
Z=X+Y的分布
-
设(X,Y)为离散型随机变量,分布律为:
P(X=xi,Y=yj)=pij
设Z的可能取值为z1,z2,...,zk,...,则Z=X+Y的分布律为
P(Z=zk)=P(X+Y=zk)=i=1∑+∞P(X=xi,Y=zk−xi)
当X,Y相互独立时
P(Z=zk)=i=1∑+∞p(X=xi)P(Y=zk−xi)
-
设(X,Y)为连续型随机变量,概率密度为 f(x,y),FZ(z)=P(Z≤z)=∬x+y≤zdxdy.可以得到Z 的概率密度为
fZ(z)=∫−∞+∞f(z−y,y)dy
由X,Y的对称性,也可以写为
fZ(z)=∫−∞∞f(x,z−x),dx
当X,Y相互独立时, Z=X+Y的密度函数公式称为卷积公式
fZ(z)=∫−∞+∞fX(z−y)fY(y)dy=∫−∞+∞fX(x)fY(z−x)dx
M=max(X,Y),N=min(X,Y)的分布
设X,Y是两个相互独立的随机变量,它们的分布函数分别为FX(x),FY(y),现在求M,N的分布函数Fmax(z),Fmin(z).
Fmax(z)=FX(z)FY(z)Fmin(z)=1−P(N>z)=1−P(X>z,Y>z)=1−(1−FX(z))(1−FY(z))
可以推广到n个相互独立的随机变量的情况
计算max(X1,X2,...,Xn)的分布函数:
-
算出一个随机变量X的分布函数
-
用一个随机变量的分布函数F(x)计算整体的分布函数
-
Fmax(X1,X2,...,Xn)(x)=(F(x))N
-
Fmin(X1,X2,...,Xn)(x)=1−(1−F(x))n
随机变量的数字特征
数学期望
对离散型随机变量X,若级数
k=1∑∞xkpk
绝对收敛,那么该级数的值就是随机变量X的数学期望,记为E(X)
E(X)=k=1∑∞xkpk
对于连续型随机变量,若积分
∫−∞+∞xf(x)dx
绝对收敛,则该积分的值就是随机变量X的数学期望,记为E(X)
E(X)=∫−∞+∞xf(x)dx
对于随机变量Y=g(X),有定理(该定理也可推广到两个或两个以上的随机变量的函数的情况)
E(Y)=∫−∞+∞g(x)f(x)dx
设 Z=h(X,Y),X,Y为连续型随机变量(离散型同理累加即可), Z的数学期望为
E(Z)=∫−∞+∞h(x,y)f(x,y)dxdy
同时还有
E(X)=∫−∞+∞∫−∞+∞xf(x,y)dxdyE(Y)=∫−∞+∞∫−∞+∞yf(x,y)dxdy
数学期望的性质
-
E(C)=C,C为常数
-
E(CX)=CE(X),X为随机变量,C为常数
-
E(X+Y)=E(X)+E(Y),X,Y是两个随机变量(不一定相互独立)
-
E(XY)=E(X)E(Y),X,Y是相互独立的随机变量
上述第三和第四两个定理都可以推广到任意有限个的情况
方差
X是一个随机变量,若 E{[X−E(X)]2}存在,则称其为X的方差,记为D(X)或Var(X),即
D(X)=Var(X)=E{[X−E(X)]2}
对于离散型随机变量
D(X)=i=1∑∞[xi−E(X)]2∗pi
对于连续型随机变量
D(X)=∫−∞+∞[x−E(X)]2f(x)dx
方差计算公式
D(X)=E(X2)−[E(X)]2
方差的性质
-
D(C)=0,C为常数
-
D(CX)=C2D(X),X为随机变量,C为常数
-
D(X+Y)=D(X)+D(Y)+2E[X−E(X)][Y−E(Y)]若X,Y相互独立,则有D(X+Y)=D(X)+D(Y)
协方差与相关系数
两个随机变量的和的方差计算公式中的
E{[X−E(X)][Y−E(Y)]}
称为随机变量X,Y的协方差。记为
Cov(X,Y)
即
Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
定义随机变量X与Y的相关系数ρXY为
ρXY=D(X)D(Y)Cov(X,Y)
协方差的计算公式
Cov(X,Y)=E(XY)−E(X)E(Y)
方差计算公式的重写
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
推广到任意有限个随机变量的和的情况
D(i=1∑nXi)=i=1∑nD(Xi)+21≤i≤j≤n∑Cov(Xi,Xj)
协方差的性质
-
Cov(X,Y)=Cov(Y,X)
-
Cov(X,X)=D(X)
-
Cov(aX,bY)=ab⋅Cov(X,Y),其中a,b为实数
-
Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
相关系数的性质
-
∣ρXY∣≤1
-
∣ρXY∣等价于存在常数a,b使得P(Y=a+bX)=1,特别的,ρXY=1,b>0,ρXY=−1,b<0
-
当D(X)D(Y)=0时,有
(Cov(X,Y))2≤D(X)D(Y)
其中等号当且仅当X与Y之间有严格的线性关系,即存在常数a,b使得p(Y=a+bX)=1
标准化随机变量
对于任意随机变量X,作
X∗=D(X)X−E(X)
则
E(X∗)=0,D(X∗)=1
X∗称为标准化随机变量
ρXY=Cov(D(X)X−E(X),D(Y)Y−E(Y))
不相关
ρXY=0,称 X与Y不相关,等价条件有
-
Cov(X,Y)=0
-
E(XY)=E(X)E(Y)
-
D(X+Y)=D(X)D(Y)
X,Y相互独立,那么X,Y一定不相关,反之,若X,Y不相关,X,Y却不一定相互独立
二元正态变量
若二元随机变量X(X,Y)服从二元正态分布,则X,Y的任意线性组合aX+bY服从一元正态分布,其中a,b为不全为0的常数。且
aX+bY∼N(E(aX+bY),D(aX+bY))
正态变量的线性变换不变性
若(X,Y)服从二元正态分布,设Z1,Z2是X,Y的线性函数,则(Z1,Z2)也服从二元正态分布,这一性质称为正态变量的线性变换不变性
(Z1,Z2)∼N(E(Z1),D(Z1),E(Z2),D(Z2),ρZ1Z2)
大数定律和中心极限定律
大数定律
设X1,...Xn是一系列随机变量,对于任意一个Xi都有E(Xi)=μ,则在一定条件下,随机变量序列
Yn=nX1+...+Xn
收敛到μ。
随机变量序列依概率收敛的定义
对于随机变量序列Y1,Y2,...,若存在某常数a,使得∀ϵ>0都有limn→∞P{∣Yn−a∣≥ϵ}=0,则称Yn依概率收敛到常数a。
性质
若随机变量序列Xn,Yn分别依概率收敛到a,b,那么对于一个连续函数映射g,就会满足
g(Xn,Yn)Pg(a,b)
切比雪夫不等式
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意的ϵ>0,都有
P{∣X−E(X)∣≥ϵ}≤ϵ2σ2
等价形式为
P{∣X−E(X)∣<ϵ}≥1−ϵ2σ2
切比雪夫大数定律
设随机变量X1,X2,...Xn相互独立,并且有相同的数学期望 μ和相同的方差σ2,当n→+∞时
n1k=1∑nXkPμ
辛钦大数定律
设X1,X2,...Xn独立同分布,E(Xi)=μ,则当n→+∞
n1k=1∑nXkPμ
伯努利大数定律
设nA为n重伯努利实验中A发生的次数,并记事件A在每次试验中发生的概率为p,则有
nnAPp,n→+∞
中心极限定理
独立同分布的中心极限定理
设X1,X2,...,Xn独立同分布,E(Xi)=μ,D(Xi)=σ2,则当n足够大时
i=1∑n∼N(nμ,nσ2)n1i=1∑n∼N(μ,nσ2)
数理统计
基础概念
总体:研究对象的全体
个体:总体中的成员
数理统计的主要任务是从总体中抽取一部分个体,然后根据这部分个体的数据对总体分布进行判断,被抽取的部分个体叫做总体的一个样本
随机样本:从总体中随机地取n个个体,称为一个随机样本。
简单随机样本:满足以下两个条件的随机样本(X1,X2,…,Xn)称为容量是n的简单随机样本。(一般提到的样本都是简单随机样本)
- 每个Xi与X同分布
- X1,X2,…,Xn是相互独立的随机变量
由概率论可知,如果总体具有概率函数f(x),那么简单随机样本具有联合密度函数
由于每一个Xi与X同分布,所以具有相同的概率密度函数,又因为每一个Xi相互独立,所以可以直接乘起来得到联合密度函数
fn(x1,X2,...xn)=i=1∏nf(xi)
一个容量为n的样本X1,X2,…,Xn是值n个独立并且与总体分布相同的随机变量,一旦对样本进行观察,得到实数x1,x2…xn,称为样本的观察值,两次观察,样本值可能是不同的。
如何进行取样
对于有限的总体,采取放回抽样得到简单随机样本,对于总体容量很大或者无限总体采取不放回抽样得到简单随机样本。
统计量:样本的不含任何未知参数的函数
设X1,X2,…,Xn为取自总体X的样本,常用的统计量如下
样本方差S2=n−11∑i=1n(Xi−X)2,S为样本标准差
E(X)=E(X)
D(X)=nD(X)
E(S2)=D(X)
样本距
-
k阶距:
Ak=n1i=1∑nXik,(k=1,2,...)
-
k阶中心距
Bk=n1i=1∑n(Xi−X)k,(k=1,2,...)
这些统计量都是作为总体数字特征未知时的估计。
常见的分布
χ2分布
设随机变量X1,X2,…Xn相互独立,且对于每一个Xi∼N(0,1)(i=1,2,...),则称
χn2=i=1∑nXi2
服从自由度为n的χ2分布,记作
χ2∼χ2(n)
自由度指的是独立变量的个数。
χ2分布的性质
-
设χ2∼χ2(n),那么
E(χ2)=n,D(χ2)=2n
-
设Y1∼χ2(n1),Y2∼χ2(n2),且Y1,Y2相互独立,那么
Y1+Y2∼χ2(n1+n2)
性质2为χ2分布的可加性,可推广到有限个的一般情况。
对于一个给定的概率α,0<α<1,称满足条件∫χα2(n)∞fn(y)dy=α的点χα2(n)为χ2(n)分布上的α分位数
t分布
设X∼N(0,1),Y∼χ2(n),并且假设X,Y相互独立,则称随机变量T=nYX服从自由度为n的t分布,记为
T∼t(n)
对于给定的α,0<α<1,称满足∫tα(n)∞f(t,n)dt=α的点tα(n)为t(n)分布的α分位数。
t1−α(n)=−tα(n)
F分布
设X∼χ2(n1),Y∼χ2(n2),且X,Y独立,则称随机变量F=n2Yn1X服从自由度为(n1,n2)的F分布,记为
F∼F(n1,n2)
对于给定的α,0<α<1,称满足条件∫Fα(n1,n2)∞f(x;n1,n2)dx=α的点Fα(n1,n2)为F(n1,n2)分布的α分位数
注意:若X∼t(n),那么X2∼F(1,n)
正态分布下的抽样分布
设X1,X2,…X3为来自正态总体N(μ,σ2)的简单随机样本,X是样本均值,S2是样本方差,则有
X∼N(μ,nσ2)
定理:在上述条件下,有
-
σ2(n−1)S2∼χ2(n−1)
-
X与S2相互独立
注意
-
σ2∑i=1n(Xi−X)2∼χ2(n−1)
-
σ2∑i=1n(Xi−μ)2∼χ2(n)
定理:仍然在上述条件下,有
nSX−μ∼t(n−1)
定理:设样本(X1,X2,...Xn)和(Y1,Y2,...Yn)分别来自总体N(μ1,σ12)和N(μ2,σ22)并且他们互相独立,其样本方差分别为S12和S22,那么有
-
S22/σ22S12/σ12∼F(n1−1,n2−1)
-
n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
-
当σ12=σ22=σ2时
Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中
Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
参数估计
当总体的参数未知时,需要利用样本对其给出估计,这就是参数估计,参数估计有两类方法:点估计和区间估计
参数的点估计
设总体有未知参数θ, X1,...Xn是X的简单随机样本。
点估计:构造合适的统计量θ^=θ^(X1,...,Xn)来估计未知参数θ,θ^为θ的点估计量,当给定样本观察值x1,...,xn的时候,称θ^(x1,...,xn)为参数θ的点估计值
常用的点估计方法:矩法,极大似然法
矩估计法
统计思想:以样本矩估计总体矩,以样本矩的函数估计总体矩的函数
理论根据:辛钦大数定律和依概率收敛的性质
总体X的k阶矩
μk=E(Xk)
样本X1,X2,...,Xn的k阶矩:
Ak=n1i=1∑nXik
由大数定理:
AkPμk=E(Xk)
解方程Ak=μk
解题步骤:
- 先用参数表示均值,或k阶中心距,然后反解参数,用均值或k阶中心距表示参数
- 将样本的k阶中心距带入上面求得的参数表达式,求得估计参数的值
- 如果一阶中心距积分为0,那么就求二阶中心距
极大似然估计
一般地,设离散型总体 X∼p(x;θ),θ∈Θ, θ未知,从总体X取得样本X1,X2,...,Xn,其观察值为 x1,x2,...xn,则事件{X1=x1,X2=x2,...Xn=xn}发生的概率为
L(θ)=P{X1=x1,..Xn=xn}=p(x1;θ)...p(xn;θ)=i=1n∏p(xi;θ)
极大似然原理
L(θ^(x1,x2,...,xn))=θ∈ΘmaxL(θ)
取使得似然函数取得最大值的θ.
对于总体X是连续型的情况,似然函数定义为
L(θ)=i=1∏nf(xi,θ)
tips:
- 未知参数可能不止一个,一般设为θ=(θ1,θ2,...,θ3)
- 求解L(θ)的最大值时,通常取对数运算
- 如果L(θ)是关于某一个θi单调的,此时θi的极大似然估计在其边界处取得
- 若θ^是θ的极大似然估计,那么g(θ)的极大似然估计为g(θ^)
估计量的评选准则
对于总体参数的估计,采用不同的估计方法可以求得不同的估计量,对于估计量,有四条评价准则
- 无偏性准则
- 有效性准则
- 均方误差准则
- 相和型准则
无偏性准则
定义:若参数θ的估计量θ^(X1,X2,...,Xn)满足E(θ^)=θ,则称θ^是θ的一个无偏估计量。若θ^=θ,那么,∣E(θ^)−θ∣称为估计量θ^的偏差。若limn→∞E(θ^)=θ,则称θ^是θ的渐进无偏估计量
有效性准则
定义:设θ^1,θ^2是θ的两个无偏估计,如果D(θ^1)≤D(θ^2),对一切θ∈Θ成立,且不等号至少对某一θ∈Θ成立,则称θ^1比θ^2有效。
均方误差准则
定义:设θ^是参数θ的点估计,方差存在,则称 E(θ^−θ)2是估计量的均方误差,记为Mse(θ^).
Mse(θ^)=D(θ^)+(E(θ^)−θ)2
若θ^是θ的无偏估计,则有
Mse(θ^)=D(θ^)
相合性准则
设θ^(X1,X2,..,Xn)为参数θ的估计量,若对于任意的θ∈Θ,当n→+∞时,θn^依概率收敛为 θ,即∀ϵ>0,有limn→+∞P{∣θn^−θ∣≥ϵ}=0,称θn^为θ的相合估计量或一致估计量。
例题
设总体X∼U[0,θ],X1,...,Xn是取自X的样本,证明θ1^=2X和θ2^=nn+1X(n)是 θ的相合估计
证明
E(θ1^)=E(θ2^)=θ,D(θ1^)=3nθ2,D(θ2^)=n(n+2)θ2由切比雪夫不等式,∀ϵ>0,当n→+∞时,有:P{∣θ1^−θ∣≥ϵ}≤ϵ2D(θ1^)→0同理:P{∣θ2^−θ∣≥ϵ}≤ϵ2→0D(θ2^)所以θ1^和θ2^都是θ的相合估计
区间估计
假设(X1,..Xn)时总体X的一个样本,区间估计的方法是给出两个统计量,θ1^=θ1^(X1,...,Xn),θ2^=θ2^(X1,...,Xn)使区间[θ1^,θ2^]以一定的可靠程度覆盖住θ
置信区间的定义
设总体X的分布函数F(x;θ)含有一个未知参数θ,(X1,..,Xn)是总体X的一个样本,对给定的值α(0<α<1),如果有两个统计量θL^=θL^(X1,...,Xn),θU^=θU^(X1,...,Xn)使得
P{θL^(X1,...,Xn)<θ<θU^(X1,...,Xn)}≥1−α,∀θ∈Θ
则称随机区间θL^,θU^是 θ的双侧置信区间,称1−α为置信度,θL^,θU^分别为双侧置信下限和双侧置信上限
枢轴量法
设总体X有概率密度f(x;θ)其中θ是待估计的未知参数,并设X1,...,Xn是来自该总体的样本,称样本和未知参数的函数G(X1,...,Xn;θ)为枢轴量。
枢轴量和统计量的区别
- 枢轴量是样本和待估参数的函数,其分布不依赖于任何未知参数
- 统计量只是样本的函数,其分布常常依赖于未知参数
构造置信区间的具体步骤
-
构造一个分布一致的枢轴量G(X1,...,Xn;θ)
-
对连续性总体和给定的置信度1−α,设常数a<b满足
P{a<G(X1,...,Xn;θ)<b}=1−α
-
若能从a<G(X1,...,Xn;θ)<b得到等价的不等式
θL^(X1,...,Xn)<θ<θU^(X1,...,Xn)
那么(θL^,θU^)就是θ的置信度为1−α的置信区间
枢轴量的构造,通常从参数的点估计θ^出发,根据θ^ 的分布进行改造而得
正态总体下常见的枢轴量
单个正态总体N(μ,σ2)情形
μ的枢轴量
{σn(X−μ)∼N(0,1),σ2已知Sn(X−μ)∼t(n−1),σ2未知
置信区间分别为
(X−nσz2α,X+nσz2α)(X−nSt2α(n−1),X+nSt2α(n−1))
σ2的枢轴量
σ2(n−1)S2∼χ2(n−1)
置信区间为
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
两个正态总体N(μ1,σ12),N(μ−2,σ22)
μ1−μ2的枢轴量:
⎩⎨⎧n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1),σ12,σ22已知Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2),σ12=σ22未知
置信区间分别为
((X−Y)±z2αn1σ12+n2σ22)((X−Y)±t2α(n1+n2−2)Swn11+n21)
σ22σ12的枢轴量
S22S12/σ22σ12∼F(n1−1,n2−1),μ1,μ2未知
置信区间为
(S22S12F2α(n1−1,n2−2)1,S22S12F1−2α(n1−1,n2−2)1)
假设检验
统计推断的另一类重要问题的假设检验问题,包括
- 已知总体分布的形式,需对其中的未知参数给出假设检验(参数检验)
- 总体分布形式完全未知的情况下,对总体的分布或数字特征进行假设检验(非参数检验)
假设
原假设(零假设)H0,备择假设(对立假设)H1,关于总体参数θ的假设
H0:θ≥θ0,H1:θ<θ0(左边检验)H0:θ≤θ0,H1:θ>θ0(右边检验)H0:θ=θ0,H1:θ=θ0(双边检验)
检验统计量和拒绝域
如果统计量T=T(X1,X2,...,Xn)的取值大小和原假设H0是否成立由密切关系,可将之称为对应假设问题的检验统计量,对应于拒绝原假设H0时,样本值的范围称为拒绝域,记为W,其补集W称为接受域
两类错误
由于样本的随机性,任意检验规则在应用时,都有可能发生错误的判断
第一类错误:拒绝真实的原假设(弃真)
第二类错误:接受错误的原假设(取伪)
犯第一类错误的概率为α
α=P{拒绝H0∣H0是真的}
犯第二类错误的概率为 β
β=P{接受H0∣H0是假的}
犯两类错误的概率相互制约,使得在给定样本量 n下,不可能找到界值C使得α(C),β(C)都尽可能小
Neyman-Pearson
原则
首先控制犯第一类错误的概率不超过某个常数 α∈(0,1),再寻找检验,使得犯第二类错误的概率尽可能小,其中的常数 α称为显著水平,常取α=0.1,0.05,0.01等
P_
值与统计显著性
P_
值:当原假设成立时,检验统计量取比观察到的结果更为极端的数值的概率
P=PH0(∣X−μ∣≥∣x−μ∣)
上式表示了P_
的含义,即抽取一个样本的均值与原假设实际均值的差值大于这一次抽样的均值与原假设实际均值的概率,如果概率很小,那么说明原假设成立即为小概率事件。
P_
与显著水平α的关系:
- 若P_≤α,等价于样本落在拒绝域内,因此,拒绝原假设,此时称检验结果在水平α下是统计显著的
- 若P_>α,等价于样本不落在拒绝域内,因此,不拒绝原假设,此时称检验结果在水平 α下是统计不显著的
处理假设检验的基本步骤
- 根据实际问题提出原假设和备择假设
- 提出检验统计量和拒绝域的形式
- 在给定的显著水平 α下,根据
Neyman-Pearson
原则求出拒绝域的临界值
- 根据实际样本观测值做出判断
单个正态总体参数的假设检验
设样本X1,X2,...,Xn来自正态总体N(μ,σ2),X和S2分别为样本均值和方差,显著性水平为α.
有关均值 μ的检验
-
σ2已知时——Z检验
对于双边假设问题H0:μ=μ0,H1:μ=μ0,其中μ0是已知的常数,取检验统计量为
Z=σ/nX−μ0
在H0为真的条件下Z∼N(0,1),根据Neyman-Pearson
原则,检验的拒绝域为
W={∣Z∣=∣σ/nX−μ0∣≥zα/2}
P_
值的计算:
对给定的样本观察值 x1,x2,...,xn,记检验统计量Z的取值为
z0=σ/nx−μ0
P_=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2(1−Φ(∣z0∣))
当P_
小于显著水平α时,拒绝原假设,否则,接受原假设