skip to content

Search

概率论和数理统计

28 min read

这篇文章介绍了概率论和数理统计的基本概念,包括常见的分布及其性质、随机变量的分布函数、数字特征等内容

常见的分布及其性质

泊松分布(Poisson Distribution)

XP(λ)Xπ(λ)P(X=k)=λkeλk!,k=0,1,2X\sim P(\lambda)\\ X\sim \pi(\lambda) \\P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!},k=0,1,2

性质

  • 数学期望和方差都等于参数λ\lambda

  • λ>0\lambda > 0

  • 可加性:

    若随机变量 Xπ(λ1),Yπ(λ2)X\sim\pi(\lambda_1),Y\sim\pi(\lambda_2),且X,YX,Y相互独立。若Z=X+YZ=X+Y,则Zπ(λ1+λ2)Z\sim\pi(\lambda_1+\lambda_2)

均匀分布(Uniform Distribution)

XU(a,b)X\sim U(a,b)

XX具有概率密度

f(x)={1ba,x(a,b)0,elsef(x)= \begin{cases} \frac{1}{b-a},x\in(a,b)\\ 0,\text{else} \end{cases}

方差为

D(X)=(ab)212D(X)=\frac{(a-b)^2}{12}

指数分布(Exponential Distribution)

XE(λ)X\sim E(\lambda)

XX服从参数为λ\lambda的指数分布时,XX具有概率密度

f(x)={λeλx,x>00,elsef(x)= \begin{cases} \lambda e ^{-\lambda x},x>0\\ 0,\text{else} \end{cases}

XX的分布函数

F(x)={1eλx,x>00,elseF(x)= \begin{cases} 1-e^{-\lambda x},x >0\\ 0,\text{else} \end{cases}

服从指数分布的随机变量XX具有无记忆性,即满足

P(X>t0+tX>t0)=P(X>t)P(X>t_0+t|X>t_0)=P(X>t)

数学期望和方差

E(X)=1λD(X)=1λ2E(X)=\frac{1}{\lambda}\\D(X)=\frac{1}{\lambda^2}

正态分布

XN(μ,σ2)X\sim N(\mu,\sigma^2)

服从正态分布的随机变量的概率密度函数满足

f(x)=12πσ2e(xμ)22σ2,<x<+f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty

ZN(0,1)Z\sim N(0,1),称ZZ服从标准正态分布,ZZ的概率密度:

ϕ(x)=12πex22\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}

普通正态分布转换为标准正态分布的计算公式

XN(μ,σ2)X\sim N(\mu,\sigma^2)时,XμσN(0,1)\frac{X-\mu}{\sigma}\sim N(0,1)

P(xb)=Φ(bμσ)P(x\leq b)=\Phi(\frac{b-\mu}{\sigma})

μ,σ\mu,\sigma分别是普通正态的均值和标准差。

几何分布(Geometric Distribution)

几何分布指的是在一系列伯努利试验中,第一次成功出现之前的失败次数为k-1时的概率

P(X=k)=(1p)k1pP(X=k)=(1-p)^{k-1}p

性质

  • 期望

    E(X)=1pp E(X)=\frac{1-p}{p}
  • 方差

    D(X)=1pp2D(X)=\frac{1-p}{p^2}

Γ\Gamma函数求积分

Γ\Gamma函数的表达如下

Γ(z)=otz1e(t)dt\Gamma(z)=\int_o^{\infty} t^{z-1}e(-t)dt

对于zz为整数的时候,可以直接进行积分

  • Γ(12)=π\Gamma(\frac{1}{2})=\sqrt\pi
  • Γ(n)=(n1)!\Gamma(n)=(n-1)!

随机变量的分布函数

定义XX为一随机变量,对任意实数xx,函数F(x)=P(Xx)F(x)=P(X\leq x)为随机变量XX的概率分布函数,简称分布函数,任何随机变量都有相应的分布函数

离散型随机变量及其分布函数

一般地,离散型随机变量的分布律为P{X=xk}=pkP\{X=x_k\}=p_k,由此可得XX的分布函数为F(x)=xkxpkF(x)=\sum_{x_k\leq x}p_k,分布函数再x=xkx=x_k处有跳跃,跳跃值为pk=P{X=xk}p_k=P\{X=x_k\}

连续型随机变量及其分布函数

定义:对于随机变量XX的分布函数F(x)F(x),若存在非负函数f(x)f(x),使得对于任意实数xx,有:

F(x)=xf(t)dtF(x)=\int_{-\infty}^xf(t)dt

则称XX为连续型随机变量,f(x)f(x)称为XX的概率密度函数。

二元随机变量

离散型二元随机变量

定义:若二元随机变量(X,Y)(X,Y)全部可能取到的不同值是有限对或可列无限对,则称(X,Y)(X,Y)是离散型二元随机变量。二元随机变量的分布律如下:

P(X=xi,Y=yi)=pijP(X=x_i,Y=y_i)=p_{ij}

边际分布

对于上述的离散型随机变量,X,YX,Y的边际分布律为:

P(Y=yi)=P(X<+,Y=yi)=i=1pijP(X=xi)=P(X=xi,Y<+)=j=1pijP(Y=y_i)=P(X<+\infty,Y=y_i)=\sum_{i=1}^\infty p_{ij}\\ P(X=x_i)=P(X=x_i,Y<+\infty)=\sum_{j=1}^\infty p_{ij}\\

条件分布

对于二元离散型随机变量X,YX,Y,若P(Y=yj)=pj>0P(Y=y_j)=p_{·j}>0,那么条件概率

P(X=xiY=yj)=P(X=xi,Y=yj)P(Y=yj)=PijPjP(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{P_{ij}}{P_{·j}}

为在 Y=yjY=y_j条件下,随机变量XX的条件分布律。

二元随机变量的分布函数

定义:设(X,Y)(X,Y)是二元随机变量,对于任意实数x,yx,y,二元函数

F(x,y)=p{(Xx)(Yy)}=P(Xx,Yy)F(x,y)=p\{(X\leq x)\cap (Y\leq y)\}=P(X\leq x,Y\leq y)

称为二元随机变量(X,Y)(X,Y)的分布函数

边际分布函数

对二元分布函数进行积分,对xx进行积分得到的是yy的边际分布函数,反之亦然

FX(x)=F(x,)FY(y)=F(,y)F_X(x)=F(x,\infty)\\ F_Y(y)=F(\infty,y)

条件分布函数

P(Y=y)>0P(Y=y)>0,那么在Y=yY=y的条件下,XX的分布函数为:

F(XY)(xy)=P(XxY=y)=P(Xx,Y=y)P(Y=y)F_(X|Y)(x|y)=P(X\leq x|Y=y)=\frac{P(X\leq x,Y=y)}{P(Y=y)}

P(Y=y)=0P(Y=y)=0,但对任意给定的ϵ>0\epsilon >0,都有P(y<Yy+ϵ)>0P(y<Y\leq y+\epsilon)>0,则在Y=yY=y的条件下,XX的分布函数为:

FXY(xy)=limϵ0+P(Xxy<Yy+ϵ)=limϵ0+P(X=x,y<Yϵ+y)P(y<Yϵ+y)F_{X|Y}(x|y)=\lim_{\epsilon\rightarrow 0^+}{P(X\leq x|y<Y\leq y+\epsilon})\\ =\lim_{\epsilon\rightarrow 0^+}\frac{P(X=x,y<Y\leq \epsilon+y)}{P(y<Y\leq\epsilon+y)}

也还是记作

P(XxY=y)P(X\leq x|Y=y)

联合概率密度

对于二元随机变量(X,Y)(X,Y)的分布函数 F(x,y)F(x,y),如果存在非负函数f(x,y)f(x,y),使对于任意x,yx,y

F(x,y)=xyf(u,v)dvduF(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)dvdu

(X,Y)(X,Y)为二元连续型随机变量,称f(x,y)f(x,y)为二元随机变量(X,Y)(X,Y)的联合概率密度

f(x,y)f(x,y)的连续点(x,y)(x,y),有

2F(x,y)xy=f(x,y)\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)

边际概率密度

对于连续型随机变量(X,Y)(X,Y),联合概率密度为f(x,y)f(x,y),边际概率密度为

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dxf_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy\\ f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx

条件概率密度

对于连续型随机变量(X,Y)(X,Y),联合概率密度为f(x,y)f(x,y)(X,Y)(X,Y)关于YY的边际概率密度为fY(y)f_Y(y),若对于固定的yyfY(y)>0f_Y(y)>0,则

f(x,y)fY(y)\frac{f(x,y)}{f_Y(y)}

为在Y=yY=y的条件下,XX 的条件概率密度,记为

fXY(x,y)=f(x,y)fY(y)f_{X|Y}(x,y)=\frac{f(x,y)}{f_Y(y)}

X=xX=x的条件下,YY的条件概率密度,记为

fYX(x,y)=f(x,y)fX(x)f_{Y|X}(x,y)=\frac{f(x,y)}{f_X(x)}

随机变量的独立性

F(x,y),FX(),FY(y)F(x,y),F_X(),F_Y(y)分别是二元随机变量 (X,Y)(X,Y)的分布函数和边际分布函数,若对所有的(x,y)(x,y)都有P(Xx,Yy)=P(Xx)P(Yy)P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y)

F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)

称随机变量X,YX,Y相互独立

  • 若随机变量X,YX,Y是离散型的,那么pij=pipjp_{ij}=p_ip_j对一切i,ji,j都成立
  • 若随机变量X,YX,Y是连续型的,那么f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)处处成立

随机变量函数的分布

问题:已知随机变量XX的分布,且已知Y=g(x)Y=g(x),求YY的概率分布。

一般,上述问题的求解方法为:等价变换法

  • 对于离散型随随机变量XX,只需找到 YY的等价事件即可,即先写出YY的可能取值,再找出(Y=yj)(Y=y_j)的等价事件XiX_i,然后进行概率对应
  • 若为离散型的随机变量XX,那么先写出YY的概率分布函数FY(y)=P(Yy)F_Y(y)=P(Y\leq y),找到YyY\leq y的等价时间XDX\in D,得到FY(y)=P(XD)F_Y(y)=P(X\in D),再求出YY的概率密度函数fY(y)f_Y(y)

定理 反函数法

XfX(x),<x<+,g(x)>0(g(x)<0),Y=g(X)X\sim f_X(x),-\infty<x<+\infty,g^{'}(x)>0\text{或}(g^{'}(x)<0),Y=g(X),则 YY具有概率密度函数为

fY(y)={fX(h(y))h(y),α<y<β0,elsef_Y(y)= \begin{cases} f_X(h(y)) ·|h^{'}(y)|,\alpha<y<\beta\\ 0,\text{else} \end{cases}

这里 α,β\alpha,\betaYY的取值范围,hhgg的反函数h(y)=xh(y)=x.

二元随机变量函数的分布

问题:设二元离散型随机变量(X,Y)(X,Y)具有概率分布P(X=xi,Y=yj)=pijP(X=x_i,Y=y_j)=p_{ij},设U=u(X,Y),V=v(X,Y)U=u(X,Y),V=v(X,Y),则 (U,V)(U,V)的分布律是什么,Z=g(X,Y)Z=g(X,Y)的分布律是什么?

  • 对于 U,V,ZU,V,Z为离散型的情况,只要找到对应的等价事件就可以了

Z=X+YZ=X+Y的分布

  • (X,Y)(X,Y)为离散型随机变量,分布律为:

    P(X=xi,Y=yj)=pijP(X=x_i,Y=y_j)=p_{ij}

    ZZ的可能取值为z1,z2,...,zk,...z_1,z_2,...,z_k,...,则Z=X+YZ=X+Y的分布律为

    P(Z=zk)=P(X+Y=zk)=i=1+P(X=xi,Y=zkxi)P(Z=z_k)=P(X+Y=z_k)\\ =\sum_{i=1}^{+\infty}P(X=x_i,Y=z_k-x_i)

    X,YX,Y相互独立时

    P(Z=zk)=i=1+p(X=xi)P(Y=zkxi)P(Z=z_k)=\sum_{i=1}^{+\infty}p(X=x_i)P(Y=z_k-x_i)
  • (X,Y)(X,Y)为连续型随机变量,概率密度为 f(x,y)f(x,y)FZ(z)=P(Zz)=x+yzdxdyF_Z(z)=P(Z\leq z)=\iint_{x+y\leq z}dxdy.可以得到ZZ 的概率密度为

    fZ(z)=+f(zy,y)dyf_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy

    X,YX,Y的对称性,也可以写为

    fZ(z)=f(x,zx),dxf_Z(z)=\int_{-\infty}^{\infty}f(x,z-x),dx

    X,YX,Y相互独立时, Z=X+YZ=X+Y的密度函数公式称为卷积公式

    fZ(z)=+fX(zy)fY(y)dy=+fX(x)fY(zx)dxf_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx

M=max(X,Y),N=min(X,Y)M=\text{max}(X,Y),N=\text{min}(X,Y)的分布

X,YX,Y是两个相互独立的随机变量,它们的分布函数分别为FX(x),FY(y)F_X(x),F_Y(y),现在求M,NM,N的分布函数Fmax(z),Fmin(z)F_{\text{max}}(z),F_{\text{min}}(z).

Fmax(z)=FX(z)FY(z)Fmin(z)=1P(N>z)=1P(X>z,Y>z)=1(1FX(z))(1FY(z))F_{\text{max}}(z)=F_X(z)F_Y(z)\\ F_{\text{min}}(z)=1-P(N>z)=1-P(X>z,Y>z)=1-(1-F_X(z))(1-F_Y(z))

可以推广到nn个相互独立的随机变量的情况

计算max(X1,X2,...,Xn)\max(X_1,X_2,...,X_n)的分布函数:

  1. 算出一个随机变量XX的分布函数

  2. 用一个随机变量的分布函数F(x)F(x)计算整体的分布函数

    • Fmax(X1,X2,...,Xn)(x)=(F(x))NF_{\max(X_1,X_2,...,X_n)}(x)=(F(x))^N
    • Fmin(X1,X2,...,Xn)(x)=1(1F(x))nF_{\min(X_1,X_2,...,X_n)}(x)=1-(1-F(x))^n

随机变量的数字特征

数学期望

对离散型随机变量XX,若级数

k=1xkpk\sum_{k=1}^\infty x_kp_k

绝对收敛,那么该级数的值就是随机变量XX的数学期望,记为E(X)E(X)

E(X)=k=1xkpkE(X)=\sum_{k=1}^\infty x_kp_k

对于连续型随机变量,若积分

+xf(x)dx\int_{-\infty}^{+\infty}xf(x)dx

绝对收敛,则该积分的值就是随机变量XX的数学期望,记为E(X)E(X)

E(X)=+xf(x)dxE(X)=\int_{-\infty}^{+\infty}xf(x)dx

对于随机变量Y=g(X)Y=g(X),有定理(该定理也可推广到两个或两个以上的随机变量的函数的情况)

E(Y)=+g(x)f(x)dxE(Y) = \int_{-\infty}^{+\infty}g(x)f(x)dx

Z=h(X,Y)Z=h(X,Y)X,YX,Y为连续型随机变量(离散型同理累加即可), ZZ的数学期望为

E(Z)=+h(x,y)f(x,y)dxdyE(Z)=\int_{-\infty}^{+\infty}h(x,y)f(x,y)dxdy

同时还有

E(X)=++xf(x,y)dxdyE(Y)=++yf(x,y)dxdyE(X)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xf(x,y)dxdy\\ E(Y)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)dxdy

数学期望的性质

  • E(C)=C,C为常数E(C)=C,C为常数
  • E(CX)=CE(X),X为随机变量,C为常数E(CX)=CE(X),X为随机变量,C为常数
  • E(X+Y)=E(X)+E(Y),X,Y是两个随机变量(不一定相互独立)E(X+Y)=E(X)+E(Y),X,Y是两个随机变量(不一定相互独立)
  • E(XY)=E(X)E(Y),X,Y是相互独立的随机变量E(XY)=E(X)E(Y),X,Y是相互独立的随机变量

上述第三和第四两个定理都可以推广到任意有限个的情况

方差

XX是一个随机变量,若 E{[XE(X)]2}E\{[X-E(X)]^2\}存在,则称其为XX的方差,记为D(X)D(X)Var(X)Var(X),即

D(X)=Var(X)=E{[XE(X)]2}D(X)=Var(X)=E\{[X-E(X)]^2\}

对于离散型随机变量

D(X)=i=1[xiE(X)]2piD(X)=\sum_{i=1}^\infty[x_i-E(X)]^2*p_i

对于连续型随机变量

D(X)=+[xE(X)]2f(x)dxD(X)=\int_{-\infty}^{+\infty}[x-E(X)]^2f(x)dx

方差计算公式

D(X)=E(X2)[E(X)]2D(X)=E(X^2)-[E(X)]^2

方差的性质

  • D(C)=0,C为常数D(C)=0,C为常数
  • D(CX)=C2D(X),X为随机变量,C为常数D(CX)=C^2D(X),X为随机变量,C为常数
  • D(X+Y)=D(X)+D(Y)+2E[XE(X)][YE(Y)]X,Y相互独立,则有D(X+Y)=D(X)+D(Y)D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}\\若X,Y相互独立,则有D(X+Y)=D(X)+D(Y)

协方差与相关系数

两个随机变量的和的方差计算公式中的

E{[XE(X)][YE(Y)]}E\{[X-E(X)][Y-E(Y)]\}

称为随机变量X,YX,Y的协方差。记为

Cov(X,Y)\text{Cov(X,Y)}

Cov(X,Y)=E{[XE(X)][YE(Y)]}\text{Cov}(X,Y)=E\{[X-E(X)][Y-E(Y)]\}

定义随机变量XXYY的相关系数ρXY\rho_{XY}

ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)D(Y)}}

协方差的计算公式

Cov(X,Y)=E(XY)E(X)E(Y)\text{Cov}(X,Y)=E(XY)-E(X)E(Y)

方差计算公式的重写

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(X+Y)=D(X)+D(Y)+2\text{Cov}(X,Y)

推广到任意有限个随机变量的和的情况

D(i=1nXi)=i=1nD(Xi)+21ijnCov(Xi,Xj)D(\sum_{i=1}^{n}X_i)=\sum_{i=1}^{n}D(X_i)+2\sum_{1\leq i\leq j\leq n}\text{Cov}(X_i,X_j)

协方差的性质

  • Cov(X,Y)=Cov(Y,X)\text{Cov}(X,Y)=\text{Cov}(Y,X)
  • Cov(X,X)=D(X)\text{Cov}(X,X)=D(X)
  • Cov(aX,bY)=abCov(X,Y),其中ab为实数\text{Cov}(aX,bY)=ab·\text{Cov}(X,Y),其中a,b为实数
  • Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\text{Cov}(X_1+X_2,Y)=\text{Cov}(X_1,Y)+\text{Cov}(X_2,Y)

相关系数的性质

  • ρXY1|\rho_{XY}|\leq1
  • ρXY|\rho_{XY}|等价于存在常数a,ba,b使得P(Y=a+bX)=1P(Y=a+bX)=1,特别的,ρXY=1,b>0\rho_{XY}=1,b>0,ρXY=1,b<0\rho_{XY}=-1,b<0

  • D(X)D(Y)0D(X)D(Y)\neq0时,有

    (Cov(X,Y))2D(X)D(Y)(\text{Cov}(X,Y))^2\leq D(X)D(Y)

    其中等号当且仅当XXYY之间有严格的线性关系,即存在常数a,ba,b使得p(Y=a+bX)=1p(Y=a+bX)=1

标准化随机变量

对于任意随机变量XX,作

X=XE(X)D(X) X^*=\frac{X-E(X)}{\sqrt{D(X)}}

E(X)=0,D(X)=1E(X^*)=0,D(X^*)=1

XX^*称为标准化随机变量

ρXY=Cov(XE(X)D(X),YE(Y)D(Y))\rho_{XY}=\text{Cov}(\frac{X-E(X)}{\sqrt{D(X)}},\frac{Y-E(Y)}{\sqrt{D(Y)}})

不相关

ρXY=0\rho_{XY}=0,称 XXYY不相关,等价条件有

  1. Cov(XY)=0\text{Cov}(X,Y)=0
  2. E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
  3. D(X+Y)=D(X)D(Y)D(X+Y)=D(X)D(Y)

X,YX,Y相互独立,那么X,YX,Y一定不相关,反之,若X,YX,Y不相关,X,YX,Y却不一定相互独立

二元正态变量

若二元随机变量X(X,Y)X(X,Y)服从二元正态分布,则X,YX,Y的任意线性组合aX+bYaX+bY服从一元正态分布,其中a,ba,b为不全为0的常数。且

aX+bYN(E(aX+bY),D(aX+bY))aX+bY\sim N(E(aX+bY),D(aX+bY))

正态变量的线性变换不变性

(X,Y)(X,Y)服从二元正态分布,设Z1,Z2Z_1,Z_2X,YX,Y的线性函数,则(Z1,Z2)(Z_1,Z_2)也服从二元正态分布,这一性质称为正态变量的线性变换不变性

(Z1,Z2)N(E(Z1),D(Z1),E(Z2),D(Z2),ρZ1Z2)(Z_1,Z_2)\sim N(E(Z_1),D(Z_1),E(Z_2),D(Z_2),\rho_{Z_1Z_2})

大数定律和中心极限定律

大数定律

X1,...XnX_1,...X_n是一系列随机变量,对于任意一个XiX_i都有E(Xi)=μE(X_i)=\mu,则在一定条件下,随机变量序列

Yn=X1+...+XnnY_n=\frac{X_1+...+X_n}{n}

收敛到μ\mu

随机变量序列依概率收敛的定义

对于随机变量序列Y1,Y2,...Y_1,Y_2,...,若存在某常数aa,使得ϵ>0\forall \epsilon >0都有limnP{Ynaϵ}=0\lim_{n\rightarrow\infty}P\{|Y_n-a|\geq\epsilon\}=0,则称YnY_n依概率收敛到常数a。

性质

若随机变量序列Xn,YnX_n,Y_n分别依概率收敛到a,ba,b,那么对于一个连续函数映射gg,就会满足

g(Xn,Yn)Pg(a,b)g(X_n,Y_n)\xrightarrow{P}g(a,b)

切比雪夫不等式

设随机变量XX具有数学期望E(X)=μE(X)=\mu,方差D(X)=σ2D(X)=\sigma^2,则对于任意的ϵ>0\epsilon>0,都有

P{XE(X)ϵ}σ2ϵ2P\{|X-E(X)|\geq\epsilon\}\leq\frac{\sigma^2}{\epsilon^2}

等价形式为

P{XE(X)<ϵ}1σ2ϵ2P\{|X-E(X)|<\epsilon\}\geq1-\frac{\sigma^2}{\epsilon^2}

切比雪夫大数定律

设随机变量X1,X2,...XnX_1,X_2,...X_n相互独立,并且有相同的数学期望 μ\mu和相同的方差σ2\sigma^2,当n+n\rightarrow +\infty

1nk=1nXkPμ\frac{1}{n}\sum_{k=1}^{n}X_k\xrightarrow{P}\mu

辛钦大数定律

X1,X2,...XnX_1,X_2,...X_n独立同分布,E(Xi)=μE(X_i)=\mu,则当n+n\rightarrow+\infty

1nk=1nXkPμ\frac{1}{n}\sum_{k=1}^{n}X_k\xrightarrow{P}\mu

伯努利大数定律

nAn_Ann重伯努利实验中AA发生的次数,并记事件AA在每次试验中发生的概率为pp,则有

nAnPp,n+\frac{n_A}{n}\xrightarrow{P}p,n\rightarrow+\infty

中心极限定理

独立同分布的中心极限定理

X1,X2,...,XnX_1,X_2,...,X_n独立同分布,E(Xi)=μ,D(Xi)=σ2E(X_i)=\mu,D(X_i)=\sigma^2,则当nn足够大时

i=1nN(nμ,nσ2)1ni=1nN(μ,σ2n)\sum_{i=1}^{n}\sim N(n\mu,n\sigma^2)\\\frac{1}{n}\sum_{i=1}^n\sim N(\mu,\frac{\sigma^2}{n})

数理统计

基础概念

总体:研究对象的全体

个体:总体中的成员

数理统计的主要任务是从总体中抽取一部分个体,然后根据这部分个体的数据对总体分布进行判断,被抽取的部分个体叫做总体的一个样本

随机样本:从总体中随机地取n个个体,称为一个随机样本。

简单随机样本:满足以下两个条件的随机样本(X1X_1,X2X_2,…,XnX_n)称为容量是n的简单随机样本。(一般提到的样本都是简单随机样本)

  1. 每个XiX_iXX同分布
  2. X1X_1,X2X_2,…,XnX_n是相互独立的随机变量

由概率论可知,如果总体具有概率函数f(x)f(x),那么简单随机样本具有联合密度函数

由于每一个XiX_iXX同分布,所以具有相同的概率密度函数,又因为每一个XiX_i相互独立,所以可以直接乘起来得到联合密度函数

fn(x1,X2,...xn)=i=1nf(xi)f_n(x_1,X_2,...x_n)=\prod_{i=1}^nf(x_i)

一个容量为n的样本X1X_1,X2X_2,…,XnX_n是值n个独立并且与总体分布相同的随机变量,一旦对样本进行观察,得到实数x1x_1,x2x_2xnx_n,称为样本的观察值,两次观察,样本值可能是不同的。

如何进行取样

对于有限的总体,采取放回抽样得到简单随机样本,对于总体容量很大或者无限总体采取不放回抽样得到简单随机样本。

统计量:样本的不含任何未知参数的函数

X1X_1,X2X_2,…,XnX_n为取自总体XX的样本,常用的统计量如下

样本方差S2=1n1i=1n(XiX)2S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2SS为样本标准差

E(X)=E(X)E(\overline{X})=E(X) D(X)=D(X)nD({\overline{X}})=\frac{D(X)}{n} E(S2)=D(X)E(S^2)=D(X)

样本距

  • kk阶距:

    Ak=1ni=1nXik,(k=1,2,...)A_k=\frac{1}{n}\sum_{i=1}^nX_i^k,(k=1,2,...)
  • kk阶中心距

    Bk=1ni=1n(XiX)k,(k=1,2,...)B_k=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^k,(k=1,2,...)

这些统计量都是作为总体数字特征未知时的估计。

常见的分布

χ2\chi^2分布

设随机变量X1X_1,X2X_2,…XnX_n相互独立,且对于每一个XiN(0,1)(i=1,2,...)X_i \sim N(0,1)(i=1,2,...),则称

χn2=i=1nXi2\chi_n^2=\sum_{i=1}^nX_i^2

服从自由度为nnχ2\chi^2分布,记作

χ2χ2(n)\chi^2\sim \chi^2(n)

自由度指的是独立变量的个数。

χ2\chi^2分布的性质

  1. χ2χ2(n)\chi^2\sim\chi^2(n),那么

    E(χ2)=n,D(χ2)=2nE(\chi^2) = n,D(\chi^2)=2n
  2. Y1χ2(n1)Y_1\sim\chi^2(n_1),Y2χ2(n2)Y_2\sim\chi^2(n_2),且Y1Y_1,Y2Y_2相互独立,那么

    Y1+Y2χ2(n1+n2)Y_1+Y_2\sim\chi^2(n_1+n_2)

性质2为χ2\chi^2分布的可加性,可推广到有限个的一般情况。

对于一个给定的概率α\alpha,0<α<10<\alpha<1,称满足条件χα2(n)fn(y)dy=α\int_{\chi_{\alpha}^{2}(n)}^{\infty}f_n(y)dy=\alpha的点χα2(n)\chi_{\alpha}^{2}(n)χ2(n)\chi^2(n)分布上的α\alpha分位数

tt分布

XN(0,1)X\sim N(0,1),Yχ2(n)Y\sim \chi^2(n),并且假设XX,YY相互独立,则称随机变量T=XYnT=\frac{X}{\sqrt{\frac{Y}{n}}}服从自由度为nntt分布,记为

Tt(n)T\sim t(n)

对于给定的α\alpha,0<α<10<\alpha<1,称满足tα(n)f(t,n)dt=α\int_{t_{\alpha}(n)}^{\infty}f(t,n)dt=\alpha的点tα(n)t_{\alpha}(n)t(n)t(n)分布的α\alpha分位数。

t1α(n)=tα(n)t_{1-\alpha}(n)=-t_\alpha(n)

FF分布

Xχ2(n1)X\sim \chi^2(n_1),Yχ2(n2)Y\sim \chi^2(n_2),且XX,YY独立,则称随机变量F=Xn1Yn2F=\frac{\frac{X}{n_1}}{\frac{Y}{n_2}}服从自由度为(n1,n2)(n_1,n_2)FF分布,记为

FF(n1,n2)F\sim F(n_1,n_2)

对于给定的α\alpha,0<α<10<\alpha<1,称满足条件Fα(n1,n2)f(x;n1,n2)dx=α\int_{F_{\alpha}(n_1,n_2)}^{\infty}f(x;n_1,n_2)dx=\alpha的点Fα(n1,n2)F_{\alpha}(n_1,n_2)F(n1,n2)F(n_1,n_2) 分布的α\alpha分位数

注意:若Xt(n)X\sim t(n),那么X2F(1,n)X^2\sim F(1,n)

正态分布下的抽样分布

X1X_1,X2X_2,…X3X_3为来自正态总体N(μ,σ2)N(\mu,\sigma^2)的简单随机样本,X\overline{X}是样本均值,S2S^2是样本方差,则有

XN(μ,σ2n)\overline{X}\sim N(\mu,\frac{\sigma^2}{n})

定理:在上述条件下,有

  1. (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma ^2}\sim\chi^2(n-1)
  2. X\overline{X}S2S^2相互独立

注意

  1. i=1n(XiX)2σ2χ2(n1)\frac{\sum_{i=1}^{n}(X_i-\overline{X})^2}{\sigma^2}\sim\chi^2(n-1)
  2. i=1n(Xiμ)2σ2χ2(n)\frac{\sum_{i=1}^{n}(X_i-\mu)^2}{\sigma^2}\sim\chi^2(n)

定理:仍然在上述条件下,有

XμSnt(n1)\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}\sim t(n-1)

定理:设样本(X1,X2,...Xn)(X_1,X_2,...X_n)(Y1,Y2,...Yn)(Y_1,Y_2,...Y_n)分别来自总体N(μ1,σ12)N(\mu_1,\sigma_1^2)N(μ2,σ22)N(\mu_2,\sigma_2^2)并且他们互相独立,其样本方差分别为S12S_1^2S22S_2^2,那么有

  1. S12/σ12S22/σ22F(n11,n21)\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-1)
  2. (XY)(μ1μ2)σ12n1+σ22n2N(0,1)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)
  3. σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2

    (XY)(μ1μ2)Sw1n1+1n2t(n1+n22)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2)

    其中

    Sw2=(n11)S12+(n21)S22n1+n22S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}

参数估计

当总体的参数未知时,需要利用样本对其给出估计,这就是参数估计,参数估计有两类方法:点估计区间估计

参数的点估计

设总体有未知参数θ\theta, X1,...XnX_1,...X_nXX的简单随机样本。

点估计:构造合适的统计量θ^=θ^(X1,...,Xn)\hat{\theta}=\hat{\theta}(X_1,...,X_n)来估计未知参数θ\theta,θ^\hat{\theta}θ\theta点估计量,当给定样本观察值x1,...,xnx_1,...,x_n的时候,称θ^(x1,...,xn)\hat{\theta}(x_1,...,x_n)为参数θ\theta点估计值

常用的点估计方法:矩法,极大似然法

矩估计法

统计思想:以样本矩估计总体矩,以样本矩的函数估计总体矩的函数

理论根据:辛钦大数定律和依概率收敛的性质

总体XXkk阶矩

μk=E(Xk)\mu_k=E(X^k)

样本X1,X2,...,XnX_1,X_2,...,X_nkk阶矩:

Ak=1ni=1nXikA_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k

由大数定理:

AkPμk=E(Xk)A_k\xrightarrow{P}\mu_k=E(X^k)

解方程Ak=μkA_k=\mu_k

解题步骤

  1. 先用参数表示均值,或k阶中心距,然后反解参数,用均值或k阶中心距表示参数
  2. 将样本的k阶中心距带入上面求得的参数表达式,求得估计参数的值
  3. 如果一阶中心距积分为0,那么就求二阶中心距

极大似然估计

一般地,设离散型总体 Xp(x;θ),θΘX\sim p(x;\theta),\theta\in\Theta, θ\theta未知,从总体XX取得样本X1,X2,...,XnX_1,X_2,...,X_n,其观察值为 x1,x2,...xnx_1,x_2,...x_n,则事件{X1=x1,X2=x2,...Xn=xn}\{X_1=x_1,X_2=x_2,...X_n=x_n\}发生的概率为

L(θ)=P{X1=x1,..Xn=xn}=p(x1;θ)...p(xn;θ)=i=1np(xi;θ)L(\theta)=P\{X_1=x_1,..X_n=x_n\}=p(x_1;\theta)...p(x_n;\theta)=\prod_{i=1^n}p(x_i;\theta)

极大似然原理

L(θ^(x1,x2,...,xn))=maxθΘL(θ)L(\hat{\theta}(x_1,x_2,...,x_n))=\max_{\theta\in\Theta}L(\theta)

取使得似然函数取得最大值的θ\theta.

对于总体XX是连续型的情况,似然函数定义为

L(θ)=i=1nf(xi,θ)L(\theta)=\prod_{i=1}^nf(x_i,\theta)

tips:

  1. 未知参数可能不止一个,一般设为θ=(θ1,θ2,...,θ3)\theta=(\theta_1,\theta_2,...,\theta_3)
  2. 求解L(θ)L(\theta)的最大值时,通常取对数运算
  3. 如果L(θ)L(\theta)是关于某一个θi\theta_i单调的,此时θi\theta_i的极大似然估计在其边界处取得
  4. θ^\hat{\theta}θ\theta的极大似然估计,那么g(θ)g(\theta)的极大似然估计为g(θ^)g(\hat\theta)

估计量的评选准则

对于总体参数的估计,采用不同的估计方法可以求得不同的估计量,对于估计量,有四条评价准则

  1. 无偏性准则
  2. 有效性准则
  3. 均方误差准则
  4. 相和型准则

无偏性准则

定义:若参数θ\theta的估计量θ^(X1,X2,...,Xn)\hat\theta(X_1,X_2,...,X_n)满足E(θ^)=θE(\hat\theta)=\theta,则称θ^\hat\thetaθ\theta的一个无偏估计量。若θ^θ\hat\theta\neq \theta,那么,E(θ^)θ|E(\hat\theta)-\theta|称为估计量θ^\hat\theta的偏差。若limnE(θ^)=θ\lim_{n\rightarrow\infty}E(\hat\theta)=\theta,则称θ^\hat\thetaθ\theta的渐进无偏估计量

有效性准则

定义:设θ^1,θ^2\hat\theta_1,\hat\theta_2θ\theta的两个无偏估计,如果D(θ^1)D(θ^2)D(\hat\theta_1)\leq D(\hat\theta_2),对一切θΘ\theta\in \Theta成立,且不等号至少对某一θΘ\theta\in\Theta成立,则称θ^1\hat\theta_1θ^2\hat\theta_2有效。

均方误差准则

定义:设θ^\hat\theta是参数θ\theta的点估计,方差存在,则称 E(θ^θ)2E(\hat\theta-\theta)^2是估计量的均方误差,记为Mse(θ^)\text{Mse}(\hat\theta).

Mse(θ^)=D(θ^)+(E(θ^)θ)2\text{Mse}({\hat\theta})=D(\hat\theta)+(E(\hat\theta)-\theta)^2

θ^\hat\thetaθ\theta的无偏估计,则有

Mse(θ^)=D(θ^)\text{Mse}(\hat\theta)=D(\hat\theta)

相合性准则

θ^(X1,X2,..,Xn)\hat{\theta}(X_1,X_2,..,X_n)为参数θ\theta的估计量,若对于任意的θΘ\theta\in \Theta,当n+n\rightarrow+\infty时,θn^\hat{\theta_n}依概率收敛为 θ\theta,即ϵ>0\forall \epsilon>0,有limn+P{θn^θϵ}=0\lim_{n\rightarrow+\infty}P\{|\hat{\theta_n}-\theta|\geq \epsilon\}=0,称θn^\hat{\theta_n}θ\theta的相合估计量或一致估计量。

例题

设总体XU[0,θ]X\sim U[0,\theta],X1,...,XnX_1,...,X_n是取自XX的样本,证明θ1^=2X\hat{\theta_1}=2\overline{X}θ2^=n+1nX(n)\hat{\theta_2}=\frac{n+1}{n}X_{(n)}θ\theta的相合估计

证明

E(θ1^)=E(θ2^)=θ,D(θ1^)=θ23n,D(θ2^)=θ2n(n+2)由切比雪夫不等式,ϵ>0,n+时,有:P{θ1^θϵ}D(θ1^)ϵ20同理:P{θ2^θϵ}D(θ2^)ϵ20所以θ1^θ2^都是θ的相合估计E(\hat{\theta_1})=E(\hat{\theta_2})=\theta,D(\hat{\theta_1})=\frac{\theta^2}{3n},D(\hat{\theta_2})=\frac{\theta^2}{n(n+2)}\\ 由切比雪夫不等式,\forall\epsilon>0, 当n\rightarrow+\infty时,\\ 有:P\{|\hat{\theta_1}-\theta| \geq \epsilon \}\leq \frac{D(\hat{\theta_1})}{\epsilon^2}\rightarrow 0\\ 同理:P\{|\hat{\theta_2}-\theta|\geq \epsilon\}\leq\frac{D(\hat{\theta_2})}{\epsilon^2\rightarrow0}\\ 所以\hat{\theta_1}和\hat{\theta_2}都是\theta的相合估计

区间估计

假设(X1,..Xn)(X_1,..X_n)时总体XX的一个样本,区间估计的方法是给出两个统计量,θ1^=θ1^(X1,...,Xn),θ2^=θ2^(X1,...,Xn)\hat{\theta_1}=\hat{\theta_1}(X_1,...,X_n),\hat{\theta_2}=\hat{\theta_2}(X_1,...,X_n)使区间[θ1^,θ2^][\hat{\theta_1},\hat{\theta_2}]以一定的可靠程度覆盖住θ\theta

置信区间的定义

设总体XX的分布函数F(x;θ)F(x;\theta)含有一个未知参数θ\theta,(X1,..,Xn)(X_1,..,X_n)是总体XX的一个样本,对给定的值α(0<α<1)\alpha(0<\alpha<1),如果有两个统计量θL^=θL^(X1,...,Xn),θU^=θU^(X1,...,Xn)\hat{\theta_L}=\hat{\theta_L}(X_1,...,X_n),\hat{\theta_U}=\hat{\theta_U}(X_1,...,X_n)使得

P{θL^(X1,...,Xn)<θ<θU^(X1,...,Xn)}1α,θΘP\{\hat{\theta_L}(X_1,...,X_n)<\theta < \hat{\theta_U}(X_1,...,X_n)\}\geq 1-\alpha,\forall \theta \in \Theta

则称随机区间θL^,θU^\hat{\theta_L},\hat{\theta_U}θ\theta的双侧置信区间,称1α1-\alpha为置信度,θL^,θU^\hat{\theta_L},\hat{\theta_U}分别为双侧置信下限和双侧置信上限

枢轴量法

设总体XX有概率密度f(x;θ)f(x;\theta)其中θ\theta是待估计的未知参数,并设X1,...,XnX_1,...,X_n是来自该总体的样本,称样本和未知参数的函数G(X1,...,Xn;θ)G(X_1,...,X_n;\theta)为枢轴量。

枢轴量和统计量的区别

  • 枢轴量是样本和待估参数的函数,其分布不依赖于任何未知参数
  • 统计量只是样本的函数,其分布常常依赖于未知参数
构造置信区间的具体步骤
  1. 构造一个分布一致的枢轴量G(X1,...,Xn;θ)G(X_1,...,X_n;\theta)

  2. 对连续性总体和给定的置信度1α1-\alpha,设常数a<ba<b满足

    P{a<G(X1,...,Xn;θ)<b}=1αP\{a<G(X_1,...,X_n;\theta)<b\}=1-\alpha
  3. 若能从a<G(X1,...,Xn;θ)<ba<G(X_1,...,X_n;\theta)<b得到等价的不等式

    θL^(X1,...,Xn)<θ<θU^(X1,...,Xn)\hat{\theta_L}(X_1,...,X_n)<\theta < \hat{\theta_U}(X_1,...,X_n)

    那么(θL^,θU^)(\hat{\theta_L},\hat{\theta_U})就是θ\theta的置信度为1α1-\alpha的置信区间

枢轴量的构造,通常从参数的点估计θ^\hat\theta出发,根据θ^\hat\theta 的分布进行改造而得

正态总体下常见的枢轴量

单个正态总体N(μ,σ2)N(\mu,\sigma^2)情形

μ\mu的枢轴量

{n(Xμ)σN(0,1),σ2已知n(Xμ)St(n1),σ2未知\begin{cases} \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1),\sigma^2已知\\ \frac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1),\sigma^2未知 \end{cases}

置信区间分别为

(Xσnzα2,X+σnzα2)(XSntα2(n1),X+Sntα2(n1))(\overline{X}-\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}},\overline{X}+\frac{\sigma}{\sqrt{n}}z_{\frac{\alpha}{2}})\\ (\overline{X}-\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1),\overline{X}+\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1))

σ2\sigma^2的枢轴量

(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)

置信区间为

((n1)S2χα22(n1),(n1)S2χ1α22(n1))(\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)})

两个正态总体N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2),N(\mu-2,\sigma_2^2)

μ1μ2\mu_1-\mu_2的枢轴量:

{(XY)(μ1μ2)σ12n1+σ22n2N(0,1),σ12,σ22已知(XY)(μ1μ2)Sw1n1+1n2t(n1+n22),σ12=σ22未知\begin{cases} \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1),\sigma_1^2,\sigma_2^2已知\\ \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),\sigma_1^2=\sigma_2^2未知 \end{cases}

置信区间分别为

((XY)±zα2σ12n1+σ22n2)((XY)±tα2(n1+n22)Sw1n1+1n2)((\overline{X}-\overline{Y})\pm z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}})\\ ((\overline{X}-\overline{Y})\pm t_{\frac{\alpha}{2}}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}})

σ12σ22\frac{\sigma_1^2}{\sigma_2^2}的枢轴量

S12S22/σ12σ22F(n11,n21),μ1,μ2未知\frac{S_1^2}{S_2^2}/\frac{\sigma_1^2}{\sigma_2^2}\sim F(n_1-1,n_2-1),\mu_1,\mu_2未知

置信区间为

(S12S221Fα2(n11,n22),S12S221F1α2(n11,n22))(\frac{S_1^2}{S_2^2}\frac{1}{F_{\frac{\alpha}{2}}(n_1-1,n_2-2)},\frac{S_1^2}{S_2^2}\frac{1}{F_{1-\frac{\alpha}{2}}(n_1-1,n_2-2)})

假设检验

统计推断的另一类重要问题的假设检验问题,包括

  1. 已知总体分布的形式,需对其中的未知参数给出假设检验(参数检验
  2. 总体分布形式完全未知的情况下,对总体的分布或数字特征进行假设检验(非参数检验

假设

原假设(零假设)H0H_0,备择假设(对立假设)H1H_1,关于总体参数θ\theta的假设

H0:θθ0,H1:θ<θ0(左边检验)H0:θθ0,H1:θ>θ0(右边检验)H0:θ=θ0,H1:θθ0(双边检验)H_0:\theta\geq \theta_0,H_1:\theta<\theta_0(左边检验)\\ H_0:\theta\leq\theta_0,H_1:\theta>\theta_0(右边检验)\\ H_0:\theta=\theta_0,H_1:\theta\neq\theta_0(双边检验)

检验统计量和拒绝域

如果统计量T=T(X1,X2,...,Xn)T=T(X_1,X_2,...,X_n)的取值大小和原假设H0H_0是否成立由密切关系,可将之称为对应假设问题的检验统计量,对应于拒绝原假设H0H_0时,样本值的范围称为拒绝域,记为WW,其补集W\overline{W}称为接受域

两类错误

由于样本的随机性,任意检验规则在应用时,都有可能发生错误的判断

第一类错误:拒绝真实的原假设(弃真)

第二类错误:接受错误的原假设(取伪)

犯第一类错误的概率为α\alpha

α=P{拒绝H0H0是真的}\alpha=P\{拒绝H_0|H_0是真的\}

犯第二类错误的概率为 β\beta

β=P{接受H0H0是假的}\beta=P\{接受H_0|H_0是假的\}

犯两类错误的概率相互制约,使得在给定样本量 nn下,不可能找到界值CC使得α(C),β(C)\alpha(C),\beta(C)都尽可能小

Neyman-Pearson原则

首先控制犯第一类错误的概率不超过某个常数 α(0,1)\alpha\in(0,1),再寻找检验,使得犯第二类错误的概率尽可能小,其中的常数 α\alpha称为显著水平,常取α=0.1,0.05,0.01\alpha=0.1,0.05,0.01

P_值与统计显著性

P_值:当原假设成立时,检验统计量取比观察到的结果更为极端的数值的概率

P=PH0(Xμxμ)P_=P_{H_0}(|\overline{X}-\mu|\geq|\overline{x}-\mu|)

上式表示了P_的含义,即抽取一个样本的均值与原假设实际均值的差值大于这一次抽样的均值与原假设实际均值的概率,如果概率很小,那么说明原假设成立即为小概率事件。

P_与显著水平α\alpha的关系:

  • P_αP\_\leq\alpha,等价于样本落在拒绝域内,因此,拒绝原假设,此时称检验结果在水平α\alpha下是统计显著的
  • P_>αP\_>\alpha,等价于样本不落在拒绝域内,因此,不拒绝原假设,此时称检验结果在水平 α\alpha下是统计不显著的

处理假设检验的基本步骤

  1. 根据实际问题提出原假设和备择假设
  2. 提出检验统计量和拒绝域的形式
  3. 在给定的显著水平 α\alpha下,根据Neyman-Pearson原则求出拒绝域的临界值
  4. 根据实际样本观测值做出判断

单个正态总体参数的假设检验

设样本X1,X2,...,XnX_1,X_2,...,X_n来自正态总体N(μ,σ2)N(\mu,\sigma^2)X\overline{X}S2S^2分别为样本均值和方差,显著性水平为α\alpha.

有关均值 μ\mu的检验

  1. σ2\sigma^2已知时——ZZ检验

    对于双边假设问题H0:μ=μ0,H1:μμ0H_0:\mu=\mu_0,H_1:\mu\neq\mu_0,其中μ0\mu_0是已知的常数,取检验统计量为

    Z=Xμ0σ/nZ=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}

    H0H_0为真的条件下ZN(0,1)Z\sim N(0,1),根据Neyman-Pearson原则,检验的拒绝域为

    W={Z=Xμ0σ/nzα/2}W=\{|Z|=|\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}|\geq z_{\alpha/2}\}

    P_值的计算:

    对给定的样本观察值 x1,x2,...,xnx_1,x_2,...,x_n,记检验统计量ZZ的取值为

    z0=xμ0σ/nz_0=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} P_=PH0{Zz0}=2PH0{Zz0}=2(1Φ(z0))P\_=P_{H_0}\{|Z|\geq|z_0|\}=2P_{H_0}\{Z\geq|z_0|\}=2(1-\Phi(|z_0|))

    P_小于显著水平α\alpha时,拒绝原假设,否则,接受原假设