1565 字
8 分钟
【概统】第七章整理
2024-12-19

关键词:

矩法估计;极大似然估计;置信区间;置信水平(置信度);枢轴量

两个正态总体方差不等未知的均值差区间估计、非正态总体参数区间估计 不考。

可以参考:Jiepeng’s notes(Chapter 7 参数估计)


目录


标准正态分布原函数计算概率#

已知XN(μ,σ2),X\sim N(\mu,\sigma^2),P(Xx)=1Φ(xμσ)P(X\ge x) = 1 - \Phi({x - \mu \over \sigma})P(Xx)=Φ(xμσ)P(X\le x) = \Phi({x - \mu \over \sigma}) 推导:P(Xx)=F(x)=Φ(xμσ)P(X\le x) = F(x) = \Phi({x - \mu \over \sigma})

  1. 正态分布的密度函数是:
f(x)=12πσexp((xμ)22σ2)f(x) = \frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)

累积分布函数 F(x)F(x) 的定义为:

F(x)=xf(t)dtF(x) = \int_{-\infty}^x f(t) \, dt

将密度函数 f(t)f(t) 代入:

F(x)=x12πσexp((tμ)22σ2)dtF(x) = \int_{-\infty}^x \frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(t-\mu)^2}{2\sigma^2}\right) dt
  1. 标准正态分布的密度函数为:
ϕ(z)=12πexp(z22)\phi(z) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right)

累积分布函数为:

Φ(z)=zϕ(t)dt\Phi(z) = \int_{-\infty}^z \phi(t) \, dt

XX 转化为标准正态分布:

Z=Xμσ,ZN(0,1)Z = \frac{X - \mu}{\sigma}, \quad Z \sim N(0, 1)
  1. 换元,令:
z=tμσ,t=zσ+μz = \frac{t - \mu}{\sigma}, \quad \text{即} \quad t = z\sigma + \mu

F(x)=x12πσexp((tμ)22σ2)dt   =xμσ12πexp(z22)dz=Φ(xμσ)F(x) = \int_{-\infty}^x \frac{1}{\sqrt{2\pi}\sigma} \exp\left(-\frac{(t-\mu)^2}{2\sigma^2}\right) dt      = \int_{-\infty}^{\frac{x - \mu}{\sigma}} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right) \, dz = \Phi\left(\frac{x - \mu}{\sigma}\right)

正态分布随机变量平方的期望#

已知XN(μ,σ2),X\sim N(\mu,\sigma^2),E(X2)=μ2+σ2E(X^2) = \mu^2 + \sigma^2

方差公式利用#

D(X)=E(X2)(E(X))2,E(X2)=D(X)+(E(X))2.D(X) = E(X^2) - (E(X))^2,E(X^2) = D(X) + (E(X))^2.

D(X)=σ2=μ2μ12D(X) = \sigma^2 = \mu_2 - \mu_1^2

B2=A2Xˉ2B_2 = A_2 - \bar{X}^2


参数的点估计#

常见的点估计方法:

  1. 矩估计法(矩法)
  2. 极大似然法

矩估计法#

[16.png] [17.png]

  • k有多大取决于参数个数
  • 样本一阶(原点)矩:A1=XˉA_1 = \bar{X},二阶中心矩:B2=1ni=1n(XiXˉ)2B_2 = {1\over n}\sum_{i=1}^n (X_i - \bar{X})^2
    • B2=n1nS2B_2 = {n-1\over n}S^2
    • 中心矩和原点矩的区分见第六章
  • 总体一阶矩:μ1=E(X)\mu_1 = E(X),二阶矩:μ2=E(X2)\mu_2 = E(X^2) (均以原点矩计,下同)
    • 00阶矩:μ0=1\mu_0 = 1
    • kk阶矩:μk=E(Xk)\mu_k = E(X^k)

极大似然估计法#

[18.png] [19.png][20.png]

  • 因为似然函数是乘积,所以经常用[说明]第二点中的取对数方法,化积为和。这时候求使lnL(θ)θ=0,lnL(θ){\partial \ln{L(\theta)}\over \partial \theta} = 0,\ln{L(\theta)}最大的θ\theta,相当于求使L(θ)θ=0,L(θ){\partial L(\theta) \over \partial \theta} = 0,L(\theta)最大的θ\theta
  • 所求θ\thetaxix_i表示的函数值,最终要用XiX_i替换xix_i。(XiX_i是样本值)

例题:

注意一种特殊情况:lnL(θ)θ{\partial \ln{L(\theta)}\over \partial \theta}取不到0,也就是经过分析,lnL(θ)θ{\partial \ln{L(\theta)}\over \partial \theta}会随θ\theta的某一分量单增或单减,此时可以按(1)中的做法来求 [22.png] [23.png] [24.png]

第二题,E(X)E(X)的极大似然估计(量)就用a,b的极大似然估计值代入求。

与上一题(1)类似,还有一种不能求极大似然估计的情况:

第(2)问:不能通过求偏导数获得μ\mu的极大似然估计量,因此可以利用题干中的其他条件,尽可能限制参数μ\mu的范围。 [25.png][26.png]

TBC:此处跳过几道例题#

估计量的评选准则#

四条评价准则:

  1. 无偏性准则
  2. 有效性准则
  3. 均方误差准则
  4. 相合性准则

无偏性准则#

  • 定义:参数θ\theta的估计量θ^=θ^(X1,X2,...,Xn)\hat{\theta} = \hat{\theta}(X_1,X_2,...,X_n),满足E(θ^)=θE(\hat{\theta}) = \theta则称为θ\theta的无偏估计量
    • E(θ^)θE(\hat{\theta})\ne \theta,则E(θ^)θ\lvert{E(\hat{\theta}) - \theta}\rvert称为估计量θ^\hat{\theta}偏差
    • limn+E(θ^)=θ\lim \limits_{n \to +\infty} E(\hat{\theta}) = \theta,则为渐进无偏估计量 [27.png]

有效性准则#

  • 定义:θ^1,θ^2\hat{\theta}_1,\hat{\theta}_2是无偏估计,若D(θ^1)D(θ^2)D(\hat{\theta}_1)\le D(\hat{\theta}_2),对一切θΘ\theta\in \Theta都成立,且能取到等号,则称θ^1θ^2有效。\hat{\theta}_1比\hat{\theta}_2有效。

均方误差准则#

  • 定义:设θ^\hat{\theta}是参数θ\theta的点估计,方差存在,则E(θ^θ)2E(\hat{\theta} - \theta)^2称为估计量的均方误差,记为Mse(θ^).Mse(\hat{\theta}).
  • θ^\hat{\theta}θ\theta的无偏估计,则Mse(θ^)=D(θ^)Mse(\hat{\theta}) = D(\hat{\theta})

相合性准则#

  • 定义:θ,limn+P{θ^nθϵ}=0\forall \theta, \lim \limits_{n\to +\infty}P\{\lvert \hat{\theta}_n - \theta \rvert \ge \epsilon\} = 0 (即θ^n\hat{\theta}_n依概率收敛于θ\theta),称θ^n\hat{\theta}_nθ\theta相合估计量一致估计量
  • 例题,可作结论:[28.png]
  • [pic/30.png]
  • [31.png]
  • (3)的解释:因为A2A_2依概率收敛于μ2\mu_2Xˉ\bar{X}依概率收敛于μ1\mu_1,因此可知B2B_2也依概率收敛于σ2\sigma^2

区间估计#

置信区间的定义#

  1. 双侧置信 [33.png]
  2. 单侧置信 [34.png]
  3. 单双侧置信区间的关系 [35.png]
  4. 其他概念:精确度,误差限,Neyman(内曼)原则

枢轴量法#

[32.png] [36.png][pic/37.png] [pic/38.png] [pic/39.png] [pic/40.png]

  • 注意:分布完全已知的随机量才能作为枢轴量

正态总体参数的区间估计#

一、单个正态总体情形#

[pic/45.png]

1. 均值μ的置信区间#

  1. σ2\sigma^2已知,置信区间为:(Xˉσnzα/2,Xˉ+σnzα/2)(\bar{X} - {\sigma\over \sqrt{n}}z_{\alpha /2},\bar{X} + {\sigma\over \sqrt{n}}z_{\alpha /2})
  • 推论:均值μ\mu的置信度1α1-\alpha置信下限Xˉσnzα\bar{X} - {\sigma \over \sqrt{n}}z_\alpha
  1. σ2\sigma^2未知:则置信区间为: (XˉSntα/2(n1),Xˉ+Sntα/2(n1))(\bar{X} - {S\over \sqrt{n}}t_{\alpha /2}(n-1),\bar{X} + {S\over \sqrt{n}}t_{\alpha /2}(n-1)) [pic/50.png]

2.方差σ2的置信区间(设μ未知)#

置信区间为((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))({(n-1)S^2\over\chi^2_{\alpha/2}(n-1)},{(n-1)S^2\over\chi^2_{1-\alpha/2}(n-1)}) 上述所求的区间估计不是最优解。

方差σ2\sigma^2的置信度1α1-\alpha的置信度上限为:(n1)S2χ1α2(n1){(n-1)S^2\over\chi^2_{1-\alpha}(n-1)}

两正态总体情形#

[pic/51.png]

1. μ1-μ2的置信区间#

  1. σ12,σ22\sigma_1^2,\sigma_2^2已知: 置信区间为:((XˉYˉ)±zα2σ12n1+σ22n2)((\bar{X} - \bar{Y})\pm z_{\alpha \over 2}\sqrt{{{\sigma_1^2\over n_1} + {\sigma_2^2\over n_2 } }})
  2. σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2,其中σ2\sigma^2未知 置信区间为:((XˉYˉ)±tα2(n1+n22)Swqn1+1n2)((\bar{X}-\bar{Y})\pm t_{\alpha\over2}(n_1+n_2 -2)S_w\sqrt{{q\over n_1}+{1\over n_2}})
  3. σ12σ22\sigma_1^2 \ne \sigma_2^2且未知
    1. 若样本量n1,n2n_1,n_2都足够大(>50): 置信区间为:((XˉYˉ)±zα2S12n1+S22n2)((\bar{X} - \bar{Y})\pm z_{\alpha \over 2}\sqrt{{{S_1^2\over n_1} + {S_2^2\over n_2 } }})
    2. 若样本量较小:((XˉYˉ)±tα2(k)S12n1+S22n2)((\bar{X} - \bar{Y})\pm t_{\alpha \over 2}(k)\sqrt{{{S_1^2\over n_1} + {S_2^2\over n_2 } }})

2. σ1^2/σ2^2 的置信区间(设μ1,μ2未知)#

(S12S221Fα2(n11,n21),S12S221F1α2(n11,n21))({S_1^2\over S_2^2}{1\over F_{\alpha \over2}(n_1-1,n_2-1)},{S_1^2\over S_2^2}{1\over F_{1-{\alpha \over2}}(n_1-1,n_2-1)})

  • 小结论:若所求σ12σ22{\sigma_1^2\over \sigma_2^2}的置信区间包含1,可以认为两个总体的方差之间没有显著差异。

非正态总体参数的区间估计#

0-1分布参数的区间估计#

[pic/57.png]

其他总体均值的区间估计#

当 充分大(一般 > 50 )时: [pic/58.png] [pic/59.png]

【概统】第七章整理
https://herobrine101.top/posts/概统第七章整理/
作者
发布于
2024-12-19
许可协议
CC BY-NC-SA 4.0