数理统计基本概念#
部分估计整体。
可以参考:Jiepeng’s notes(Chapter 6 统计量与抽样分布)
目录
样本方差S2定义为n−11∑i=1n(Xi−Xˉ)2,n是样本个数。
注意: 注意区别于总体方差!(总体方差是σ2=Var(X))
所以易知:
样本方差的标准化形式: σ2∑i=1n(Xi−Xˉ)2 样本数据与总体均值的偏差: σ2∑i=1n(Xi−μ)2
数理统计基本概念#
随机样本与统计量——抽样#
重要:样本数字特征概念VS总体数字特征概念的区分 : 样本总体方差估计:用S2或者B2,前者更加适合,因为是无偏估计。
三类抽样分布#
χ2分布, t-分布, F分布
卡方分布#
- 由定义,若Xi相互独立且Xi~N(0,1),则χn2=∑i=1nXi2
- 因此有(标准化相关):若Xi~N(μ,σ2),则χn2=σ2∑i=1n(Xi−μ)2=∑i=1nσ2(Xi−μ)2
- 期望为n,方差为2n
- y的含义是服从χ2分布的随机变量,即χ2 ~ χ2(n)中的χ2
- 可加性(独立)
- χa2为χ2(n)分布的上α分位数
- 很多分布都可以转化为χ2分布,或利用χ2分布来求解
- 与标准正态分布(转换)息息相关
- 概率密度:
t分布#
- 定义:X∼N(0,1),Y∼χ2(n),且X,Y相互独立,则T=Y/nX称T∼t(n)
- tα为t(n)分布的上α分位数
- tα(n)=−t1−α(n)
- 概率密度:
F分布#
- 定义:X∼χ2(n1),Y∼χ2(n2),二者独立,则F=Y/n2X/n1称F∼F(n1,n2)
- n1第一自由度,n2第二自由度
- Fα(n1,n2)为F(n1,n2)分布的上α分位数
- Fα(n1,n2)=F1−α−1(n2,n1)=F1−α(n2,n1)1
- 若F∼F(n1,n2),则F1∼F(n2,n1)
- 概率密度:
- 当n>45时,tα(n)≈zα
正态总体下的抽样分布#
- 若Xi∼N(μ,σ2),Xˉ是样本均值,S2是样本方差
- Xˉ∼N(μ,nσ2)(由独立分布的中心极限定理可推)
- (推导:Xˉ=n1∑i=1nXi,再利用方差和期望计算性质来求:)
- E(Xˉ)=E(n1∑i=1nXi)=n1∑i=1nE(Xi)=n1×n×μ=μ
- D(Xˉ)=D(n1∑i=1nXi)=n21∑i=1nD(Xi)=n21×n×σ2=nσ2
- 两个结论和服从分布一定要牢记
- σ2(n−1)S2∼χ2(n−1)(怎么推)
- E(S2)=E((n−1)1∑i=1n)(Xi−Xˉ)2
- =n−11∑i=1nE(Xi2−Xˉ2)
- =n−11 (∑i=12E(Xi2)−nE(Xˉ2))
- =n−11(∑i=1n(σ2+μ2)−n(nσ2+μ2))
- =σ2
- D(S2)=n−12σ4
- 推导:
- 从σ2(n−1)S2∼χ2(n−1)出发,知D(σ2(n−1)S2)=n−1σ2
- 因此把D里面常数提取出来就得到结果。
- Xˉ与S2相互独立
- t分布:S2/nXˉ−μ=S/nXˉ−μ∼t(n−1)
σ2(n−1)S2∼χ2(n−1)为什么是χ2(n−1)而不是χ2(n)
有没有发现和S2相关的一般都带点n−1
例题: 解释:
第一问由S2的分布结论直接推出。Xˉ看起来很陌生,实际上可以转化为S2的公式 第二问就更熟悉了,服从χ2分布章节的第一点结论(正态分布标准化)
这里的Sw2称为X,Y的组内方差,一般形式有:Sw2=∑i=1n(ni−1)∑i=1n(ni−1)Si2 例题: (1)利用公式结论,用Xˉ,Yˉ,S1来表示t分布公式里的标准变量,然后代入标准公式,与(1)题干公式比较,得到a,k的值(化归,标准化比较) 注意n是有具体值的 (2)思路同(1),也是化归+代入,注意最后F的两个参数n1,n2不要写反!