2020年9月20日 / 11次阅读
老男孩学数学
根据中心极限定义(Center Limit Theory, CLT),样本均值服从normal distribution,其标准差的计算,可以为 \(\sigma \div \sqrt{n}\)。
下面这段代码做个测试,对比两个计算样本均值标准差的结果,是否相同。
代码在0-199均匀分布的数中采样,每次采n=30,随机采10000次。
import numpy as np
import matplotlib.pyplot as plt
import random
# population
a = list(range(200))
soa = np.var(a)
# sample
n = 30
smoa = np.sqrt(soa/n)
b = []
mob = []
for i in range(10000):
while len(b) != n:
_b = random.randint(0,199)
if _b not in b:
b.append(_b)
else:
mob.append(np.mean(b))
b[:] = []
smob = np.sqrt(np.var(mob, ddof=1))
plt.hist(mob, bins=100, rwidth=0.9)
plt.plot((smoa,smoa),(0,500), color='red')
plt.plot((smob,smob),(0,500), color='green')
plt.show()
运行结果如下,红色竖线为按公式计算的结果,绿色竖线是为按实际采样得到的均值计算的结果:
样本均值的标准差
肉眼看,两条线非常接近!均值的直方图,也呈现normal distribution的样子。
本文链接:https://www.maixj.net/misc/mean-deviation-23932
《样本均值的标准差》有1条留言
©Copyright 麦新杰 Since 2014 云上小悟独立博客版权所有 备案号:苏ICP备14045477号-1。云上小悟网站部分内容来源于网络,转载目的是为了整合信息,收藏学习,服务大家,有些转载内容也难以判断是否有侵权问题,如果侵犯了您的权益,请及时联系站长,我会立即删除。
本文中,均值方差的计算,使用的无偏,df=n-1,不知道在数理上是否正确? [ ]