首页 > 范文大全 > 正文

经典统计与贝叶斯统计的比较分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇经典统计与贝叶斯统计的比较分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:贝叶斯统计与经典统计学作为当今统计学两个重要的分支,在我们日常生活中的应用也越来越广泛。本文就这两种统计方法的基本思想作了对比,并且分析了各自的优势及缺点,并说明了他们在用于统计推断时表现的差别。最后,作者通过实例进一步阐明了二者的区别,并建议根据具体情况选用统计方法。

关键词:贝叶斯;经典统计;统计思想;统计方法

一、引言

经典统计学派和贝叶斯统计学派是在统计学的历史上逐渐发展起来的两大主要学派。贝叶斯方法是由英国学者Bayes在其论文中首先提出来的,并在和经典学派的争论中逐渐发展起来,目前被越来越多的统计工作者所研究和广泛应用。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两个统计学派的比较研究中发现,二者在其基本思想以及统计推断时不尽相同,与此同时,二者也都有自己的优点与缺点。正确理解这些不同,对于我们今后正确地运用统计方法分析实际问题起着举足轻重的作用。因此,本文对这两种统计方法的基本思想作了对比,分析了各自的优势及缺点,并说明了他们在用于统计推断时表现的差别,有助于我们进一步理解这两种基本的统计分析方法。

二、基本思想的对比

1.区别一

经典统计学认为概率必须符合科学的要求,是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。而贝叶斯统计认为一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。

2.区别二

经典学派很注重利用已经出现的样本观察值,没观察到的样本不予考虑。贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。

3.区别三

经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”。

4.区别四

经典统计学派判断方法是让检验统计量与临界值进行比较。贝叶斯的判断方法是在获得后验分布之后,可分别计算原假设H0和备择假设H1的后验概率。

5.总结

贝叶斯统计学派与经典统计学派在很多问题上都有分歧但是它们最根本的分歧是:第一,是否利用先验信息。由于产品的设计、生产都有一定的继承性,这样就存在许多相关产品的信息以及先验信息可以利用,贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。第二,是否将参数e看成随机变量。贝叶斯统计学派的最基本的观点是任一未知量e都可以看成随机变量,可以用一个概率分布去描述,这个分布就是先验分布。因为任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把未知量e就简单看成一个未知参数,来对它进行统计推断。

三、两种统计方法的优缺点

1.贝叶斯统计的优点与缺点

贝叶斯统计以从经验中学习为目标,将历史信息与样本似然函数结合在一起,使之形成一套比经典统计更加灵活,更加直观,更加易于理解的统计方法,在计量模型中正在受到越来越广泛的应用。特别是在小样本的情况下,点估计和区间估计可以有比经典统计更加精确的结果;其次,在用贝叶斯后验分布进行推断后,可以将第一类、第二类错误所造成的损失考虑在内,因而比经典统计更加实用;另外,在处理多余参数的问题上,贝叶斯统计可以直接在后验密度中将多余的参数积分掉,这又比经典统计方法方便得多。

贝叶斯统计在很多方面比经典统计有明显的优势,然而,仍然有许多本身存在的问题和缺陷制约和阻碍着它的发展。例如,先验分布的确定是近几十年来研究的主要问题;其次,我们一般只知道后验分布的核,计算后验密度函数的推导与计算具有非常大的难度,也没有可以广泛应用各种模型的软件和程序。

2.经典统计的优点及缺点

经典统计学作为统计学的根基,有着它自身所无法比拟的优点。首先,它用于推断过程的数据是样本数据,排除经常很难量化的先验知识。其次,它对于方法的评估有一系列的准则。只要可能,就能找到最优方法。

但与此同时,它的缺点也比较显著:首先,在小样本的情况下,点估计和区间估计没有贝叶斯的结果精确;其次,它不能将第一类、第二类错误所造成的损失考虑在内;最后,在处理多余参数的问题上,没有贝叶斯统计方法方便。

3.总结

贝叶斯统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各有其适用的范围,我们要具体问题具体分析,以获得一种更适合解决实际问题的方法。而且,在很多情况下,二者得出的结论在形式上是相同的。

四、两种统计方法在统计推断时的差别

1.在点估计与区间估计方面的区别

贝叶斯定理是贝叶斯统计学的理论基础,函数p(x|θ)集中了总体信息和样本信息,被称为似然函数,它是未知参数θ的函数。在经典统计中同样承认似然函数,在这一点的理解上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ的函数,而样本x在似然函数中是一组观察值,使似然函数值达到最大的θ值有比其他θ值更大的说服力,此θ值即为经典统计中的最大似然估计而我们可以证明,在贝叶斯统计中,当在“无信息”的条件下,θ的最大后验估计就是经典统计中的最大似然估计。在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。

在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。

2.在假设检验方面的区别

经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(x|H0为真),x是样本向量。而在贝叶斯统计中,可以直接求得在样本X给定的条件下,参数的后验概率,因而得出H0和H1和后验概率,即判定的是P(H0为真| x)和P(H0为假|x)。这是两种检验方法间的根本区别。

在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒绝域的变化,而贝叶斯统计在后验均值估计中的最基本特征是伸缩性。

贝叶斯统计在检验问题中的一个优势在于多重检验问题,这是经典统计所办不到的。例如:在一次企业对两种生产方法的比较检验中,我们将假设设为:H0:θ=0;H1:θ0,H0表示两种方法无显著差别,H1表示方法一优于方法二,H2表示方法二优于方法一。贝叶斯统计在后验概率中计算H1和H2的概率,而经典统计方法则很难去处理此类

问题。

五、实例分析

下面我们通过一个例子对两种思想进行一些比较。例:以随机变量θ代表某人群中个体的智商真值,θ i为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为υ,则第i个个体在一次智商测验中的得分可以表示为:Xij=υ+ei+eij其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄的儿童的智商真值θ~N(100,225),个体智商测验得分x~N(θ*,100)。现在一名该年龄的儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平?(2)若取θ*在(a,b)为正常,问该儿童智商是否属于正常?

1.用经典统计方法解答

对第一问,建立检验问题:H0:θ*100,按照经典统计学方法,若取。α=0.05,则拒绝域为{x:x>=116.45}尚不能认为该儿童智商高于平均水平。

对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。

2.用贝叶斯方法解答

在贝叶斯学派中,当θ i未知时,将其看作随机变量,与0具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。根据贝叶斯理论,θ的先验分布是N(100,225),测验结果x*~N(0,100),儿童智商的后验分布为正态分布N(110.38,69.23)。

对第一问,同样设H0:0‘100,查正态分布表可以得到P(H0lX=115)=0,106,P(H1lx=115)=0,894,根据风险最小原则拒绝H0,接受H1。

对第二问,设H0:a

由此可以看出:按贝叶斯的观点,多重假设检验的情形并不比两个假设的检验更困难,因为它只需要多算几个后验概率即可;它同时利用了样本和

的先验信息,且由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。

六、结语

目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法在国内外正在得到越来越为广泛的应用。可以说“二十一世纪的统计学是贝叶斯的时代”。作为研究者和统计工作者一定要博采众长,以获得一种更适合解决实际问题的方法。