当前位置: 首页 > 范文大全 > 公文范文 >

当代贝叶斯计量经济学分析框架与展望

时间:2022-03-21 10:15:43  浏览次数:

摘 要:随着贝叶斯理论的发展和计算机模拟等数值计算技术的提高,贝叶斯计量经济学开始迅速发展起来。本文通过对经典学派与贝叶斯学派进行比较,简要回顾了贝叶斯计量经济学的发展历程,并从八个方面对贝叶斯计量经济学研究过程中的分析框架进行说明,最后进行了展望。

关键词:贝叶斯计量;先验分布;后验分布;伸缩性

Zellner的《An Introduction to Bayesian Analysis in Econometrics》一书的出版标志着贝叶斯计量经济学的真正诞生。该书较为全面地阐述了贝叶斯计量经济学的大多数专题,其中包括回归模型中的大多数问题、联立方程模型和时间序列模型等的贝叶斯计量方法。

此后,研究贝叶斯计量经济学的文献开始大量出现。当代许多杰出的计量经济学家如Geweke,Litterman ,Dempster, Sims, Maddala ,Chib等都应用贝叶斯计量经济学解决经济问题。Qin(1996)对贝叶斯计量经济学理论发展进行了回顾。Poirier(2006)对国外1970—2000年间几种重要的期刊在经济和计量经济学文章中使用的贝叶斯方法数量发展速度进行了回顾。国内研究贝叶斯理论的人员很多,但是研究贝叶斯计量经济学的文献并不是很多,只有朱慧明、韩玉启(2006)研究了贝叶斯计量经济学的几个重要专题,并深入地进行了讨论。虽然贝叶斯计量经济学作为一种科学的数据分析的方法早已经存在,但贝叶斯计量经济学分析应遵循的基本框架是什么?本文就此分八个部分进行阐述,并对其发展和应用前景进行展望。

一、贝叶斯学派与经典学派之间的差异及其分析的优点

统计学发展过程中产生了两个主要学派:经典学派与贝叶斯学派。经典学派又叫频率学派,其发展已有几百年的历史。而贝叶斯学派的发展历史不过0多年,在贝叶斯学者的努力下,打破了经典统计一统江山的局面,两个统计学派共同发展起来,而且不同的派别各自有大量的追随者(茆诗松,1999)。

贝叶斯学派与经典学派之间的差异是明显的。首先,两个学派的核心差别是对于概率的不同定义。经典学派认为概率可以用频率来进行解释,估计和假设检验可以通过重复抽样来加以实现。而贝叶斯学派认为概率是一种信念。结合这种信念加以假设检验(先验机会比),当数据出现以后就产生后验机会比。这种方法结合了先验和样本信息辅助假设检验。其次,两者使用的信息不同。经典学派使用了总体信息和样本信息,总体信息即总体分布或总体所属分布族的信息,样本信息即抽取样本(数据)提供给我们的信息。而贝叶斯学派除利用上述两种信息外,还利用了一种先验信息,即总体分布中未知参数的分布信息。两者在使用样本信息上也有差异,经典统计对某个参数的估计说是无偏的,其实是利用了所有可能的样本信息,贝叶斯学派只关心出现了的样本信息。而且贝叶斯学派将未知参数看作是一个随机变量,用分布来刻划,即抽样之前就有有关参数问题的一些信息,先验信息主要来自经验和历史资料。而经典统计把样本看成是来自具有一定概率分布的总体,所研究的对象是总体,而不局限于数据本身,将未知参数看作常量。

贝叶斯方法的优点很多。例如:与频率方法比较贝叶斯方法充分利用了样本信息和参数的先验信息,在进行参数估计时,通常贝叶斯估计量具有更小的方差或平方误差,能够得到更精确的预测结果;贝叶斯PD(最大后验)置信区间比不考虑参数先验信息的频率置信区间短;贝叶斯方法能对假设检验或估计问题所做出的判断结果进行量化评价,而不是频率统计理论中的接受、拒绝的简单判断;在基于无失效数据的分析工作,贝叶斯统计有着更大的优点(韩明,200)。

二、贝叶斯定理的表述

贝叶斯方法的一个关键元素是贝叶斯定理,通常又叫反概率原理。当先验分布和后验分布都是连续形式时:用θ表示我们关心的参数向量或矩阵,用y表示来自联合密度函数f(y∶θ)的样本观测值向量或矩阵,联合密度函数又可以写成f(y|θ),函数f(y|θ)在代数上等同于θ的似然函数,它包含了关于θ的所有样本信息,在贝叶斯理论中由于θ是随机变量,f(y|θ)是给定θ的条件下y的条件密度函数,而且有h(θ,y)=f(y|θ)π(θ)=π(θ|y)f(y)。其中h是θ和y的联合密度函数,π是θ的先验密度函数,它包含了关于θ的非样本信息,通常将上式重新排列得到结果π(θ|y)=f(y|θ)π(θ)f(y)。由于f(y)是与θ无关的一个常数,上式可写成:π(θ|y)∝f(θ|y)π(θ),其中∝表示“与……成比例”,若用文字表述就是:后验密度∝似然函数×先验密度。这就是贝叶斯定理的连续形式,它把先验信息、样本信息和总体信息融为一体。

贝叶斯后验均值估计的最基本特性是伸缩性(shrinkage)。当似然函数的精度h0较大时,后验均值主要受样本均值支配;相反,当先验精度h1较大时,后验均值主要受先验均值支配。这就是为什么贝叶斯估计通常取先验精度较低的原因(方差给得较大),也可以看出贝叶斯估计在调整先验精度下可以达到经典估计的效果,从某种意义上说经典估计是贝叶斯估计的特殊形式。通过两种精度的调整达到对后验均值的估计叫做伸缩性估计特性,所有贝叶斯估计的均值都具有伸缩性估计这个特性。

三、先验分布理论的研究

从上面已经看出,似然原理在贝叶斯学派和经典学派都有应用,而区别在于解释不同。除了似然原理外,贝叶斯定理得到后验分布的另外一个元素就是参数θ的先验分布。先验分布是后继贝叶斯推断的基础和出发点,是贝叶斯学派研究的重点问题之一,也是贝叶斯理论有争议最多的部分。先验分布大体可以分为扩散先验(diffuse prior)分布和共轭先验(conjugateprior)分布两大类。此处的扩散先验即一般文献中的无信息先验分布(noninformative prior)。当然无信息先验分布并非一无所知,实际包含许多信息,至少知道该参数是位置参数还是尺度参数。共轭先验分布是指这个先验分布与似然函数相乘后,得到的分布与先验分布函数形式一样,即属同一个分布族。这种先验的好处是,当一个新的样本被观察后,关于参数θ的后验分布有同样的解析形式,只需带入超参数和样本值,就可以计算出后验的均值和方差。

参数的先验分布的选取方法之一是贝叶斯假设,即假设参数的先验分布在取值范围内是均匀分布的:若将θ的取值范围记为Θ,并略去密度取值为0的部分,则参数θ先验分布密度函数为:π(θ)∝a constant时,这时先验叫improper prior 或叫flatprior 。因为这个分布积分不为1(概率公理不满足)。

通常,贝叶斯假设在参数变换下并不满足不变性的要求,即变换后的分布不再服从均匀分布。如果参数θ选取均匀分布作为其先验分布,根据贝叶斯假设,θ的函数π(θ)也应选取均匀分布作为其先验分布,然而由θ服从均匀分布这一前提,往往导不出π(θ)也服从均匀分布。例如正态总体标准差为σ,它的参数空间是(0,∞),为能变换,我们选取贝叶斯假设σ~U(0,1),即f(σ)=1,0<σ<1,其它情况密度为0,取它的一个变换η=σ2,这是一一变换,根据随机变量函数的变换,g(η)=f(σ)×1/2σ=1/2σ,可以看出η的密度已不是均匀分布了,而是与随机变量σ有关了。

针对贝叶斯假设在变换下并不满足不变性,effreys(1961)建议对于参数在有限范围内或-∞到+∞范围内取任意值,它的先验分布应取成均匀分布,若它的可能取值范围是从0到∞之间,则它取对数后的先验分布应是均匀分布。所以位置参数的先验应与一个常数成比例,尺度参数应与自己的逆成正比,例如来自正态分布N(μ,σ2)的样本的扩散先验应为π(μ,σ)∝1/σ。effreys(1961)根据不变性的要求,又提出了一种基于Fisher信息阵的多参数模型扩散先验分布选择方法。若令L(θ)为似然函数,effreys认为参数先验分布应与Fisher信息阵的行列式的平方根成比例:π(θ)∝[detI(θ)]1/2,其中I(θ)=E-2logLθθ,ellner(1971)详细研究了effreys先验分布能够满足的各种不变性要求。所以在贝叶斯计量经济学中讨论位置参数θ的扩散先验应为π(θ)∝1,θ∈Θ,尺度参数的扩散先验分布为π(θ)∝1/θ,θ>0;对于正态分布N(μ0,σ2),μ0已知,σ>0未知,此时标准差σ是尺度参数,那么标准差σ的扩散先验分布应为:π(σ)∝1/σ,σ>0。对于正态分布N(μ,σ20),σ20已知,此时μ是位置参数,那么其扩散先验分布应为π(μ)∝1,μ∈R。位置——尺度参数的联合扩散先验分布形式

四、贝叶斯点估计

参数的后验密度概括了参数的所有信息。因此,一旦得到参数的后验密度,就可以对参数进行研究。在确定参数的具体值(点估计)时,就要依据某个准则来决定哪一个值最佳。若最佳估计值的选取依赖于用来估计真参数θ时所造成的损失。一般来说,当估计值离参数真值θ越远,损失就越大。描述点估计与真参数θ间的函数L(θ,)称为损失函数。常用的损失函数是二次损失函数L2=c(-θ)2和线形损失函数L1=c|-θ|,其中c是一个正的常数。要获得点估计值,需要考虑某种损失函数形式使损失最小,要使所有类的损失函数都能达到最小的,只有=θ;然而,真实参数θ是未知的,这种方法明显不行。为了克服这一困难,在θ的所有可能值上加权平均(或期望)损失最小,权数为后验密度函数π(θ|y),因而,一个贝叶斯点估计值就是使期望后验损失最小的值。这里,期望后验损失由下式给出Eθ|y[L(θ,)]=∫L(θ,)π(θ|y)dθ,对于二次损失函数L2,后验分布的均值就是使上式达到最小的点估计值,因为Eθ|y[L2(θ,)]=∫c(-θ)2π(θ|y)dθ,为使上式达最小的值,对上式求导得dd{Eθ|y[L2(θ,]}=∫2c(-θ)π(θ|y)dθ,令上式为零便得的最小值,∫π(θ|y)dθ=∫θπ(θ|y)dθ。 由密度函数的性质知上式左边积分号的内容等于1,因此二次损失函数下的θ的点估计值就是后验密度的均值(期望):=E[θ|y]=∫θπ(θ|y)dθ 。在贝叶斯计量经济学中,只要对后验分布求期望就能得到参数的点估计值。

五、贝叶斯区间

我们在经典统计下讨论置信区间和参数时,都是说这个区间覆盖参数的可能性,而不说这个参数在这个区间内,因为这里随机变化的是区间而不是参数。当说一个参数有90%的把握落在某个区间内,这种说法经典统计是不容许的,因为经典统计认为参数是固定的;只能说90%的机会覆盖这个参数;而贝叶斯学派可以说某个参数落入某个区间的概率。这是因为贝叶斯学派认为参数是个随机变量,有一个概率分布。而只有在得到贝叶斯后验分布时,才用区间覆盖某个参数这种说法。为了与经典学派相区分,贝叶斯学派用可信区间而不是置信区间,可信区间来自后验分布。

所以当θ的后验分布π(θ|y)获得以后,立即可以计算出θ落入某个区间[a,b]内的后验概率。p(a<θ<b)=∫baπ(θ|y)=1-α,满足这个式子的a,b不唯一(单峰型的密度函数中是唯一的),因此需要依据某些准则来选择这个区间。一种可能是,要求所选区间内的每点的后验密度函数值都大于区间以外点的密度函数值。具有这种性质的区间叫做最大后验密度(PD)。反之,若给定1-α的概率,要找一个区间[a,b],使上式成立,这样求的区间就是θ的贝叶斯可信区间。

六、贝叶斯假设检验

抽样理论中的假设检验是通过设置两个假设0和1,和一个适当的统计量,根据此统计量的值是否落入临界区域内决定每个假设被接受还是拒绝。贝叶斯假设检验是根据零假设0下的设定值是否以预先指定的概率落入PD区间,来决定接受或是拒绝零假设。常用的贝叶斯假设检验是利用后验机会比(posterior odds)。这种方法通过计算每种假设下的后验概率P(0|y)和P(1|y)得到后验机会比01,01=P(0|y)P(1|y) 。这一比率给出了0相对于1的优势。利用后验机会比进行假设检验,与其说是假设检验还不如说是“比较”。从上面可以看出,贝叶斯假设检验不要求接受或是拒绝某个假设,因为后验机会比就足以说明问题。后验机会比01大于1表明支持原假设,后验机会比小于1表明接受1,后验机会比01约等于1时须重新搜索信息,不宜做出判别,这种后验机会比01也适合多重假设检验,这是经典统计办不到的。

七、贝叶斯预测

许多情况下,给定样本信息y后,我们希望对其它还未观测到的未来值y进行预测。在贝叶斯方法中,给定样本信息后能够求得还未观察值的分布,我们称之为预测分布。令y为还未观察到的向量,y和参数向量θ在

们就可以对未来参数进行点预测和区间预测了。

八、贝叶斯计算方法

尽管贝叶斯推断模式简单,并且概率形式优美。然而,在贝叶斯分析中,一般只知道后验分布密度函数的核,而难以获得具体的边缘密度函数和条件密度函数,也很难找到累积分布函数的数值分位点,计算边缘后验分布密度函数和条件密度函数的困难是阻碍贝叶斯方法应用广泛的最大障碍。对于贝叶斯后验分布的高维问题,通常的格点搜索方法和拉普拉斯算法都不是很有效。而蒙特卡洛方法对这类问题较为强劲,且一直受到计量经济学家的关注(朱慧明、韩玉启,2006)。然而,这些方法的实现,需要依靠复杂数值的解析近似技术及相应的软件支撑。

目前,在贝叶斯分析中应用最为广泛的是MCMC方法,而MCMC方法主要有两种:Gibbs抽样方法和Metroplis-astings方法。能够支持这种运算的软件和应用程序已经有很多被开发出来,例如WinBUGS通常专门用来实现MCMC,还有一些在软件中加入贝叶斯模块,例如 RAS、S-Plus 和Matlab等。尽管MCMC方法应用广泛,但很难判断何时马尔科夫链已经渐近收敛于平稳分布,所以对MCMC方法收敛性的研究一直是个重要课题。从某种意义上说,贝叶斯研究带动了计算技术的发展。

通常一个完整的贝叶斯计量经济学问题的分析结构都应包括上述八个步骤的讨论,当然具体问题还要具体对待。展望未来贝叶斯计量经济学仍然是一个值得大量研究的领域,例如,面板数据分析中的随机系数模型和时变参数模型,若是给定先验分布就是一个贝叶斯问题;单位根检验也是贝叶斯方法大有用武之地的领域,很多计量经济学家都对其进行了研究,并且提出了不同的观点,得出了宏观经济数据的不同单位根检验的结果;缺失数据的分析天然地与贝叶斯方法结合比较紧密,它本身就是对未知值的一种信念。越来越多的文献目前关注着贝叶斯方法的发展和贝叶斯方法在计量经济学文献中的应用。

参考文献:

阿诺德·泽尔纳. 200. 计量经济学贝叶斯推断引论[M]. 上海:上海财经大学出版社.

韩明. 200. 基于无失效数据的可靠性参数估计[M]. 北京:中国统计出版社.

茆诗松. 1999. 贝叶斯统计[M]. 北京:中国统计出版社.

朱慧明,韩玉启. 2006. 贝叶斯多元统计推断理论[M].北京:科学出版社.

UDGE G G.1980. he theory and practice of econometrics[M]. New York :Wiley.

POIRIER D . 2006. he growth of bayesian methods in statisticsand economics since 1970[] . Bayesian Analysis,1(4):969-980.

PRESS S . 1989. Bayesian statistics: principles, models, and applications[M]. New York. ohn Wiley and Sons, Inc.

QIN D. 1996. Bayesian econometrics:the first twenty years[]. Econometric heory.

ELLNER A. 1997. Bayesian analysis in econometrics and statistics :the ellner′s view and papers[M]. [S.L]:Edward Elgar.

ELLNER A. 2004. Statistics, econometrics, and forecasting[M]. [S.L]:Cambridge University Press.

he Framework of Contemporary Bayesian

Econometrics Analysis and Its Outlook

LI Xiaosheng1,2 XIA Yuhua1

(1.Xiamen University, Xiamen 36100; 2.Anhui University. of Finance and Economics, Bengbu 233041)

Abstract:Along with the development of Bayesian theory and the advancement of computer simulation, Bayesian econometrics develops rapidly.his paper compares the classical and Bayesian school of thought, and briefly reviews Bayesian econometrics develpoment courses. In the end, it analyzes its framework from eight aspects and its outlook.

eywords: Bayesian econometrics; prior distribution; posterior distribution; shrinkage(责任编辑 杨莲娜)

注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

推荐访问: 计量 展望 经济学 框架 当代