开篇:润墨网以专业的文秘视角,为您筛选了一篇中国居民储蓄地区差异检验方法对比分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
【摘要】本文首先以EDA技术对我国东部、中部、西部的实际储蓄额进行初步探查。再对三个地区的实际储蓄额进行了Kruskal-Wallis检验、Jonckheere-Terpstra检验和方差分析。三种检验的结果都是要拒绝原假设,即我国东部、中部、西部的实际储蓄额有差异。由于方差分析的p值最小,所以检验的效果最好。因此当数据服从正态分布时应该采用方差分析对数据检验。此外,通过Jonckheere-Terpstra检验,可以得知东部的实际储蓄额最高,中部次之,西部的实际储蓄额最低。且Kruskal-Wallis检验,Jonckheere-Terpstra检验和方差分析的检验结果都与利用EDA技术对数据探查的结果一致,所以检验的结果真实可信。
【关键词】居民储蓄 地区差异 非参数检验 方差分析
一、引言
中国的居民储蓄和国民储蓄在发达国家和新兴市场国家中都是最高的。我国城乡居民人民币储蓄存款余额的年增加额在1991年至1996年、2000年至2003年、2007年至2009年期间具有明显的上升趋势。但是我国地区之间的储蓄相差较大,地区之间出现“两极”现象。由于储蓄是与经济增长紧密相连的,因此以正确的方法对不同地区的储蓄差异进行检验分析是十分重要的。
探究不同总体的位置参数或者尺度参数问题,当涉及多个样本的比较问题的时候,可以采用参数检验方法,常用的参数检验方法有方差分析等。但是方差分析是要假定总体的分布是正态分布。但是当先验信息或所分析的数据往往不满足方差分析的条件时,方差分析不能使用。如仍采用方差分析,那么对所分析的数据会作出错误的判断。所以当所分析的数据总体分布未知或者总体分布为非正态分布时,则可以使用非参数检验。
二、数据探查
(一)指标的选取
为了探究各地区储蓄情况的差异,我们将全国的6个行政区划分为东部、中部、西部三个区域,选取2001年到2011年10年间各地区的储蓄额进行分析,并通过价格指数进行调整,消除通货膨胀的影响,得到各地区的实际储蓄额。
(二)箱线图
作为一项非常实用的EDA技术,箱线图可以利用5数总括将几个批的数据平行显示,从而对东部、中部、西部的城乡储蓄额的数据特点进行比较分析。运行R软件作图得到三个地区的储蓄额的箱线图。
从图1可以看出,三个地区的实际储蓄额相差较为悬殊。东部地区的实际储蓄额明显偏高,东部的中位数高于西部和中部地区的中值甚至上四分位数。此外,根据箱线图的长度(即四分展布)可以看出,西部的数据值是最密集的,东部地区的数据则相当分散。
三、非参数检验
(一)Kruskal-Wallis检验
要分析东部、中部、西部实际储蓄量的水平差异,可以通过比较三组数据的中位数进行分析。Kruskal-Wallis检验是由1952年Kruskal和Wallis二人提出的,可以运用到3个或更多组检验的方法:首先,将多组样本混合起来求秩,再按样本组求秩和,遇到相同观测时,采用平均法定秩。
需要检验的假设为:
H0:3个总置相同,H1:3个总置不同。
设xij代表第j个总体的第i个观测值,nj为第j个总体中样本的重复次数。将所有数据从小到大排列,最小秩为1,最大值的秩为n=n1+n2+......nk,如果有相同秩,则采用平均秩。令Rij为观测值xij的秩,则每个观察值的秩如表1所示。
四、参数检验
(一)正态性检验
由于方差分析要求被检验的样本服从正态分布,所以应对样本进行正态性检验。这里我们采用Shapiro-Wilk检验对数据进行检验,检验结果如表2:
五、分析总结
三种检验的结果都是能拒绝原假设,我国东部、中部、西部的实际储蓄额有差异。且检验结果都和结论都与利用EDA技术对数据探查的结果一致,所以检验的结果真实可信。
但是通过比较三种检验方法的伴随概率(P值)可知,三种检验方法的伴随概率相差较大。由于方差分析的伴随概率最小,所以方差分析检验的效果最好,因此当数据服从正态分布时应该采用方差分析对数据检验。当所分析的数据总体分布未知或者总体分布为非正态分布时,则可以使用非参数检验。使用非参数统计对数据进行检验可以减少模型偏差,由于非参数方法完全从数据本身获得所需的信息,无需对总体分布强加假定条件,可以选择与数据最为匹配的模型,从而纠正了传统参数方法可能导致的模型偏差。其次,非参数方法的核心是秩,其含义直观,易于理解。
此外检验结果也可以看出,Jonckheere-Terpstra检验的效果较好要优Kruskal-Wallis检验,Jonckheere-Terpstra检验不仅对多个样本的位置一致性进行检验,对样本位置所呈现的上升和下降趋势进行判定。通过Jonckheere-Terpstra检验,我们可以得知东部的实际储蓄额最高,中部次之,西部的实际储蓄额最低。因此,它提供的信息量要多于Kruskal-Wallis检验。
参考文献
[1]张建华,戴静.中国居民储蓄地区差异分析——基于回归的分解.中华外国经济学说研究会第19次年会暨外国经济学说与国内外经济发展新格局会议文集.2010(10):485-492.
[2]王星.非参数统计[M].北京:清华大学出版社,2009:124-135.
[3]汤银才.R语言与统计分析[M].北京:高等教育出版社,2008:225-232.
[4]吴建群.探索性数据分析在能源消费中的应用探讨.现代商贸工业,2011(17):46-47.