小样本DW统计量的分布特征(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇小样本DW统计量的分布特征范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

张晓峒1 赵初晓2

(1. 南开大学国际经济研究所, 天津 300071)

(2. 天津大学管理学院, 天津 300072)

摘要：本文用模特卡罗模拟方法研究了样本容量在54以下的dw 统计量的分布特征，并给出小样本dw检验临界值表。同时用dw检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词：模特卡罗模拟，dw分布，非平稳性，协整

distribution of small sample dw statistic

zhang xiaotong1 zhao chuxiao2

(1. institute of international economics, nankai university, tianjin 300071)

(2. management school, tianjin university, tianjin 300072)

abstract in this paper we investigated the dw distribution with sample size under 54 by monte carlo simulation method and gave a critical table for small sample dw test. based on that we proposed a method for recognizing spurious regression in ordinary least squares estimation.keywords: monte carlo simulation, dw distribution, nonstationary, cointegration

1．概述

八十年代以来，engle-granger (1987), engle-yoo (1987) 和sargan-bhargava (1983)都曾提及用dw统计量检验非平稳变量间的协整性问题。在sargan-bhargava (1983)中还专门给出一个dw协整检验用表。但在这些论文中均未对小样本dw统计量的分布特征给与研究。

本文采用蒙特卡罗模拟方法对小样本dw统计量的分布特征进行了充分、详细的研究。样本容量分别取为10，20，30，40和50。变量的设定分为三种情形：一. 所涉及的两个变量都取自i(1)过程；二. 所涉及的两个变量中一个取自i(1)过程，一个取自i(0)过程；三. 所涉及的两个变量都取自i(0)过程。

在有些国家以年为单位的时间序列的最大可观测值个数并不是很大，所以对小样本dw统计量分布特征的研究有着非常重要的理论与现实意义。

本文结构如下。第二节推导两个i(1)变量进行最小二乘回归后，由残差计算的dw统计量的极限分布表达式，第三节介绍蒙特卡罗模拟结果及其分析，第四节给出实例，第五节给出结论。

2．dw统计量的极限分布

给定如下随机数据生成系统，

yt = yt-1 + ut , y1 = 0, （1）

xt = xt-1 + vt , x1 = 0, （2）

其中ut, vt ~ i(0), e(ut) = e(vt) = 0; e(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个i(1)过程。

建立如下回归模型：

yt = b0 + b1xt + wt . （3）

当对上式进行最小二乘估计时，会产生虚假回归问题。用随机误差wt的最小二乘估计值构造dw统计量，

（4）

因为当t ® µ 时，必然接近于零，上式中分子为op(1)，而分母t -1sw2也是op(1)，所以dw统计量是op(t -1)的。当t ® µ 时，有

dw þ 0.

即当用两个i(1)变量进行如模型(3)形式的回归时，dw统计量的极限分布为零。

3．小样本dw分布的蒙特卡罗模拟及其结果分析

当样本为有限样本，特别是小样本时，dw统计量的分布与其极限分布有着很大不同。由于上述条件下的dw统计量的分布无法用解析的方法求解，本文用蒙特卡罗模拟方法对dw统计量的小样本分布特征进行了研究。

以模型(3)为基础，除了以yt，xt ~ i(1)为条件对dw分布（记为dw(1,1)）进行模拟外，还分别以yt ~ i(1)，xt ~ i(0) 和yt，xt ~ i(0)为条件进行了模拟（分别记为dw(1,0) 和dw(0,0)）。

由于dw(0,0)就是通常意义的dw统计量，所以只模拟样本容量t = 10, 40两种情形。对于dw(1,1)和dw(1,0)，分别取t = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。

首先见表一的第三部分，先分析dw(0,0) 的分布特征。由于dw(0,0) 就是通常意义的dw统计量，所以模拟结果表明，一. dw(0,0)分布的均值为2，不受样本容量大小的影响；二.分布是对称的，相应jb值（表中最后一列）说明小样本dw(0,0)统计量的分布与正态分布相当近似。三. 随着样本容量的增大，分布的标准差逐步减小。

见表一的第一、二部分。小样本dw(1,1)和dw(1,0)统计量有着相似的分布特征。一. 分布均为右偏态，分布左侧有端点，端点为零；二. 随着样本容量的增大，dw(1,1)和dw(1,0)分布的右偏倚程度越来越大，分布均值逐步相左移动，90、95、99百分位数也逐步向左移动，同时分布的标准差逐步减小，分布的峰值越来越大，dw取值向零集中；三. 在样本容量相同的条件下，dw(1,0)分布总是位于dw(1,1)分布的左侧，即dw(1,0)分布的均值、百分位数以及方差都比dw(1,1)分布的相应量小。t = 50模拟1000次的dw(1,1)和dw(1,0)分布的结果分别见图一和图二。

表一 dw分布的蒙特卡罗模拟结果

类型样本容量百分位数均值标准差偏度 jb统计量

1 90 95 99

10 0.22 2.18 2.45 2.81 1.28 0.62 0.50 48.74

dw(1,1) 20 0.11 1.28 1.49 1.80 0.75 0.39 0.68 77.61

30 0.09 0.90 1.04 1.39 0.51 0.29 1.07 293.73

40 0.06 0.77 0.88 1.16 0.41 0.25 1.06 250.10

50 0.05 0.59 0.71 0.98 0.33 0.20 1.16 341.31

10 0.18 1.73 2.02 2.38 0.98 0.53 0.73 89.59

20 0.09 1.02 1.21 1.59 0.56 0.34 1.22 369.61

dw(1,0) 30 0.06 0.70 0.83 1.18 0.38 0.24 1.27 430.43

40 0.04 0.54 0.66 0.91 0.30 0.19 1.25 383.68

50 0.04 0.45 0.54 0.71 0.24 0.15 1.12 261.84

dw(0,0) 10 1.31 2.75 2.97 3.24 2.02 0.57 0.00 7.17

40 0.72 2.41 2.53 2.70 2.00 0.31 0.03 4.06

注：1. dw(1,1)表示由两个i(1)变量进行回归，计算得到的dw值。

2. dw(1,0)表示由一个i(1)变量和一个i(0)变量进行回归，计算得到的dw值。

3. dw(0,0)表示由两个i(0)变量进行回归，计算得到的dw值。

4. 在每个样本容量条件下各模拟1000次。

图一 t = 50模拟1000次的dw(1,1)分布直方图图二 t = 50模拟1000次的dw(1,0)分布直方图

在相同样本容量条件下，dw(1,0)分布之所以位于dw(1,1)分布左侧，可作如下解释。随着t ® µ，dw(1,0)和dw(1,1)的分布都趋近于零。由于dw(1,0)来自于一个i(1) 变量和一个i(0)变量之间的回归，所以残差序列wt ~ i(1)。由于dw(1,1)来自于两个i(1)变量之间的回归，一般来说残差序列wt ~ i(1)，但也有可能在yt和xt之间存在协整关系，从而使wt ~ i(0)。所以dw(1,0)分布必位于dw(1,1)分布的左侧。

用dw(1,1)统计量可以检验相应两个i(1)变量yt和xt是否存在协整关系。同时dw(1,1)统计量也可用来判断普通最小二乘回归中是否存在虚假回归。这与协整检验是一致的。若两个i(1)变量存在协整关系，则回归是有意义的，否则为虚假回归。

用表一中关于dw(1,1)的模拟结果，即用表一中第一部分dw(1,1)分布的第90、95、99百分位数，均值和标准差分别对样本容量的到数（1/t）进行回归。结果见表二。

表二 dw(1,1)分布第90、95、99百分位数，均值和标准差分别对1/t的回归函数

（用表一中第一栏相应数据估计）

i 回归函数 r2 s.e. f dw

1 p90 = 0.2561 + 19.4438 (1/t)(6.4) (26.3) 0.9957 0.05 691.2 2.35

2 p95 = 0.3338 + 21.4633 (1/t)(6.7) (23.2) 0.9945 0.06 538.8 2.37

3 p99 = 0.6059 + 22.3828 (1/t)(10.8) (21.5) 0.9936 0.07 462.7 1.45

4 mean = 0.1182 + 11.7759 (1/t) (4.7) (25.6) 0.9954 0.03 656.1 2.18

5 sd = 0.1167 + 5.1082 (1/t)(8.7) (20.6) 0.9930 0.02 462.3 1.90

注：1. p90 , p95 和p99分别表示dw(1,1)分布的第90、95和99百分位数。

2. mean和sd分别表示dw(1,1)分布的均值和标准差；1/t表示样本容量的倒数。

3. r2表示拟合优度，s.e. 表示回归函数的标准差。

通过拟合优度r2的值可以看到dw(1,1)分布的第90、95、99百分位数，均值和标准差与1/t高度相关。所以完全有理由以表二中的前三个回归函数作为响应面函数，编制小样本dw检验临界值表（见表三）。表三可用来检验两个原变量是否存在协整关系，同时也就是检验原最小二乘回归式中是否存在严重的虚假回归。如果两个原变量是平稳的或者两个变量都是非平稳的但存在协整关系，则最小二乘回归后用残差计算的dw统计量一定服从均值为2的近似正态的分布，其第90、95和99百分位数一定会大于表三中所给出的相应临界值。而只有当wt非平稳时，dw统计量的值才会以相应概率小于表三给出的相应临界值。表二中的第4和5回归式表明小样本dw(1,1)分布的均值和标准差都随着样本容量的增大而极有规律地减小。

表三小样本dw检验临界值表

样本容量 t dw分布

第90百分位数第95百分位数第99百分位数

10 2.20 2.48 2.84

14 1.64 1.87 2.20

18 1.34 1.53 1.85

22 1.14 1.31 1.62

26 1.00 1.16 1.47

30 0.90 1.05 1.35

34 0.83 0.97 1.26

38 0.77 0.90 1.19

42 0.72 0.84 1.14

46 0.68 0.80 1.09

50 0.64 0.76 1.05

54 0.62 0.73 1.02

4．实例分析

为研究我国国际贸易与国民经济的关系，以我国进出口贸易总额（yt，亿元人民币）和社会总产值（xt，亿元人民币）为变量（数据见

小样本DW统计量的分布特征

常用范文

优秀范文