概化理论偏态分布数据方差分量置信区间估计(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇概化理论偏态分布数据方差分量置信区间估计范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要：心理与教育测量的应用领域发生了较大变化，被测群体的知识和能力等特质在一定程度上不再服从偏度为0的分布。利用GH分布性质，模拟生成一定偏度的偏态分布数据，探讨数据的不同偏度对概化理论方差分量置信区间估计的影响。结果表明：（1）偏态分布数据的偏度对Traditional方法、Jackknife 方法和MCMC方法估计方差分量置信区间有显著的影响；（2）校正的Bootstrap的PC和BCa方法估计偏态分布数据方差分量置信区间，要优于未校正的Bootstrap的PC和BCa方法；（3）使用“分而治之”策略，Bootstrap的PC和BCa方法能够找到一种（或几种）策略较好地估计偏态分布数据的方差分量置信区间。

关键词：概化理论；偏态分布数据；方差分量；置信区间估计

中图分类号：B841.2 文献标识码：A 文章编号：1003-5184（2012）05-0397-07

1 引言

随着社会的发展，心理与教育测量的应用领域发生了较大变化，被测群体的知识和能力等特质在一定程度上不再服从偏度为0的分布（焦璨，张敏强，黄庆均，张文怡，黎光明，2008）。Othman（1995，p.8）的研究表明，许多测验数据的分布呈弱偏态，如CAP（California Assessment Program）和UCSB（University of California Santa Barbara），这两个测验数据的分布偏度值介于-0.91～+0.85。

概化理论（Generalizability Theory，GT）是关于行为测量可靠性（dependability）的统计理论（Shavelson & Webb，1991，p.1），广泛应用于心理与教育测量中（漆书青，戴海崎，丁树良，2002；杨志明，张雷，2003）。当数据为偏态分布时，适合于概化理论正态分布数据的方差分量置信区间估计方法不一定适合于偏态分布数据。

在样本统计量研究中，仅用一个（次）样本平均数来估计总体均值，存在较大的风险，因为样本平均数容易受抽样的影响。例如，某班某次考试平均分为70分，用这个成绩估计这个班的能力水平，必然存在较大风险，这个班下次考试成绩的平均分有可能变为75分。为了降低这种风险，通常的做法是用标准误或置信区间等变异量来估计这个班的实际水平，如70±10或＼[60，80＼]。与平均数做法类似，概化理论下所估计的方差分量，也受到抽样的影响，用某个（次）样本方差分量来估计总体方差分量（参数），存在一定误差。为了降低这种误差带来的风险，需要报告方差分量对应的变异量（如标准误或置信区间），来反映可能存在的变化程度。Gao和Brennan（2001）认为，估计的方差分量、误差方差和概化系数等统计量受限于抽样，不同的抽样样本估计的统计量可能不一样，应该重视考察方差分量及其相关统计量的变异量（如置信区间）。

虽然Othman（1995）已经考虑到数据分布具有（弱）偏态，但是Othman并没有进行偏态分布数据的方差分量置信区间估计，显得不足。本文旨在探讨偏态分布数据偏度如何影响概化理论方差分量置信区间估计。

2 方法

2.1 数据产生

基于p×i设计概化理论模型，根据GH分布的性质使用蒙特卡洛数据模拟技术产生偏态分布数据。

2.2 比较标准

比较标准为“偏差”（bias），计算方法是i表示方差分量置信区间的包含率估计值，θ为参数（0.800），偏差的绝对值（称为“绝对偏差”）越大，表明估计值与参数的差异越大，结果越不可靠。

2.3 分析工具

分析工具为R软件、WinBUGS 软件、R2WinBUGS软件包、Coda软件包和HyperbolicDist软件包。借助这些软件或软件包，自编完成研究程序。

3 结果

3.1 β=-2.0的偏态分布数据估计的方差分量置信区间及其包含率

对β=-2.0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表1所示。

在表1中，lower表示方差分量的下限，为方差分量10%分位数，upper表示方差分量的上限，为方差分量90%分位数，80%表示“80%置信区间包含率（coverage）”，其值与10%和90%两分位点对应的方差分量有关。

在表1中，satterthwaite和TBGJL分别表示用Satterthwaite和TBGJL方法估计的方差分量置信区间包含率。jack-p、jack-i、jack-pi表示Jackknife方法的三种再抽样策略。MCMC inf和 MCMC non-inf分别表示有先验信息的MCMC方法和无先验信息的MCMC方法。PC和BCa分别表示用Bootstrap的PC和BCa方法估计的方差分量置信区间及其包含率，对PC和BCa两种方法分别实施不同的Bootstrap策略（6种），Bootstrap还可分为校正的和未校正的两种情况，这样每种方法共有2×6=12种情况。例如，PC：boot-pi表示采取未校正的boot-pi策略使用PC方法估计的方差分量置信区间及其包含率，PC：boot-piadj表示采取校正的boot-pi策略使用PC方法估计的方差分量置信区间及其包含率，BCa：boot-pi表示采取未校正的boot-pi策略使用BCa方法估计的方差分量置信区间及其包含率，BCa：boot-piadj表示采取校正boot-pi策略使用BCa方法估计的方差分量置信区间及其包含率，其余类似解释。3.2 β=-1.0的偏态分布数据估计的方差分量置信区间及其包含率

对β=-1.0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表2所示。

3.3 β=0的偏态分布数据估计的方差分量置信区间及其包含率[HT]

对β=0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表3所示。

4 分析与讨论

4.1 Traditional、Jackknife、MCMC方法估计的方差分量置信区间包含率分析

根据表1～表3中Traditional方法（包括Satterthwaite和TBGJL方法）、Jackknife方法和MCMC方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出三种方法对应的方差分量80%置信区间包含率图，如图1（a）～图1（c）所示。

在图1（a）～图1（c）中，Sa表示Satterthwaite，TB表示TBGJL，jp表示jack-p，ji表示jack-i，jpi表示jack-pi，mi表示MCMC inf，mni表示MCMC non-inf。在图1（a）～图1（c）中，p-coverage_2、p-coverage_1和p-coverage_0分别表示β为-2、-1和0偏态分布数据Traditional、Jackknife和MCMC方法估计的人的方差分量置信区间包含率，其余类似解释。

Jackknife方法估计的方差分量置信区间包含率，远离参数0.800，包含率严重偏低，表明Jackknife方法估计方差分量置信区间不准确。Traditional方法（包括Satterthwaite和TBGJL方法）与MCMC方法（包括MCMC inf和MCMC non-inf方法）估计三个方差分量的置信区间包含率，结果相当。

对比图1（a）～图1（c）可以发现，随着偏度减小，Traditional和MCMC方法的三个方差分量置信区间包含率越来越接近参数0.800，但接近的速度“先快后慢”，速度越来越小。当偏度远离0时，方差分量的置信区间包含率偏离参数0.800越来越大，表明Traditional方法和MCMC方法受偏度影响。在偏度为0时结果较好（离参数0.800相对较小），偏度较大时结果不好。这样，可以认为Traditional和MCMC方法仅是尚可，因为受偏度影响，需要分情况对待，并没有达到“令人满意”的结果，界于准确与不准确之间，不是十分理想，仅为“适中”。对于正态分布数据，Traditional方法和MCMC方法估计方差分量置信区间结果较好（黎光明，张敏强，2009）。对于偏态分布数据，偏度为0结果较好，佐证了正态分布数据所得的结论，因为偏度为0是正态分布的一个属性。当然，偏度为0仅是正态分布一个“属性”，正态分布还受峰度、尾部厚度等条件影响，通过改变GH分布形式，促使GH分布形成正态分布，那么偏态分布的结果就成了正态分布的结果。当偏度趋近于0时，结果越来越好，这表明偏态分布数据的偏度影响Traditional和MCMC方法对方差分量置信区间的估计，偏度越大，方差分量置信区间包含率偏离参数越大，反之亦然。

4.2 Bootstrap的PC和BCa方法估计的方差分量置信区间包含率分析

根据表1～表3中Bootstrap的PC方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出Bootstrap的PC方法对应的方差分量80%置信区间包含率图，如图2（a）～图2（c）所示。

在图2（a）～图2（c）中，Ppi表示PC：boot-pi，Ppia表示PC：boot-piadj，其余类似解释。从图2（a）～图2（c）可以看出，对于三个方差分量置信区间包含率，随着偏度减小，越来越接近参数0.800。但是，接近的速度随着偏度减小而越来越慢，这表明偏态分布数据的偏度影响Bootstrap的PC方法对方差分量置信区间的估计，偏度越大，方差分量置信区间包含率偏离参数的幅度越大，反之亦然。三条不同偏度的方差分量包含率折线相当相似，可以认为，偏度仅对方差分量置信区间包含率大小有影响，对其方向影响较小，说明Bootstrap的PC方法估计不同偏态分布数据方差分量置信区间包含率“步调”趋于一致。

对比校正的和未校正的Bootstrap的PC方法，发现对于p和i的方差分量置信区间估计，两种方法估计的包含率相当，不论在何种偏度下两者结果几乎一致，而对于pi的方差分量置信区间估计，两种方法存在相当大的差异。校正的Bootstrap的PC方法优于未校正的Bootstrap的PC方法，未校正的Bootstrap的PC方法在大多数策略上的包含率都远离参数值0.800。对于不同偏度的Bootstrap的PC方法（包括校正的和未校正的），总能找到一种策略较好地估计方差分量置信区间。但是，没有任何一种Bootstrap的PC方法能够同时较好地估计三个方差分量的置信区间。对于偏度分布数据，Bootstrap的PC方法也需要使用“分而治之”策略。

根据表1～表3中Bootstrap的BCa方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出Bootstrap的BCa方法对应的方差分量80%置信区间包含率图，如图3（a）～图3（c）所示。

在图3（a）～图3（c）中，Bpi表示BCa：boot-pi，Bpia表示BCa：boot-piadj，其余类似解释。对于图3（a）～图3（c）的结果解释可参考图2（a）～图2（c）的结果解释。在图3（a）中，对比校正的和未校正的Bootstrap的BCa方法，发现对于p的方差分量置信区间估计，校正的Bootstrap的BCa方法在boot-pi、boot-pir、boot-pr上优于未校正的Bootstrap的BCa方法。在图3（b）和图3（c）中，对于i和pi的方差分量置信区间估计，校正的Bootstrap的BCa方法在boot-ir、boot-i的估计上明显优于未校正的Bootstrap的BCa方法。从总体趋势看，校正的Bootstrap的BCa方法相对好些。

4.3 Bootstrap的PC和BCa方法“分而治之”策略分析

偏态分布数据方差分量置信区间估计，Bootstrap方法需要使用“分而治之”策略。对比校正的Bootstrap的PC方法和BCa方法，在三个方差分量置信区间估计上，并没有显著的差异。因此，这里同时采用校正的Bootstrap的PC和BCa方法的结果。对不同偏态分布数据校正的Bootstrap的PC和BCa方法三个方差分量置信区间包含率进行综合整理，所得结果如表4～表6所示。

参考表4～表6的结果，可以得到下列结论：对于p的方差分量置信区间估计，使用boot-piadj、boot-pradj、boot-piradj或boot-padj策略较好；对于i的方差分量置信区间估计，使用boot-iradj、boot-iadj、boot-piadj或boot-piradj策略较好；对于pi的方差分量置信区间估计，使用boot-iadj、boot-padj、boot-iradj、boot-pradj或boot-piradj策略较好。

5 结论

5.1 偏态分布数据的偏度对Traditional方法、Jackknife 方法和MCMC方法估计方差分量置信区间有显著的影响。

5.2 校正的Bootstrap的PC和BCa方法估计偏态分布数据方差分量置信区间，要优于未校正的Bootstrap的PC和BCa方法。

5.3 使用“分而治之”策略，Bootstrap的PC和BCa方法能够找到一种（或几种）策略较好地估计偏态分布数据的方差分量置信区间。

参考文献

焦璨，张敏强，黄庆均，张文怡，黎光明.（2008）.非正态分布测量数据对克伦巴赫信度α系数的影响.应用心理学，14（3），276-281.

黎光明，张敏强.（2009）.基于概化理论的方差分量变异量估计.心理学报，41（9），889-901.

漆书青，戴海崎，丁树良.（2002）.现代教育与心理测量学原理（pp.42-78）.北京：高等教育出版社.

杨志明，张雷.（2003）.测评的概化理论及其应用.北京：教育科学出版社.

Gao，X.H.，& Brennan，R.L.（2001）.Variability of estimated variance components and related statistics in a performance assessment.Applied Measurement in Education，14（2），191-203. Othman，A.R.（1995）. Examining task sampling variability in science performance assessments.Unpublished doctoral dissertation.University of California，Santa Barbara.

Shavelson，R.J.，& Webb，N.M.（1991）.Generalizability theory：A primer.Newbury Park，CA：Sage.

Estimating Confidence Interval of Variance Component for Skewed Distrubition Data in Generalizability Theory

Li Guangming

（Department of Psychology，School of Education，Guangzhou University，Guangzhou 510006）

Abstract：Because the application field of psychological and educational measurement makes a great change，some character such as knowledge and ability don’t obey this distribution whose skewness is zero again.Using the nature of Generalized Hyperbolic distribution，we simulated some skewed distribution data to explore that how the skewness of distribution data had an effect on estimating confidence interval of variance component for Generalizability Theory.The results showed as follows：（1）Skewmess of distribution data had a great effect on estimating confidence interval of variance component for traditional method，jackknife method and MCMC method.（2）As for estimating confidence interval of variance component for skewed distribution data in Generalizability Theory，adjusted bootstrap PC or BCa method was more reliable than unadjusted bootsrtrap PC or BCa method.（3）There was at least one bootstrap PC and BCa method that could make a good estimation of confidence interval of variance component for skewed distribution data.But the ‘divide-and-conquer’ strategy needed be used.

Key words：Generalizability Theory；Skewed distribution data；Variance component；Estimation of confidence interval

概化理论偏态分布数据方差分量置信区间估计

优秀范文