首页 > 范文大全 > 正文

基于回归分析理论的装备保障人员资源预测

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于回归分析理论的装备保障人员资源预测范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要: 文章从回归分析基本理论入手,建立了线性回归理论模型,论述了预测和控制的基本实现方法,并利用这一理论对装备保障人员部分数据进行了初步的分析和预测。

关键词: 一元线性回归 检验 预测

随着科技的不断发展,武器装备复杂性和高技术性不断提高,于是关于装备保障信息的海量数据出现了,装备保障人员是海量数据中的一部分,文章将对这一数据进行研究分析。

一、回归分析的基本理论

变量中最为简单的是线性相关关系,设x是可控变量,Y是依赖于x的随机变量,它们的关系是Y=α+βx+ε,其中,α、β是常数;ε是误差项,期望值为0的随机变量,即E(ε)=0,并且ε服从正态分布N(0,σ)。x与Y的这种关系称为一元线性回归(模型)。当x取回定值时,Y服从正态分布N(α+βx,σ)。上式两边取数学期望得:EY=α+βx,若记y=EY,则可改写为:y=α+βx,称之为Y对x的回归直线方程,其中β称为回归系数。

已知变量x,Y的n对试验值(x,y)(i=1,2,…,n),我们用最小二乘法求出α,β的估计值,作离差平方和Q=(y-y)=(y-α-βx),选择参数α、β,使Q达到最小,即:

Q=(y-α-βx)=min

为此,令Q分别对α、β的两个一阶偏导数等于零,即:

因为方程组解到的不是α,β的真值,而是它们的估计值,所以可把方程组中的α,β分别用估计值、代替,得到:

=或=,

以及=-=+x,称之为Y对x的经验回归直线方程,称为经验回归系数。

二、一元线性回归中的检验、预测理论

当随机变量Y与变量X之间的线性相关关系显著时,由试验数据(x,y)(i=1,2,…,n)得到的Y关于X的线性回归方程=+x大致反映了Y与X之间的变化规律,但由于它们之间的关系是非确定性的,对X于的任一值x,不可能确定Y的相应值y,由回归方程确定的=+x只是y的估计值,我们自然关心,若以作为y的估计值,其精确性及可靠性能否保证?因此,对于给定的X=x,需要预测对应的Y的观测值的取值范围,即必须对y进行区间估计,对于给定的置信概率1-α,求出y的置信区间,称为预测区间。由于y-与相互独立,由t分布定义可知:~t(n-2)。对于给定的置信水平1-α,确定t(n-2),使

p

因此,y的对应于置信概率1-a的预测区间为:

-t(n-2)

三、基于一元线性回归理论的数据分析

(一)数据分析背景

本文数据分析主要是对装备保障人员数据进行汇总并进行分析预测,即对各种资源应有数与现有数据存在差异进行分析。从理论上讲,每个单位各类信息的应有数与现有数应一致,才能恰好满足工作需求,但由于各种原因,出现了随机变量ε,这使得有关部门针对这种变化无法作出正确决策,因此,我们通过本次分析,建立二者之间关系的数学模型,根据数学模型对现有资源作了初步预测,并根据需要,利用合理的现有数对应有数进行控制。

(二)数据分析方法步骤

根据相关知识,明确了按照线性回归理论进行数据分析的基本步骤,基本步骤如下:

1.对要分析的数据对象进行收集整理,删除异常记录,抽样,确定数据分析样本。

2.计算样本数据的,,,,x,,s各值。

3.将各值代入公式:=,求出β值。

4.按α=-x式,求出值,确定回归方程=-x。

5.根据样本数据作散点图,并在图中画出回归方程直线。

6.根据回归方程计算任意x值时对应的值。

7.对于给定的置信概率,计算对y进行区间预测的下限和上限。

8.将数据进行分组(x,y)、(x,y),按2―4步分别求各组数据线性方程。

9.在同一图中作各组数据散点图,线性方程。

10.统计各数据散点的位置,对统计结果进行分析,形成分析结论。

(三)数据分析案例

本文采用的样本数据是装备保障人员中的80条应有数据、现有数据及对应专业数据,数据经过变换处理,并对80条数据作散点图,在散点图上作出回归方程,如图1所示。

图1 一元线性回归分析

分别计算应有数所对应上、下限根据计算结果,将数据分成三组,即(应有数,上限)、(应有数,估计值)、(应有数,下限),对三组数据再次进行回归分析,求出各直线方程,在同一坐标系中作出各直线,对分布各直线附近的各点进行统计,其中,高出或在上限线上的点共4个,对应的专业分别为A、B、C,D;低于下限的点共4个,对应的专业分别为E、F、G、H;其它各点均在上下限之间。

通过上面分析可以得出以下结论:

1.从总体上来讲,应有数与现有数基本能够满足需求。

2.技术人员现有人数根据所从事专业不同出现差别较大,从事A、B、C、D专业的技术人员现有数多于应有数,个别专业中现有人数低于应有人员。从事E、F、G、H专业的技术人员数量不足,不能满足需求,而且缺编人数较多。

3.从长远来看,应加大人才储备,现有人数应以预测上限数为储备标准。若应有数与现有数出现矛盾,不能满足需求时,可以从合理的应有数预测合理的现有人数,也可以用合理的现有人数来控制应有数的大体区间,从而使用二者能够满足实际需求。

四、结语

本文采用线性回归理论对保障人员的应有数、现有数进行分析,建立了二者之间的数学模型,以应有数为基础,依据数学模型对现有人数进行了分析,得出了科学的结论,为决策部门提供了科学的依据。这种数据分析方法,为其它同类数据分析奠定了数据基础。

参考文献:

[1]汪荣鑫.数理统计[M].西安:西安交通大学出版社,2006:174-222.

[2]Schilling M.Setting up a data gathering infrastructure[M].2007:1-19.

[3]Houtsma M,Set oriented data mining in relational databases[M].2000:1-20.

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文