首页 > 范文大全 > 正文

林业统计分析系统的研建

开篇:润墨网以专业的文秘视角,为您筛选了一篇林业统计分析系统的研建范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要 现代社会人们对数据和信息的需求量越来越大,特别是随着信息化建设的不断深入发展,积累了丰富的资源数据和信息,如何对它们进行大规模、高效率、全方位、深层次的有效挖掘和科学分析,从而为政府部门宏观调控提供有力的决策支持,避免造成资源浪费,是亟待我们探讨和解决的问题。本文利用先进的数据挖掘和决策分析技术,在林业信息化建设领域提出了统计分析系统的解决方案。

关键词 数据挖掘;统计分析;研建

中图分类号S7 文献标识码A 文章编号 1674-6708(2011)49-0058-02

1 背景

数据是某一客观事物数量特征的记录。近年来,随着管理技术和手段的进步以及计算机在行业管理中的广泛应用,产生了大量、分散的数据。面对分散而的烦杂数据资源,如何有效地管理和重组数据,提炼出有价值的统计综合数据信息,为生产经营活动的改进、服务、管理水平的提升提供必要的支撑,是信息化建设中的一项重要任务,也是亟待解决的问题。

林业应用软件的相继投入使用,在业务管理工作中发挥着举足轻重的作用,虽然目前已经实现了各系统间的资源共享,但还不能完成对数据的整合、汇总、统计分析,不能为领导的快速决策提供第一手资料,使得林业各主管部门无法全面、高效率的进行数据采集和决策分析。建设以数据中心为基础的统计分析系统,正是为了突破这一瓶颈,实现对现有业务系统信息进行全面整合,对信息资源进行快速采集、深度挖掘、有效管理、科学分析,对森林资源动态变化的及时掌握,对森林资源发展趋势科学预测,直观地为各级领导及业务人员提供决策依据。这不仅是林业科学发展的需要,是林业更好更快发展的有力保障,更是与时俱进的时代要求。

2 必要性

1)统计业务数据量日益庞大。鉴于统计系统传统的层层上报、分级处理的模式,庞大的数据处理量(采集、录入、审核)导致了基层统计人员的严重负担;

2)数据管理和质量控制越来越困难。传统的统计应用软件,只注重处理流程,而忽略了数据的管理和质量控制。基层和上级之间只有传统的数据上报和接受的关系,缺乏沟通和管理;

3)统计资料时效性要求越来越高。以往的统计数据处理软件只是统计业务人员使用,综合部门和有关领导如果想提取加工有用信息,只能通过专门的业务人员去做整理工作来完成,这将大大降低资料利用的时效性,即:有关人员无法及时地从采集到的数据中获取有用信息。因为软件的局限性而影响数据的时效性和方便性,是一种很大的损失,需从本质改进;

4)统计数据难以共享。传统做法一般是先整理,后共享,并且与数据处理过程是脱节的。真正的共享是统计业务处理全过程的共享,共享的数据和自身的业务处理应紧密结合在同一软件系统中;

5)硬件资源未得到充分利用。软环境建设相对迟缓,与硬件建设不匹配,如何充分利用网络、服务器、小型机资源,是刻不容缓的需要解决的问题,否则将是一种极大的浪费;

6)各种统计模式并存。传统的层层上报、分级处理的模式;条块结合的处理模式;直报模式(如专项调查和抽样调查);在地统计模式等等;

7)没有统一的软件平台。没有统一的网上采集平台,甚至没有统一的单机应用通用数据处理软件,从而形成软件多乱差的局面,基层统计人员压力越来越大;

8)缺少普通统计人员可用的简单实用查询、分析工具,难以提高统计分析质量;

9)未能形成统计数据标准。没有制定相应的标准,造成统计软件的盲目性,相互接口的不统一性,进而影响数据共享和数据库建设;

10)无法充分发挥自身优势,提高行业影响力。林业主管部门理应掌握最权威、最全面的森林数据资源,如何利用这些资源为政府、为社会服务,是值得着重研究的问题。加大信息化建设的投入力度,充分挖掘数据资源,是短期内提高数据统计服务质量、提升数据可参考价值的最佳捷径。

综上所述,实施全省统一的林业数据统计分析系统是必要的、也是当前形势所急需的。

3 系统建设

3.1系统目标

1)对林业统计系统内部的目标:全面实现统计数据处理与管理的计算机网络化,支持网络环境下统计信息的采集、审核、编辑、传输、存储、统计、数据挖掘、分析等统计信息流动整个过程中各环节的一体化作业,从而大大提高林业统计信息资源的综合开发能力;

2)对系统上部层面的目标:为领导宏观调控和科学决策,提供准确、及时、全面、方便地各类统计信息和统计分析报告,提高统计对宏观经济决策的快速支持能力;

3)对系统外部的目标:全面实现林业统计信息的社会化,为全社会公众及时反映林情、林业经济、林区社会发展变化、林业科技进步的各类综合性统计信息和公益性信息,提供各种统计信息咨询服务。

3.2主要功能

3.2.1统计汇总功能

1)数据汇总分析功能

数据汇总分析功能,基于数据仓库的数据,按照多种条件进行统计汇总,主要表现在:实现了同一领域相同结构数据的自动汇总功能;实现了不同数据表间的关联、析取功能;实现了多表组合、条件组合;数据汇总分析同时支持以地理信息和经济信息为基础,综合两种类型信息的基础上提供了一些统计功能,实现按区域的汇总分析。

2)数据挖掘分析功能

系统提供了数据挖掘技术,提供了不同维度上的数据横向对比分析、纵向对比分析、结构分析、趋势分析、关联分析等多种分析方法。切片: 某一维度展开进行分析;旋转:对数据表的行列转置,便于统计与浏览;上钻:指标的向上综合钻取;下钻:通过总表调用明细报表,或者结合地图,实现省、市、县区的逐步钻取。

3)区域聚类功能

区域聚类是基于地图的统计分析,实现按区域的统计汇总功能。基于地图实现区域聚类功能,并结合图形或数据表加以分析、排序,而区域聚类可以将满足条件的记录在地图上用颜色深浅表示和区分所选区域对应指标值的大小,从而分类出发达和落后的行政区域类别,即所谓的区域聚类。

4)自定义统计功能

随意统计功能,是对数据仓库的数据实现按数据库表中任何一条件进行查询,实质上也是综合查询,结果可以结合多种图形或者地图进行展现。

3.2.2统计报表功能

1)“自助式”报表的呈现与分析

用户通过指定业务指标和信息项所提交的是随机的、动态的查询,也叫即席查询。即席查询的项目及输出的格式是无法预知的,需经后台数据库处理后返回查询结果,并在此基础上制作报表。用户生成的即席查询依赖于事先构造的数据模型。数据模型从业务处理系统中抽取出来,针对操作数据中对业务分析有意义的那部分信息数据。在数据模型的构建中,需要根据不同的业务主题,进行数据库表之间的连接、数据项之间的一系列计算、特定条件的过滤等。数据模型的构造对用户来说是透明的,呈现的是用户所熟悉的业务指标和信息项。

以上直接由查询结果生成的报表是呈现型报表。相对于呈现型报表,分析型报表满足更高一级的需求,它在查询结果的基础上进行分析。业务人员可以通过预先在数据模型中定义的钻取(Drilled-down)路径来分析数据。同时,数据既可以被钻取到最精细的层次以揭示潜在的趋势,也可以返回到较高的层次以恢复宏观的景象,使报表真正能够为高层决策提供支持。“自助式”报表的处理流程如图所示:

2)固定报表

固定报表是部门领导及管理部门进行分析和决策的重要工具,它基于预先定义好的查询,输出的格式及项目相对固定,只有某些过滤条件是变化的。固定报表使用的参数驱动界面来显示关键的业务指标,并可以被激活为各种图表,如饼图、直方图、对比直方图等,以便做更深入的业务分析。

建立面向不同主题的数据模型是用户自己提交查询的基础。数据模型根据不同的主题,将各个参数与事实表进行连接,并根据业务的需求添加计算项。计算项由各个数据项之间的运算生成,可以被业务人员直接利用并加入报表,它根据需求将一些必要的限制条件加入数据模型。对于业务人员而言,复杂的表连接、计算项的生成及各种限制都隐含在数据模型中,呈现在面前的只是面向各个主题的业务指标和其它信息项目。数据模型将被提交到共享库,业务人员能利用其来创建各自的查询和报表。

用户对查询结果可进行排序、合计、计数、按分组小计、百分比等操作。用户还可以在查询结果上创建旋转透视表,它是一个分析工具,相当于一个动态的数据立方体,用于即席的交互式多位数据分析。旋转透视表是维的各个层次的聚集值,在其中可以计算任意维的合计值、小计值,它可将表格转化为图形。旋转透视表有预定义和随意钻取功能。预定义钻取可以直接钻取到要分析的项;随意钻取可以通过所选择的类别逐步深入到维的底层,用来揭示一个综合请求项的组成部分。在设计时,将数据库的维表设置为维,钻取路径依据维表中的数据项顺序。

4结论

充分发挥统计功效是目的,实施统计信息化是根本,开发数据统计分析系统是手段,实现所有基层数据由层层上报向网上直报转变,克服数出多门和数据不真实的现象;建立全省统一的林业资源数据库,实现信息资源的充分共享,建立一整套高效运行的数据采集、查询、分析、预警和系统势在必行。

参考文献

[1]李希菲.多元统计分析方法在林业中应用及IBM―PC系列程序集编制的研究.林业科学研究,1990(3).

[2]冯益明,唐守正,李增元.空间统计分析在林业中的应用.林业科学,2004(3).

[3]张桂香.创新山西林业统计分析的基本思路.山西林业,2007(6).

[4]曹明,温如意.林业科研中适用的优秀统计分析软件.河北林业科技,2009(1).

[5]孙建军,雷相东,洪玲霞,王培珍.通用森林样地调查统计分析系统设计与开发.计算机技术与发展,2009,19(8).