首页 > 范文大全 > 正文

网络知识增长的对数透视研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇网络知识增长的对数透视研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]知识是社会竞争的关键性资源之一,互联网的便利性和开放性使网络成为人们获取信息、知识和情报的重要途径。为验证网络环境下信息量的爆炸式增长与其所含知识量之间的关系,在对对数透视原理介绍的基础上,就网络环境下网络信息与其所含的知识之间量的关系进行实证研究,分别分析网络信息增长与网络知识增长的模式,验证网络环境下信息增长与知识增长间的对数转换关系。

[关键词]信息增长 知识增长 对数透视 网络知识

[分类号]G350

知识管理和知识经济的发展使知识逐渐成为社会竞争的关键性资源之一。并受到人们前所未有的重视。知识已成为文献学、科学学、信息学、情报学、管理学和经济学等诸多学科的主要研究主题,其测量引起了众多研究人员的关注。知识具有表现形式的多样性、语义的复杂性和指导实践的高价值性等特征,对知识进行客观有效的评价以指导人类实践活动便具有重要意义,为此,人们于不同的领域进行了积极探索和研究。布鲁克斯曾用对数透视效应对传统文献与其所含知识间量的关系进行了描述。随着信息资源数字化进程的加快,网络信息急剧增长,“信息井喷”、“信息洪流”等已成为网络时代的专门术语,在这样的信息条件下,网络信息所含知识的变化规律及布鲁克斯对数透视原理的普适性还有待验证。

1 对数透视原理概述

对数透视原理源于韦伯一费希纳定律。19世纪中叶,德国著名心理物理学家韦伯和费希纳为严格测量人的感觉,提出公式:S=K・IogR,式中S表示主观感觉,R表示物理刺激。受该定律的启发,在研究情报学的定量测度时布鲁克斯将其进行了扩充,指出:如果我们的感觉机构按某种对数规则工作,那么我们所有的神经系统,包括脑神经系统都可能按某种对数方式工作,这就是布鲁克斯的对数透视原理。根据该原理可知,在量度认识范围或精神范围的问题时需根据对数透视法则进行转换。,这反映了人们的认知世界与物理世界存在某种函数对应而非简单的直接反应。

对数透视原理描述了人类获取和接受信息、知识和情报的认知过程遵循对数转换机制,同时用量化形式揭示了人们遵循最省力原则进行信息、知识、情报的获取和吸收这一现象,对情报学的研究具有非常重要的意义。国内学者马费成教授将对数透视原理作为情报学基本原理之一对其进行了系统深入的探讨,并用实例验证,该研究对我国情报学理论体系的构建具有建设性意义。此外,肖楠等就网络环境下的对数透视现象进行研究,论述了网络环境下对数透视原理的新的表现形式。对这一原理进行详尽的研究,不仅有助于推动我国情报学基础理论的发展,而且对情报学学科的发展具有重大意义。

互联网的迅速发展使信息和知识所处的环境发生改变,对这一经典理论提出了挑战,因而有必要验证布鲁克斯对数透视原理在网络新环境下是否仍具有科学性与普适性。本文拟通过实证分析对网络环境下知识增长的特性进行研究,并检验网络信息与其所含知识内容间的量的关系。

2 研究方法

2.1 研究对象

信息和知识已被广泛应用于日常生活、科学研究中,不同学科不同学者对两者的定义纷繁各异,人们对信息、知识的理解也因人而异。信息论创始人香农认为信息是“减少随机不确定性的东西”,即信息可以减少随机性的任何消息、信号等,可以帮助人们的决策或选择。这一定义较准确地描述了通常所说的情报学中信息一词的涵义。本文认为网络信息是在网络环境下经过整理的,能够表达一定意义的信号、数字、文字、符号等的,满足人们特定需求的东西。知识常被理解为一种经信息提炼推理后的主观性和抽象化的产物。我国学者吴慰慈教授认为:“信息的范畴远大于知识,知识是进人人们认识视野中的信息,是已被人们所感知与确认的信息,也有许多原始信息尚未被人们认识,不能被划人知识的领域。”基于此定义,本文认为网络知识是网络环境下可以被人们所认识和感知的、经过人脑思维映射并能指导人们行动和实践的那部分有价值的信息。

网络环境中信息形式多种多样,纷繁复杂,量度网络信息增长与网络知识增长的变化及两者间量的关系需测量各语种、各类型、各学科的信息和知识,用到的数据量相当大。为了研究的可行性,基于网络信息增长与其所含知识的增长满足对数转换机制的假设,本文选取竞争情报领域的网络信息和网络知识作为研究对象,对网络环境中竞争情报信息的增长及其所含知识的增加量进行研究,以揭示两者间的量的关系。

2.2 数据搜集

2.2.1 数据搜集工具 网络技术的迅猛发展带来了社会信息量的与日俱增,搜索引擎作为信息入口和信息获取的平台,已成为人们查询、搜集信息及充分体验互联网虚拟世界价值所必需的工具之一。CNNIC2009年9月的中国搜索引擎用户行为研究报告显示:Coogle的客户群在所有搜索引擎中占有较大比例。而且Google检索功能完善,数据库规模庞大,具有精确的时间检索和去重功能,因此将其作为数据搜集工具来采集本研究所需数据。

2.2.2 检索策略 在Google中设置以下检索条件:①检索查询式:“搜索结果包含完整字句:竞争情报”;②搜索网页语言:简体中文;③时间域:以月份为时间单位,分别设定时间范围检索1995年9月至2010年4月的数据(1995年9月之前的数据为零,所以从1995年9月开始统计。2010年5月的数据不全,省略);④查询字词位于网页的标题。网络世界里,网页标题通常是对网页内容提纲挈领式的归纳,把查询内容范围限定在网页标题中,可以获得良好效果。其他保持默认设置。

2.2.3 数据处理方法 首先按上述策略进行检索;然后将搜集的数据存储到Excel中,基于布鲁克斯对数透视法则也将各月份检索结果数量的对数列于表中,并将其整理成符合SPSS需求的数据格式,由于对数函数的定义域是大于零的实数,所以本次研究排除了结果数量为O的月份,整理后的部分数据见表1(注:在透视法的世界里,只存在某种比例,因此对数底可以任意选择,为方便运算,本研究中对数底取10);最后用SPSS13.0对整理好的数据进行统计分析。

3 网络知识增长模型研究

网络技术的进步和网络环境的开放性极大地方便了信息、知识的传播、获取和利用,在促使信息爆炸性增长的同时,对知识的积累也起到了非常大的促进作用,为从整体上把握有关竞争情报的网络信息所含知识量的变化规律及其与网络信息量增长的关系,首先对该领域网络信息量的变化规律进行分析。

3.1 网络信息量增长模型拟合

在文献增长模型研究中,一般都以文献累积数为依据,尤其在研究某一特定学科领域或知识领域的文献在一定时间范围内的增长模型时更应如此。所以本文在研究竞争情报领域的网络信息增长时以其每月网络信息增加量为研究依据,认为按照2.2中检索

策略检索到的有关竞争情报主题的结果数量代表该主题的网络信息量,其增长曲线如图1所示:

调用SPSS的回归分析过程,以检索结果数为因变量,序号为自变量(为适用于所有曲线估计模型,将检索到的结果按时间先后排序),然后用SPSS自带的模型进行曲线拟合。根据曲线拟合检验结果报告直接排除F值较小的模型,剩余四个模型的F值相等,均为571.53,p值均小于0.01,具有统计学意义。四个模型的回归曲线重叠在一起(见图1),在观测期内一致,拟合效果较好。这四种模型拟合结果中各参数均在α=0.01的显著水平上通过了t检验,在观测期内这四种模型拟合网络信息检索结果数量增长曲线相同。

根据模型拟合简单化原则,即在模型拟合效果相同时选用表达式最简单的模型进行拟合,所以对竞争情报领域网络信息数量增长曲线拟合可按指数曲线模型进行拟合,将曲线拟合检验结果报告中的参数估计值代入指数曲线模型,得到指数曲线方程如下:

F(t)=0.865e0.067t,1∈[1,121] (1)

其中F(t)为网络信息增加量,t为年份。

信息技术的飞速发展使网络环境中的信息具有数量庞大、易复制性等特点,因而网络信息存在大量的重复、冗余,检索出的信息并不完全代表特定时间内的新增信息,由于Google可将检索结果去重而把最相关的结果展现出来,因此,本文将特定时间域内检索出来的信息进行去重处理后再次进行曲线拟合,去重后的信息增长曲线如图2所示:

同样地,复合曲线模型、等比曲线模型,指数模型和Logistic曲线模型拥有最大的F值均为65058,H.p值为0,具有统计学意义。这四个模型的回归曲线重叠在一起,在观测期内一致,拟合效果较好。根据模型拟合简单化原则,仍用指数曲线进行曲线模型拟合,将检验结果报告中的参数值代入指数曲线模型,网络新信息增长指数线方程为:

F(t)=1.38e0.039t,t∈[1,121] (2)

其中F(t)为去重后网络信息增加量,t为年份、

3.2 网络信息量增长规律分析

通过观察图1可知,关于竞争情报的网络信息在2009年之前的变化比较平稳,增长缓慢,但2009年之后网络信息的增长变得相当快,波动也比较大,虽然增长趋势大体按指数模式迅速增长但曲线拟合的效果并不理想,这与网络信息的易复制性以及网络信息的数量变化规律复杂有着很大的关系。通过对数据的提炼去重后再次拟合,发现拟合效果变化非常明显,模型拟合精度得到很大的提高(见图2)。这也说叫网络信息的易复制性是影响网络信息增长的一个重要影响因素。综合图1和图2,网络信息大体还是按照指数增长的模式迅速地增长,这在一定程度上证实了网络环境下普赖斯“指数增长规律”在研究网络信息增长方面的适用性。但同时也应看到,由于受样本观测量和样本采集控制条件的影响,指数增长曲线模型拟合的比较粗糙,在一定程度上影响曲线拟合模型的准确度。

3.3 网络知识增长模型拟合

布鲁克斯的对数透视原理认为,代表网络信息的检索结果数经对数转换以后应该可以表示网络信息所包含的网络知识内容。随着信息技术和网络技术的进步,信息的生产更加便利,形式也更具多样性,在这样的条件下,与信息相关的知识生产也随之发生变化,对数透视原理的适用性有待检验。因此,在网络环境下,假设网络信息与其经过对数转换以后所表示的知识间的关系仍符合布鲁克斯所描述的传统文献与其所含的知识内容间的量的关系。基于该假设,按照3.1中的曲线回归分析方法对网络信息的对数进行曲线模型拟合,得到如图3所示的网络信息量对数的变化曲线:

首先用散点图对网络信息增加量的对数进行分析,通过观察样本观测量的分和,然后调用SPSS的曲线回归分析过程,以网络信息增加量的对数,即网络知识内容为因变量,序号为自变量,用直线方程模型、列数曲线模型、倒数曲线模型、二次方程模型以及三次方程模型进行曲线拟合。根据曲线拟合报告显示直线方程模型的F值最大为571.53,且p值小于0.01,具有统计学意义。因此,网络知识增长可用直线方程模型进行拟合,将曲线拟合检验报告中的参数估计值代人,得到的回归方程(增长曲线见图4)为:

F(t)=lg(RN)=0.029t-0.063,t∈[1,121] (3)

其中F(t)为网络信息量经对数法则转换之后所代表的网络知识内容,t为年份。

依照3.1中对去重后的网络信息量增长曲线的模拟,现在对去重后的网络知识进行曲线模拟,根据曲线拟合报告显示,仍然是直线方程模型的F值最大为650.58,p值小于0.01具有统计学意义,同样将曲线拟合结果报告中的参数值代入直线方程模型,得到网络环境中新增知识变化曲线,如图5所示:

回归方程如下:

F(t)=lg(UN)=0.017t+0.14,t∈[1,12I] (4)

其中FF(t)为去重后的网络信息量经对数法则转换之后所代表的网络知识内容,t为年份。

3.4 网络知识增长规律分析

观察图4可知网络信息增加量的对数的变化大体上沿直线上升,呈线性增长态势,所以在透视法的世界里网络知识内容的增长是呈线性增长的,与网络信息增加速度相比网络信息增加量的对数变化速度慢许多。但由于网络信息存在大量的简单复制现象,因此在直线附近出现不同程度的较大波动,拟合曲线相对粗糙。通过对网络信息去重处理后再对其对数进行曲线拟合,司以看到随着时间的变化,样本观测值愈加靠近直线(见图5),即拟合效果越来越好,这也可以从曲线拟合报告中的方程确定系数R square值的比较看出。

综合以上分析,如果以检索结果的变化量代表网络中信息的变化量,那么网络环境下的信息仍然是指数增长的,而应用对数透视原理来对呈指数增长的信息量进行分析,可以认为网络中知识的增长和积累符合线性增长趋势。就分析的竞争情报主题而言,从20世纪90年展到现在,随着竞争情报活动的导向转向战略与战术的结合,竞争情报受到了高层管理人员的适度关注,与决策过程的联系也更紧密,竞争情报相关知识的增长也是相对稳定的。因此,布鲁克斯的对数透视原理在网络环境下知识增长方面的应用仍具有科学性与可行性。

4 结语

知识增长是一个极为复杂的从量变到质变的过程,与人的认识密切相关,本文基于布鲁克斯的对数透视原理,对网络环境下的知识增长进行研究,认为:即使网络信息量呈指数增长,知识仍然是线性增长和积累的,验证了布氏对数透视原理在网络新环境下仍具有一定的适用性。但由于人们所拥有的知识积累及主观思想的差异,网络信息增加量的对数能在多大程度上量度它所包含的知识内容的增长还有待进一步研究,这也是本文今后努力的方向。