首页 > 范文大全 > 正文

智能算法在图书管理系统中的应用研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇智能算法在图书管理系统中的应用研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘 要] 智能算法在管理大型数据库及挖掘其中有效知识方面具有良好的性能,因此,众多研究人员将该类算法引入到提升图书管理系统性能的研究中。本文将介绍几类基于关联分析技术和基于聚类分析技术的智能算法,并展望未来智能算法在图书管理系统中的应用前景。

[关键词] 智能算法 图书管理系统 关联分析 聚类分析

1.引言

随着图书馆馆藏资源的不断增加,图书馆资源管理的难度也不断加剧。从上世纪八十年代图书馆管理的自动化变革开始到如今大多数图书馆自动化管理系统的使用时间均已超过15年。在15年间产生的各类历史数据如资源搜索记录、读者借阅记录、图书采购记录等,已变成一笔宝贵的财富,然而,受到现有管理系统功能的限制,这些数据仅能作简单的存储及查询,其无法进行开发利用。在对图书管理系统的多年开发和研究中,人们发现各类智能算法的数据挖掘能力将能够大大提升图书管理系统的管理能力及对数据的利用深度。本文将概括介绍近年来提到的一些智能算法在图书管理系统中的应用实例,并展望智能算法在图书管理系统中的应用前景。

2.智能算法在图书管理系统中的应用

智能算法是指在各类复杂问题中,能够从大量复杂、模糊、随机的应用数据中找出数据产生规律,并对其进行自我启发式优化的计算机算法。通过智能算法从各类大型管理系统的数据库中挖掘出来的规律和知识可以用在查询响应、决策支持、信息管理等许多方面。通过研究人员多年的研究,该类算法在图书馆系统中的应用研究已取得一定成果,本部分将着重介绍几类经常被提到的算法利用方式及实验效果。

2.1 关联分析算法

关联规则挖掘技术由R.Agrawal于1993年提出,其强大的数据挖掘能力,在金融业、工业领域及图书管理系统等大型数据库中得到充分运用[1]。

关联规则分析技术算法的主要思想是首先寻找给定数据集中的频繁项集,然后通过频繁项集生产强关联规则[2]。在针对图书管理系统的应用研究中,其主要包含三个步骤:第一步:将相关读者数据经过预处理形成读者数据事务库;第二步,迭代识别事务数据库中所有支持度不低于用户设定阀值min_sup的频繁项集;第二步,在频繁项集中构造所有满足最小置信度阀值min_conf的关联规则,得到相应的读者行为规律。算法的复杂度主要受到项数、事务数、事务平均宽度等因素限制,因此在实际应用中存在以下缺陷:频繁扫描数据库、不适用于稠密集的关联规则挖掘、可能生成的关联规则过于庞大等。针对这些缺陷,近年来不少学者提出了改进策略,如基于逆向运算的优化策略、基于哈希表的优化策略、基于划分的优化策略等[3]。在关于将关联分析算法应用到图书管理系统的研究中,主要包括以下几类:

(1)2009年鲍静提出了一类基于数据预处理技术和经典关联分析方法Apriori算法的读者借阅挖掘工具,并利用该工具对安徽省图书馆图书流通数据进行关联挖掘,仿真实验结果表明,通过引入兴趣度对挖掘出的关联规则进行分析,证明该读者借阅挖掘工具可以实现对读者兴趣度的分析,从而帮助图书馆馆员为读者提供个性化服务[4];

(2)2010年陈康提出利用改进的Eclat算法设计图书推荐系统,该改进算法源自Zaki提出的一种比较典型的深度优先搜索和交叉计数的频繁模式挖掘算法。改进算法充分利用了垂直数据表示和交叉技术的高效优势,直接在垂直数据表示的数据集上通过广度优先搜索和交叉计数产生频繁项集。仿真实验结果表明该算法可以在大数据量的情况下实现关联规则的高效挖掘,产生的知识库在图书推荐系统中取得了良好的应用效果[5];

(3)2011年林郎蝶、王灿辉提出了一类基于划分优化策略的改进Apriori算法――L-Apriori算法,该算法利用《中国图书馆分类法》将图书按分类号信息进行分类形成子图书馆,算法首先在各子图书馆中进行关联规则的挖掘,再将所挖掘到的关联规则进行整合,从而得到最终的挖掘结果[3]。该算法的优势在于通过划分优化后,L-Apriori算法的空间复杂度仅为Apriori算法的1/n,其中n为子图书馆的个数。

2.2 聚类分析算法

聚类分析(Cluster Analysis)是数据挖掘技术中的一种典型方法,该类算法可在要划分的类未知的情况下,将数据对象分组成不同的类。聚类的基本方法在建立基于分析对象的数据矩阵或相异度矩阵中,通过计算对象之间的距离来衡量对象之间的相似性或相异性,从而对数据对象进行分类。由于该技术仿真了一个无监督的学习过程,因此被广泛应用于各类大型数据库中。现有的聚类技术种类很多,主要有层次方法、划分方法、基于密度的方法、基于网格的方法、基于模型的方法等[2]。目前,在针对图书管理系统的研发中,研究人员尝试将多种基于聚类分析技术的算法使用在图书管理系统中,并在仿真实验中取得了一些成果。下面内容将具体介绍几类算法。

(1)2010年武建伟、俞晓红、陈文清等人提出了利用基于密度的动态协同过滤算法改进现有的图书推荐系统[6]。与传统的静态协同过滤算法不同,动态协同过滤算法首先利用模糊隶属函数根据读者借阅图书的时间长度筛选出读者对借阅图书的兴趣度,并利用基于密度的DB-SCAN算法在按中图法划分的区域中进行聚类操作,从而建立用户的兴趣模型。在数据的增长和变化中,用户的兴趣聚类区域密度及权重将发生变化,从而实现动态的协同过滤推荐[6]。在仿真实验中,作者以洛阳理工学院图书管理系统读者借阅数据为实验对象进行仿真计算。结果表明,改进后的动态算法在邻居数从5增加到26时,其平均绝对偏差值均小于静态算法0.05,说明基于密度动态的协同过滤推荐算法在预测读者兴趣度方面精度更高[6]。

(2)2011年杨雪霞提出利用遗传算法(Genetic Algorithm,GA)为模糊K-prototypes寻找初始聚类中心的GA-FKP算法,并取得了良好的仿真实验效果[7]。模糊K-prototypes(Fuzzy K-prototypes,FKP)算法可以针对由多类型数据构成且分类模糊的数据集合进行分类,然而FKP算法存在易陷入局部最优解和初始化敏感的缺点,为解决这个问题,杨雪霞提出了利用遗传算法帮助FKP算法进行选取初始参数,然后通过KFP算法对个体进行优化从而得到最终结果。在GA-FKP算法的数据结构中对遗传算法在知识表示方面的缺陷做了很好的处理:使用聚类中心来表示组成问题的结果,即一个聚类中心向量表示一个基因,而所有聚类中心则组成了遗传算法中的个体,如公式2-1所示。个体Y中的每个基因表示如公式2-2所示。

公式2-1

公式2-2

其中,表示个体结构,为i位置基因,N为样本数,K为目标聚类数[7]。利用该类编码方式,解决了遗传算法与KFP算法间的接口问题,使得两类算法可以相互融合,从而形成适合处理读者细分问题的GA-FKP算法。在仿真实验中,作者选用了河南师范大学图书馆2006年到2010年的读者数据集进行细分,通过细分结果可以帮助馆员了解不同类型读者对图书的利用状况,从而为读者提供更好的个性化服务。

(3)2011年茹蓓、赵芳提出了利用K-means算法分析读者借阅行为,为图书馆管理提供有用信息。K-means算法是去类算法中的经典算法之一,该算法首先接收输入量k,并把n个数据对象划分为k个聚类,然后基于对象之间的距离来计算相异度[8]。算法的主要流程包含四个步骤:第一步,随机选择k个对象,以每个对象为中心来代表数据集将被分成的k个类;第二步,根据“距离中心最近”的原则,寻找与对象相似的类并将其划分到相应的类中;第三步,完成对象分配后,计算每一个类中所有对象的平均值,作为新的中心;第四步,根据“距离中心最近”的原则,重新划分所有对象。反复执行第三步和第四步,直到所有产生的类没有变化为止。利用该算法,可以将分散的读者借阅数据进行有效划分,找出读者借阅行为中的规律,从而帮助图书馆管理人员制定相应的服务方案及馆藏发展计划。

3.前景展望

随着图书管理系统研究的不断深入,及读者对服务质量要求的不断提升。图书馆的作用早已不仅仅只是借阅图书。为各类读者提供个性化服务,为学校提供教学、科研和发展规划的有效信息资源已成为当前图书馆员的工作目标。然而,要从海量的系统数据中,挖掘出并准确把握住不同读者的需求,找出最有效的资源是当前图书馆界的难题。智能算法的出现,为解决这一难题提供了很好的解决方案,因此,众多研究人员进入到这一领域进行了积极尝试并获得了良好的实验效果。随着研究的不断深入,相信这些算法将不断成熟,并最终应用到实际的图书管理系统中。

参考文献:

[1]赵霞彤.数据挖掘技术在图书管理系统中的应用[D].南京:南京邮电大学,2009.

[2]朱福喜,杜有福,夏定纯.人工智能引论[M].武汉大学出版社,2006.283-305.

[3]林郎蝶,王灿辉.Apriori算法在图书推荐服务中的应用与研究[J].计算机技术与发展,2011,5(21):22-28.

[4]鲍 静.关联规则挖掘及其在图书流通数据中的应用研究[D].合肥:合肥工业大学,2007.

[5]陈康.基于Eclat算法的图书推荐系统仿真[J].计算机仿真,2010,9(27):311-314.

[6]武建伟,俞晓红,陈文清.基于密度的动态协同过滤图书推荐算法[J].计算机应用研究,2010,27(8):3013-3015.

[7]杨雪霞.基于聚类的图书馆读者细分算法研究与应用[J].福建电脑,2011,6:9-10.

[8]茹 蓓,赵 芳.聚类算法在图书馆中的应用[J].新乡学院学报:自然科学版,2011,1(28):41-43.

作者简介:

朱 婵(1984-),女,四川省绵竹市人,硕士研究生,助教,发表学术论文5篇,研究方向:数字图书馆。