首页 > 范文大全 > 正文

基于小数据的高校图书馆个性化推荐

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于小数据的高校图书馆个性化推荐范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:相对其他图书馆,高校图书馆的读者群相对固定,读者群需求更具针对性,而且高校图书馆能够获得大量与读者相关性较大的小数据,高校图书馆可以在大数据发现的规律基础上,利用小数据对读者行为分析,完成对读者的个性化推荐。

关键字:小数据;个性推荐;高校图书馆

课题项目:本文系黑龙江省高校图工委第四届科研课题项目“数字图书馆用户个性化推荐算法研究与应用”(项目编号2015-B-065)研究成果之一。

当前是大数据时代,各行各业都在进行技术改造和升级,共享数据数字化治理的价值[1]。但是大数据情报分析需要强大的实力,大数据分析中的数据采集、预处理、分析挖掘等过程不但需要高水平的研究人员,还需要例如Hadoop、HPCC等高端的数据存储设备和先进的技术。对于图书馆尤其是普通高校图书馆而言,在研究和挖掘大数据时必然要面对一些人力、物力等方面的困难。另一方,高校图书馆的服务群体主要是学生和老师,相对固定且读者群数量较小,读者群有相对固定的模式和需求,对于“小数据”的分析对高校图书馆就比较重要,而且基于数据分析也更快速、准确,对于人力、物力要求较小,也具有很强的可操作性。

那么什么是小数据?其概念最早是由美国康奈尔大学的教授D.Estrin提出的,Estrin教授对他父亲去世前几个月的日常生活行为观察分析,注意到他的父亲在那段时间的日常行为与平时有一些不同,例如:老人基本不去市场买菜、也不再与其他人发送电子邮件,日常散步的范围越来越小等等。然而,到医院做常规检查时,这些数据是无论通过何种医学仪器都检测不出来的,但这些数据确实揭示了老人在去世前几个月身体逐渐衰退的事实和过程,这些日常行为异常的小数据可以当做医学证明,也促使Estrin教授意识到小数据的重要意义,并在2013年神经信息处理系统国际会议上发表了小数据相关的报告。

1 高校图书馆读者的小数据

小数据是指以个人为中心的全方位数据,包括数据被采集对象实时的生活习惯、身体状况、社交、财务、喜好、情绪、行为等数据[2]。对高校图书馆而言,相对其他行业和公共图书馆,小数据的采集范围更广泛,可以包括读者在使用图书馆过程中产生的直接数据、由其推测的数据和其它部门提供的相关数据。

其中最能够直接获取的是读者直接登记的信息,如新生办理借书证、注册移动图书馆等,能够获得读者的姓名、专业、年龄等基本信息;读者在图书馆信息管理系统中留下的信息,例如通过挖掘借阅历史、查询历史、图书馆荐购信息等分析读者以前的关注c、当前的兴趣点等;读者使用图书馆各种设备、终端的信息和反馈,如读者进出图书馆及各阅览室刷卡信息、使用图书馆终端浏览、查询文献记录;其他部门也可以提供读者相关数据以供分析,如:专业考试信息、学校公共课开设情况、学生选课信息、技能考试报考情况等等,有许多其他公共图书馆不能得到的读者相关的小数据,不仅包括读者留下的显性的信息,也包括需要挖掘分析的隐形痕迹;通过社交媒体分析读者心理活动、兴趣点变化,如opac的“我的图书馆”中收藏的图书、公众号中的反馈、微博评价转发等。高校图书馆可以利用行业大数据或已有的研究结论发现的事物之间的普遍规律,然后用小数据挖掘跟踪个体,在个体不同时间、地点匹配大数据分析结果,完成读者个性化推荐服务。

以一名大学本科学生为例,进入大学校园前两年时间的大部分是公共基础课或专业基础课,例如:高等数学、外语、专业相关基础课等,还有其选择的选修课,通常还要报考大学英语四六级考试;大三大四则开始学习专业课程,可能还有报考相关专业的专业证书考试;大四毕业设计课题选择前对本专业研究热点问题的关注,选择课题后知识的积累,都需要阅读大量的专业期刊、书籍等,加之平时浏览、查询的流通历史记录;给图书馆公众号的反馈意见、图书馆主页中的留言等等都是高校图书馆可以采集获取的读者小数据,而且获得手段相对容易,在数据收集、传递过程中不涉及外界数据,仅在高校内部即可采集到所需读者的小数据,减少数据在采集传递过程中外泄的可能性,更加有效地保护了读者的个人信息安全。

2 小数据的分析

读者小数据的分析能推算出用户的各种兴趣需求和接受图书馆服务时的舒适度,把各种资源、服务及推送方式与相应的用户相互匹配,形成高质量的个性化服务[4]。

对于在图书馆历史数据较少的读者,可以采取静态数据推荐算法,根据其注册基本信息和社交媒体好友等信息,为读者推送如所在专业读者最感兴趣的图书、他的好友阅读最多的文章等,这类服务是粗粒度的,个性化较低。通过采集读者小数据发现数据量积累到一定程度后,可以采用基于内容的推荐算法,主要是根据读者的历史数据推断其个人喜好,推荐相似的内容,并跟踪读者的兴趣。还可以根据社交媒体等将读者之间联系起来,例如喜欢阅读类似书籍的读者可能有相同或相似的偏好。这类推荐算法要先找到读者所属的兴趣相似的读者群,即读者的“最近邻居”[5],把“最近邻居”最感兴趣、最关注的,而读者本身不知道的信息推送给读者。

读者的兴趣受多方面因素影响,仅仅从数据库、计算机中采集读者小数据并不能完全展示出读者的兴趣,结合社交情境推演的数据才更全面;同时单独一种推荐算法也不能准确的预测、判断出读者真正、实时的需求,在完善数据采集技术、手段和范围的同时,采取多种推荐算法混合的方式也能够完善图书馆的个性化服务。

3 根据小数据精准推荐

根据马特莱法则即二八法则,图书馆80%的读者只为图书馆提供了20%的服务收益,这80%的读者为普通读者;而其他20%的读者却为图书馆贡献了80%的服务收益,这20%的读者即为图书馆的关键读者、VIP读者。针对高效率读者采取高精度、高准确度的服务更能提高图书馆的个性化推荐,采取如:个性推荐、服务定制、优先选书等“VIP”化服务。高校图书馆按照借阅排行、进馆次数等数据可以选出关键读者,跟踪关键读者的小数据可以了解单个读者的阅读活动、阅读心理变化、阅读社会关系、阅读需求和阅读模式等,进行最真实、生动和动态的描绘与本质因果关系的揭示[3]。

根据跟踪的小数据对20%的关键读者进行精准推荐活动,例如,读者个体在微信端、移动图书馆、opac或其他终端设备上的阅读、浏览或检索的内容、时间都具有自己的特征,图书馆可以通过对读者借阅历史数据、目前读者个体的阅读所需、读者个体所处方位等相关小数据进行分析,明确馆藏新书适宜推荐的读者群、馆内读书文化等活动积极参与的读者群、微信推送的高接受读者群及服务推送的内容模式等,在不干扰读者正常工作、学习的前提下,在合适的时间采取读者习惯、喜欢的方式对读者进行个性化推荐,完成图书馆服务推送,保证读者有较高的兴趣度和满意度,使得图书馆获取良好的服务收益。

4 结语

随着信息技术的快速发展、图书馆资源数量的急剧增加和人们生活节奏的加快,如何快速、准确、有效地发现读者的需求,已经是图书馆发展所要面临的重要问题。对于高校图书馆而言,服务群体是相对固定的,相对大数据分析所需的高要求,小数据分析更加适用于高校图书馆,更具有针对性,效率更高。高校图书馆在日常工作中应该注意采集小数据,也要培养馆员利用小数据分析读者需求、发现读者兴趣的能力,利用小数据分析挖掘读者隐性需求,有利于提高馆员的数据服务素养,优化升级图书馆的个性化推荐,推动图书馆优质服务的发展。

参考文献

[1]张卫东.小数据架构下的数字化治理路径研究[J].高校图书馆工作,2016(36),176.

[2]陈沉.基于小数据决策支持的图书馆个性化服务[J].图书与情报,2015,01.

[3]陈沉.图书馆小数据读者个性化兴趣预测与发现模型的构建[J].图书馆论坛.2016,12.

[4]陈廉芳.大数据环境下图书馆用户小数据的采集、分析与应用[J].技术应用.2016,3.

[5]李新广.数字图书馆的用户偏好模型及个性化推荐研究[D].武汉大学.2011.

作者简介

钱浩,哈尔滨商业大学图书馆,馆员。