首页 > 范文大全 > 正文

独立学院招生Web系统与数据挖掘的结合与应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇独立学院招生Web系统与数据挖掘的结合与应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:本文把Web报名系统与数据挖掘相结合,建立独立学院招生决策模型。首先,建立一个适用于数据挖掘的招生web报名系统,用它来采集更直接、更客观的考生数据;其次,用关联规则对考生数据进行挖掘,发现数据中的潜在的规则,作为我们进行招生宣传的决策依据。

Abstract: This paper combines web registration system with data mining to establish an independent college admissions decision-making model. First, a web registration system is established, which can be used to collect more direct and more objective examinee data; Secondly, we use association rule to perform data mining, some potential rules can be obtained, which can provide a new basis for enrollment propaganda.

关键词:web;数据挖掘;关联规则;招生

Key words: web;data mining;association rule;enrollment

中图分类号:TP31 文献标识码:A文章编号:1006-4311(2011)18-0154-02

0引言

伴随独立学院招生工作信息化的发展,独立学院建立了自己的招生Web系统,用于招考信息和采集数据。生源是独立学院的生存之本,在生源竞争越来越激烈的情况下,如何利用已有信息资源为招生决策服务,是我们面临的紧迫的课题。数据挖掘出现于20世纪80年代后期,它通过仔细分析大量数据来提取信息和模式[1],是一门交叉性学科,融合了人工智能、神经网络、数据库技术、模式识别、机器学习和统计学等多个领域的理论和技术,已经成功的应用于我们生活中的很多领域,如银行、电信、零售业、医学、生物学[2]等。R. Agrawal等人于1993 年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,并提出最为著名的Apriori算法,目前关联规则已经应用于社会生活的各个行业[3-4]。本文建立了一个适用于关联规则挖掘的招生Web报名系统,用它来采集考生数据,然后用关联规则进挖掘,发现考生数据中的一些潜在规则,为我们招生宣传提供决策依据。

1关联规则基本原理

给定一组项目I={I1,I2,…,Im}和一个事务数据库D={t1,t2,…,tn},其中ti={Ii1,Ii2,…,Iik}并且是Iij∈I,关联规则是形如X?圯Y的蕴含式,其中X,Y?奂I是两个项目集合,称为项目集并且X∩Y=?I。关联规则X?圯Y的支持度(s)是数据库中包含X∪Y的事务占库中所有事务的百分比。关联规则X?圯Y的置信度或强度(α)是包含X∪Y的事务数与包含X的事务数的比值。关联规则挖掘问题就是找出满足最小支持度和最小置信度的所有关联规则X?圯Y。数值(s,α)作为问题的输入而给定。

2招生Web系统模型设计

2.1 模型的需求分析通常情况下,高校的Web报名系统都是用于采集考生的个人信息,比如分数,电话,地址等。这些信息通常被高校用来联络和招募考生,这样的Web系统是用来获取考生联系方式的一种手段。我们设计的Web报名系统是以统计和挖掘考生信息为目的,更多的是为了发现一些潜在的规则,以便于招生宣传时做宏观上的决策,所以我们设计了一种针对挖掘业务所需的Web报名系统。

2.2 模型的设计此例我们利用ASP技术与ACCESS数据库相结合,相应的ACCESS数据库的设计如图1所示。

2.3 输入的选择我们把地区名称、我校是否在你所在的中学做过宣传、你的中学往届是否有人就读我校这三个字段作为关联规则的前项,把是否填报我校志愿为作后项,其产生的规则肯定是前三项的某个组合与是否填报我校志愿的关联关系,从而使得规则的产生有很强的针对性。

3关联规则挖掘结果的分析与应用

3.1 数据的预处理 首先我们把地区名称转换成数值代码,分别用“10,11,…,30”来代替名称,其它三个字段本来就是离散值,故不需要再进行离散化处理,“是”用“1”表示,“否”用“0”表示,处理后的数据如图2所示。

3.2 利用Clementine进行挖掘选择最小支持度Min Suppor=25%,最小置信度Min Confidenc=35%,对数据进行挖掘,挖掘结转换成表格方式表示,如表1所示。

从挖掘结果中我们可以看出,如第一条规则:地区代码=“11”、我校是否在你所在的中学做过宣传=“1”、你的中学往届是否有人报考我校=“1”->是否填报我校志愿=“1”,这条规则的支持度为30%和置信度为60%。从规则中我们可以了解到,地址区代码为11的考生,由于在考生所在的中学做过宣传和往届已有学生在我校就读,所以他们绝大多数都愿意填报我院。

由于独立学院学费高,地区的经济状况会影响考生是否填报独立学院志愿;我们还可以看出,在中学进行招生宣传,会提高独立学院的知名度、考生信任度,以增加报考的人数;另一方面如果该中学之前已有考生在我校就读,同样会起到一定的宣传效果,更利于考生填报我院。

这些信息可以指导我们在进行招生宣传时,针对经济状况较好的地区可以加大宣传的力度和广度,最好走进中学进行宣讲活动,还可以组织一些在校学生返回他们原来所在的高中进行实地宣传,以增加志愿填报率,增加生源的数量和质量。

4结束语

本文把Web系统与数据挖掘相结合,建立独立学院关联规则判定模型。首先,建立一个适合于挖掘的独立学院招生Web报名系统,用它来采集更直接,更客观的考生数据;其次,用数据挖掘技术对考生数据进行挖掘。实验结果表明,利用此模型可以挖掘出招生数据中的潜在规则,可以作为我们进行招生宣传决策的依据,以利于提高志愿填报率和报到率,在独立学院招生领域具有较好的应用前景。

参考文献:

[1]郭崇慧,田凤占,靳晓明等译.Dunham M H.数据挖掘教程[M].北京:清华大学出版社,2005.

[2]潘海为,韩启龙,印桂生等.基于领域知识指导的医学图像关联规则挖掘[J].计算机研究与发展,2007,z3:424-428.

[3]蒋建军,王以群.农村社会保障体系数据流关联规则挖掘[J].计算机工程,2009,35(17):86-88.

[4]翟少磊,黄孝彬,刘吉臻.基于工况划分的电厂经济性指标挖掘[J].中国电力,2009,7:68-71.