首页 > 范文大全 > 正文

数据挖掘技术在高职教学中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇数据挖掘技术在高职教学中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:对数据挖掘技术高职教学中的应用问题进行了研究分析,探究了高职数据挖掘技术应用于教学具体的操作办法,结合高职学生考试成绩阐述了数据挖掘技术的应用过程。

关键词关键词:数据挖掘;决策树;分类规则

中图分类号:TP392文献标识码:A 文章编号:16727800(2014)002012403

0引言

数据挖掘技术能够全面深入分析数据信息,为决策提供重要依据。教学评价中运用数据挖掘技术可以起到很好效果。如通过数据库平台来分析学生考试成绩,对考试成绩进行全面分析,探究各种影响因素,帮我们找到影响学生成绩的相关因素,发现其内在联系,这是传统教学评价模式做不到的。利用数据挖掘技术获得评价结果,可以更好地指导日常教学工作。

在传统教学评价模式中,数据信息基本上从数据库中提取,然后进行处理分析。而在本研究中,笔者提出了基于数据挖掘技术的C4.5分类处理法,对数据进行分类,便于处理分析。具体步骤如下:①确定数据挖掘目标和对象:在数据挖掘应用中,首先要提出明确的任务目标,这十分关键,虽然处理结果具有不确定性,但任务目标是可以提前确定的,盲目地进行数据挖掘是没有效果的,也不可能成功;②收集数据信息:这一环节任务比较繁重,需要花费大量时间精力。在教学过程中,教师要及时了解学生情况,认真收集有关数据信息,可以直接利用现成数据,也可以通过调查方式获取数据,不断改进教学工作;③数据转换:教师收集数据后,要把数据信息进行整合,转换到相应的数据分析模型中。由于数据分析模型和计算方法有着密切联系,所以计算方法不同,其相应的数据分析模型也不同;④数据分类挖掘:其目的在于建立数据分类模型,合理选择计算方法,并运用相应的系统软件来运行计算规则。数据完成模型转换后,再对数据进行挖掘处理;⑤分类结果评估:即对数据分类处理结果进行评价分析;⑥成果运用:教师基于数据挖掘处理结果来指导教学实践活动,对教学方法策略进行调整完善,不断改进教学工作。

下面通过实例分析来介绍数据挖掘技术应用。

1数据挖掘技术在高职教学中的实施

1.1确定挖掘对象及目标

在本研究中,利用笔者学校办公软件应用操作技能考核系统,收集了380位学生的数据信息,尝试通过分析数据找出计算机基础操作学习的影响因素,从而提高学校计算机基础教学水平。

1.2数据采集

办公软件应用操作技能考核系统可以自动批改学生计算机操作考试,最终成绩分为三栏,包括理论知识、操作应用、总成绩。

因为成绩是以文本形式打印出来的,所以还要把文本成绩数据输入到Excel软件中,便于系统处理分析。

在分析成绩前,首先要进行成绩录入,通常都是由人工操作完成,把学生成绩数据信息输入到系统软件后就可以开始分析处理了。成绩录入内容包括学生姓名、学号、理论考试成绩、文字输入成绩、文件管理成绩、Word表格制作成绩、Word排版成绩、Excel操作成绩以及总成绩。

本研究调查了380位学生的计算机操作课程成绩,有372人参与了调查,所占比例达到97.9%。

1.3数据预处理

(1)数据清理。通过分析调查表数据发现,尽管关注的一些项目数值较低,但考虑到数据挖掘处理特点,还是保留了这些记录。由于一些学生没有参加考试或者考试作弊,成绩表中没有他们的分数,也就不能进行分类挖掘,所以删除了这些学生的项目。清理后保留了360位学生成绩,在所有调查学生中占到96.8%。

(2)数据转换。主要是把数据转换到具体分析模型中。本研究中学生成绩分为三档:分数低于60分的,归为“差”;分数大于等于60分小于70分的,归为“中”;分数大于等于70分的,归为“良”;而在总成绩一栏,因为是分类评价项目,所以根据实际情况来划分,分数在0~69分的,评价为“一般”,属性标志为“N”;分数在70分以上的,评价为“优良”,属性标志为“Y”。

(3)数据集成。整合上面这两个数据表格,建立学生成绩数据库。

(4)数据消减。其目的在于减少数据挖掘对象,但必须保证不影响分析结果。在这里,采取消减维数的方法,即从初始特征属性中找出真正有用的特征属性,以减少数据挖掘时要考虑的特征属性或变量个数。

为建立决策树模型,本研究从实际出发,对成绩进行了分类,包括理论知识成绩、文字输入成绩、文件管理成绩、Word表格制作成绩、Word排版成绩、Excel操作成绩,在此基础上建立决策树模型。

2决策树分类器实现

VB是一种可视化设计软件,可以访问多种不同数据库。因此,本文选择VB软件来开发决策树分类器。关于决策树分类器作用,主要包括分类规则生成、决策树模型构建、决策树优化、浏览数据信息、保存分类规则。

在设计决策树分类器时没有加入数据预处理环节,这是由于决策树分类器主要供教学活动使用,数据信息量通常不会很大,所以可以用其它数据库软件来进行数据预处理。换句话说,必须先准备好分类处理数据,然后才能利用分类器建立决策树模型。

2.1打开数据文件

由于VB的数据控件使用Microsoft Jet数据库机制实现数据控制,可以访问多种数据库文件,因而本分类器可访问的数据包括Microsoft Access、dBase、Microsoft FoxPro、Microsoft Excel、Lotus等多种数据库或电子表格文件。

在分类器对话框中,可以点击“打开数据文件”选择相应文件,打开文件夹后就会在界面上看到所有数据信息。

2.2产生决策树

在数据分类挖掘处理中,决策树产生环节十分关键,主要是通过决策树分类计算来对数据进行分类处理。我们利用C4.5分类计算方法,建立了精确、完整的决策树模型。

该决策树模型建立以后暂时不用进行优化,目的在于让用户全面了解分类情况,所以分类器形成的决策树是没有经过任何处理的、最原始的模型。

2.3决策树修剪

决策树模型过度使用后,其性能会有所下降,而且会更加依赖历史数据信息,很难准确处理分析新的数据。因此,要及时修剪决策树,优化其性能,保证决策树模型有效运行。

但从训练数据角度看,决策树修剪过程很容易出现误差,所有必须严格控制。对于不同数据来说,其允许最大误差范围也不同,具有不确定性。因此,我们采取人为控制误差方法,这样可以灵活使用程序,为用户提供便利。然而,用户往往是根据自身经验来确定误差范围的,并且要反复尝试才能确定下来,因此,要建立一个误差设置操作平台,由用户自己设置允许最大误差率。

2.4生成分类规则

这里进行的是将决策树图形转换为if...then模式的分类规则。通过决策树,使用者可以很直观地看到分类的决策图形;由分类规则,使用者可以得到由文字表达的分类规则模型。

本研究主要是分析学生成绩影响因素,重点考虑优良成绩的影响因素,所以分类规则显示的是优良成绩所占比例。

2.5保存

这是一个让使用者保存决策树或分类规则的功能。使用者可以根据需要将所获得的决策树或分类规则保存。如果当前显示的是决策树,则保存决策树,如果显示的是if...then模式的分类规则,则保存分类规则。

2.6测试

上面的数据挖掘分析过程采用的是60位学生平时测验成绩。使用数据和之前分析模型中的数据相同,结果表明,利用数据挖掘技术建立的决策树模型具有很好的效果。

3结语

本研究基于笔者学校实际案例,因为每年不断扩招,学生数量急剧增加,学校教学质量受到很大影响,所以本文全面研究分析了教学质量影响因素,包括学生数量、理论知识教学比重、学生素质能力等,通过数据挖掘技术建立了分类处理模型,探究了计算机诸专业基础课学生学习成绩影响因素,找到问题所在,从而不断改进教学工作,帮助学生更好地学习。

参考文献:

[1]吴全胜,马敏.数据挖掘技术及其应用现状[J].科技信息,2009(33).

[2]北京工业大学人工智能与知识工程研究室.数据挖掘介绍[EB/OL].http:///sci/multimedia/ai/subject/datamining.htm

[3]JIAWEI HAN, MICHELINE KAMBER. 数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2001.

[4]胡伏湘.高校信息化建设与数字化校园的研究[J].计算机教育,2005(10).

[5]陈丽,陈根才.基于高校人事信息库的数据挖掘研究[J].计算机工程,2000(11).