首页 > 范文大全 > 正文

基于决策树技术和SQL Server BI平台的课程成绩分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于决策树技术和SQL Server BI平台的课程成绩分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

(1.西南科技大学计算机科学与技术学院,四川绵阳621010;2.周口职业技术学院信息工程系,河南周口466000;3.周口师范学院计算机科学与技术学院,河南周口466001)

摘要:该文首先对决策树技术相关理论和sql server 2008 bi平台作了介绍,然后对用于挖掘分析的数据源进行了预处理。利用SQL Server 2008 BI平台下的决策树分类技术和DMX语言即数据挖掘扩展语言创建了课程成绩分析决策树模型。挖掘提升图和分类矩阵对该模型的评估结果表明模型具有较高的可靠性和分类准确度,同时模型对应的一些规则和模式可作为课程教学管理及改革的重要参考依据。

关键词:决策树技术;SQL Server 2008 BI平台;ETL过程;DMX语言;分类矩阵;挖掘提升图

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)16-3759-05

Course Achievement Analysis Based on Decision Tree Technology and SQL Server BI Platform

HUANG Yu-da1,2,HOU Yan-fang2,WANG Yi-ran3

(1.College of Computer Science and Technology,Southwest University of Science and Technology,Mianyang 621010,China;2. Informa tion and Engineering Department,Zhoukou Vocational and Technical College,Zhoukou 466000,China;3. College of Computer Science and Technology, Zhoukou Normal University,Zhoukou 466000, China)

Abstract: The paper first introduces basic theory about decision tree technology and SQL Server 2008 BI platform and,and then prepro cessing on data source for mining analysis.Using decision tree classifying technology in SQL Server 2008 BI platform,and DMX language , namely data mining extension language,to create the decision tree model of course score analysis.The evaluation results show that the model has high reliability and classification accuracy by mining enhance figure and classification matrix, meanwhile,these rules corresponding to the model can be used as important reference for management and reform of course teaching.

Key words: decision tree technology;SQL Server 2008 BI platform;ETL process;DMX language; classification matrix; mining enhance figure

目前,对于学校每一个专业所开设的多门课程而言,这些课程在该专业领域的地位和重要性并非全部相同。同一个专业,不管是专业基础课还是专业课,总有那么几门课程无论是对学生的学期成绩还是甚至对将来的就业、本专业领域的继续深造等具有至关重要的影响。相对来说,学校应注重并不断加强对这些骨干课程的教学及管理力度[1],想法设法让学生能在这些专业骨干课程方面都取得优异成绩。因此,采用合理的挖掘技术对一些专业骨干课程学生成绩数据作进一步的深入挖掘分析、找出一些影响课程成绩的潜在而有用的模式并将其作为课程教学改革的参考依据等诸如此类工作的开展是很有必要而迫切的[2]。

《工程测量》属于道路桥梁工程技术专业的一门重要骨干课程,该课程的教学及考核分理论及实践两个环节。该文以笔者所在单位2008级、2009级、2010级学生该门课程成绩相关数据作为挖掘分析对象,利用SQL Server 2008 BI平台中的Microsoft决策树技术对其进行挖掘分析,期望能找出一些潜在的与该门课程的考试成绩、教师教学和学生学习等情况切实相符的模式并将其作为教学管理、改革及决策的重要依据。

图6上图5对应的的挖掘图例

其中,图5中X轴表示从测试集中抽取的事例数所占测试集总体事例数的百分比,Y轴表示从测试集中抽取的事例数中满足可预测列M=“是”条件的事例数所占测试集总体事例数中满足可预测列M=“是”条件的百分比。

通过图5和图6不难发现,生成的模型对应的红色提升曲线轨迹非常接近理想模型下对应的绿色提升曲线轨迹,而且从它们分别对应的挖掘图例中不难看出,该模型具有较高的预测准确率。

生成的《工程测量》课程成绩分析决策树模型如图7所示。

另外,考虑到生成的课程成绩分析决策树模型的形状较大且对应的规则较多,所以这里只从模型中抽取出一些较为典型且具有实际参考意义的规则并加以分析。其中,表1中的A、B、C、D、E、F、M字母含义分别为:兴趣度、教师授课情况、课前预习情况、实践环节掌握情况、课堂掌握情况、课后复习情况、课程成绩是否为“优”。该模型对应的事例总数为1411*70%=988。