开篇:润墨网以专业的文秘视角,为您筛选了一篇模糊聚类分析算法在学生成绩综合评估中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
摘要:学生成绩综合评估是一个典型的多层次、多角度、多指标的综合评估问题。该文利用数据挖掘中的模糊聚类分析算法,以Microsoft SQL Server 2012 Analysis Services为工具,对该校2011级学生成绩数据集进行深入的研究分析,以获取学生成绩数据中所隐含的规律,挖掘各科成绩背后所表达出来的学生的个性能力差异,从而科学、准确、公平、公正地评定学生成绩。
关键词:学生成绩综合评估;数据挖掘;模糊聚类
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)05-1024-03
Application of Fuzzy Cluster Analysis Algorithm in the Comprehensive Evaluation of Student Achievement
SHANG Li-hua
( Wuxi High Teachers' College, Wuxi 214000,China)
Abstract:Student achievement evaluation is a comprehensive assessment of a typical multi-level, multi angle, multi index problem. In this paper, using the fuzzy cluster analysis algorithm in data mining, using Microsoft SQL Server 2012 Analysis Services as the tool, research and Analysis on the 2011 level of student achievement data sets, to obtain the hidden rules of student achievement data, differences of personality mining scores back expressed by students, and science, accurate, fair, impartial assessment of student achievement.
Key words:The comprehensive assessment of student performance; data mining; fuzzy clustering
随着现代职业教育的蓬勃发展,高职学校的招生规模日益扩大,繁重的教务管理系统中的数据更是激增。学生成绩管理作为教务管理工作的重要组成部分,它既是考核学生专业知识掌握的重要依据,也是教学质量评估的重要衡量标准。现代职业教育开设科目繁多,各科目的教学目标和培养目标呈现多样性和差异性特点。如果学生的综合排名只是依据单一的期末考试成绩显然不科学也不合理,更不能体现出学生在各学科间的优劣差异。因此,该文想借助数据挖掘技术,应用模糊聚类分析的算法对学生成绩数据集进行分析研究,以获取学生成绩数据中所隐含的规律,挖掘出各科成绩背后所表达出来的学生的个性能力差异,为学生的评定工作提供可靠的科学依据,从而科学、准确、公平、公正地评定学生成绩。
1 数据挖掘
数据挖掘就是知识提取的过程,即从大量的、不完全的、含有噪声的、模糊的、隐含的结构化或非结构化的数据中,去发现隐含在其中的、人们事先并不知道的、但又是非常感兴趣的、可理解、可运用的知识[1]。这个定义包括好几层含义:数据源首先必须是大量的、真实的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题即可。数据挖掘与传统数据分析相比较,它的优势在于其能够在没有明确假设的前提下去挖掘信息、发现预先未知的、难预料的知识。要解决当前“数据爆炸”和“数据丰富”而“信息贫乏”的局面,数据挖掘不失为一个行之有效的办法。
2 聚类分析
聚类分析就是把一组物理对象或抽象对象按照彼此的相似性划分成若干类似对象组成的多个簇,即“物以类聚”,并且要求实现最大化类内的相似性、最小化类间的相似性,从而为相关决策提供强有力的支持[2]。聚类分析技术作为数据挖掘中的一项最活跃的主要技术,现在已广泛应用于各个行业,随着人们对数据挖掘技术的不断深入研究,人们对现有的各种聚类算法进行了部分提高或组合改进,甚至是为了特定的应用问题而专门设计了改进算法。该文在深刻理解k-means算法的基础上对它进行了组合改进,将模糊算法与k-means算法两者组合起来改进,适当地改进k-means算法中初始聚类中心的确定方式,从而克服K-means初始聚类中心的不足点,使得k-means算法更为精确,更加适合分析学生成绩综合评估特定问题。在学生成绩综合评估形成过程中,关键的环节就是评价的各项指标,但由于评价各项指标并不能完全精确确定,模糊性是客观的存在,因而其某些属性指标无法定量分析,这种情况下用一些模糊概念加以描述,利用模糊集合理论中模糊聚类方法解决上述问题。
3 数据挖掘的实现
3.1学习成绩的准备、抽取
现代职业教育的重心是学生综合素质培养和技能教育,在学生成绩综合评估体系中,我们不光要考虑学生的成绩和技能能力的高低,还要考察其它体现学生综合素质的方面:比方说学生的日常常规管理、学生参与社会实践活动和公益活动情况、文体表现以及积极程度等。该文的原始数据项分为学生的姓名、性别、学生各科成绩、操行、文体、技能成绩、社会实践公益活动参与情况、综合排名情况等。其中,学习成绩为三部分,即该生学业平时分的30% + 该生期中成绩的30%+该生期末成绩的40% ;技能成绩为各项技能成绩平均分(优秀为3分,良好为2分,及格为2分,不及格为-1分)。部分数据如表1所示。