首页 > 范文大全 > 正文

基于数据仓库技术的考试评价研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于数据仓库技术的考试评价研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:考试评价与分析是教学过程中的重要环节。在各学校纷纷采用数字化学习、数字化考试的背景下,基于数据仓库技术对考试评价各指标进行了研究。首先研究了考试评价指标,提出了建立试题库时的知识点权重算法和试卷信度检测算法,然后基于数据仓库技术对考试评价的各指标建立了多维数据模型,以便于对考试信息进行挖掘与评价分析。

关键词:数字化学习;数据仓库;考试评价;试卷信度

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)12-2756-02

当前社会对人才需求的数量及程度越来越高,高等院校在课程质量建设方面的重视度也在不断提高,在课程的考试评价方面也随之逐渐的科学化和智能化。各高校纷纷引入了数字化学习平台,通过建立试题库系统,由系统自动进行试卷生成和试卷分析,是教学部门提高考生评价效果的重要手段,也是教学过程中的重要环节。在目前各高校招生规模不断扩大的情况下,学生考试所产生的的数据量也是呈几何级增长。面对海量的考试数据,采用合适的数据处理技术就显得尤为重要。

数据仓库技术[1]是涉及人工智能、机器学习和数据库等多学科的一个相当活跃的研究领域。随着技术发展,如何更好地将数据仓库技术应用于教育领域,已成为目前教育领域应用研究的重点问题[2]。

1 考试评价指标

本文从教学及考试的目的出发,建立的评价指标包括:试卷质量分析、试题分析、知识点分析、考生分析[3]。

考试分析是教育测量学的重要内容,传统的考试评价指标,从试题的角度讲,有难度、区分度、覆盖度等,从试卷的角度讲,还有信度、效度等[4]。

在数字化学习平台中,学生的考试是通过试题库随机抽取试题来进行的,而试题库的建设需要组织优秀的教师进行,但在编写试题时每个教师对某个章节内知识点的权重把握又存在差别,为了使得每次抽取的试题所报含的知识点更加合理,该文对如何确定某个章节内知识点的权重建立了如下算法:

假如某章节共有[n]个指标(在此我们将知识点用指标表示),认为最重要的就记为1,认为第二重要的就记为2,……,最不重要的指标记为[n]。每一个指标排在第几位的顺序号数叫做该指标的秩。把参加编写试题的所有教师(设共有[m]位教师)对某个指标给予的秩加起来,所得结果叫做该指标的秩和,用字母[R]表示。第[j]个指标的秩和用[Rj]来表示。如果用[aj]表示第[j]个指标的权重,则权重的计算公式是

[aj=2[m(1+n)-Rj]mn(1+n)] (1)

其中[n]为指标(知识点)个数,[m]为教师人数。[j=1,2,3,…,n]

为了保障学生考试成绩的合理性,该文拟对所产生试卷的信度进行检测,建立如下试卷信度检测算法:

假设收集了[n]位学生的成绩,用[x]表示奇数号题目得分,具体得分是[x1,x2,x3,…,xn];用[y]表示偶数号题目得分,具体得分是[y1,y2,y3,…,yn]。用[rxy]表示[x]和[y]的相关系数,用[r]表示信度,当两部分的总体方差[σ2x]和[σ2y]相同时,则信度计算公式为

[r=2rxy1+rxy] (2)

当两部分的总体方差[σ2x]和[σ2y]不同时,信度计算公式为

[r=2(1-s2x+s2ys2T)] (3)

式中[s2x]和[s2y]为两部分的样本方差,[s2T]为[x]和[y]之和[x+y]的样本方差([T=x+y])。

[s2x=1n-1[x2-1n(x)2]] (4)

[s2y=1n-1[y2-1n(y)2]] (5)

[s2T=1n-1[T2-1n(T)2]] (6)

2 考试评价数据仓库的构建

数据仓库设计的核心是构建多维数据模型。多维数据模型将数据看做数据方形式,数据方允许以多维对数据建模和观察。它由维和事实定义。一般地,维是透视或关于一个组织想要记录的实体。每一个维都有一个表与之相关联,该表称为维表。维表可以由用户或专家设定,或者根据数据分布自动产生和调整。通常,多维数据模型围绕中心主题组织。该主题用事实表示。事实是数值度量的,我们可根据数据分析维之间的关系。事实表包括事实的名称或度量,以及每个相关维表的关键词[5-6]。

目前,多维数据模型主要有星型模式和雪花模式两类[7]。

本文采用星形模式来构建多维数据模型,以考生分析主题为例,其数据模型如图1所示。

图1 考生分析主题对应的星型模型

3 结束语

本文是在各学校纷纷建立数字化学习平台的大背景下进行研究的。数字化环境为考试评价分析提供了大量的数据支持,该文提出了建立试题库时的知识点权重分配算法和试卷信度检测算法,以保障所生成试题的合理性和有效性;从教学及考试的目的出发,提出了考试评价的指标,基于数据仓库技术建立了多维数据模型,决策者可以使用多维分析的方法从多个角度、多个层次对数据进行挖掘和分析,以获取有效的考试评价信息。

参考文献:

[1] Inmon W H. Building the data warehouse[M].2nd ed.JohnWiley,1996:50-93.

[2] 陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004:150-200.

[3] 蔡敏.网络教学的交互性及其评价指标研究[J].电化教育研究,2007.11:40-44..

[4] 魏华忠,周仁来,马健生.教育统计与测量[M].辽宁师范大学出版社,2003.

[5] 康博创作室.SQL Server 2000数据仓库设计和使用指南[M].北京:清华大学出版社,2001:100-150.

[6] 陈启买,贺超波,刘 海.基于OLAP的高校教学协同决策[J].计算机应用,2009(1)

[7] 林杰斌,刘明德,陈湘.数据挖掘与OLAP理论与实物[M].北京:清华大学出版社,2003:83-200.