开篇:润墨网以专业的文秘视角,为您筛选了一篇R软件教学的一些心得范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
【摘要】《R软件》作为一门统计分析软件,具有自由、免费、源代码开放的特点,全世界的R爱好者不断的开发,使R软件的发展很快,所以学习、利用和基于R软件平台进行二次开发越来越重要。本文结合教学实践,提出了几点R软件的教学认识。
【关键词】R软件 软件交叉 课程交叉 案例
【基金项目】安徽师范大学本科教学质量提升计划项目。
【中图分类号】G424.21 【文献标识码】C 【文章编号】2095-3089(2013)12-0125-01
《R软件》是一门实践性很强的课程,该课程以概率统计为基础,多元统计学为主要内容,应用统计理论解决实际问题,着力于统计理论知识的应用,而不是统计理论本身,为强化课程的实践性,课堂教学在兼顾统计理论的同时,宜注重实践性、启发性、实效性,笔者以R软件[1]课程为例,从软件交叉、课程交叉与案例教学三个方面,探索R软件教学的一些心得。
1.软件交叉
统计应用软件包括:SAS(Statistical Analysis System)、SPSS(Statistical Package for the Social Science)、Stata、R语言等。SAS由于其功能强大而且可以编程,很受高级用户的欢迎,但是SAS非常庞大,难掌握。而SPSS致力于简便易行(其口号是“真正统计,确实简单”),并且取得了成功。Stata较好地实现了简便和功能强大两者的结合。与菜单式工作环境不同,R语言是一门计算机语言,是一种专门针对统计学设计的自由软件编程S语言。R软件由于其依赖编程实现,具有一定的灵活性。作为一个软件,其不可避免地与其他软件具有交叉功能。
R软件可以与SPSS[2]交叉。在数据管理方面,SPSS有一个类似于Excel的界面友好的数据编辑器,可以用来输入和定义数据,而R软件虽然可通过在程序内部或键盘输入来定义数据,但一般通过文本文件导入数据,其数据的可视化不如SPSS,但是数据的可扩展性较好,可以方便地与其他软件交流;在统计分析方面,对比R软件,SPSS能够进行大多数统计分析,其缺点是没有稳健方法,难以实现个性化的创新方法;在绘图功能方面,SPSS绘图的交互界面非常简单,图形质量较好,但是某些复杂场景不如R灵活。总之,由于其便捷的菜单式操作,而易于掌握,在教学中,适当的将其与R软件对比讲解,能够加深对统计软件的理解,特别是通过对比在R中能实现而SPSS中不能实现的高级操作,能够了解统计软件的应用场景和优劣性。SPSS虽然号称操作简单,但是其复杂纷繁的菜单选项,也让人头晕,而在掌握R的帮助文件之后,R程序的编制并不复杂。
R软件可以与Matlab[3]交叉。同为计算机语言,R与Matlab有很多相通之处。R软件与Matlab可在矩阵分解、解线性方程组、拟合等方面做对比;也可在编写自己的函数方面进行对比,如[1]中关于二分法求非线性方程根的函数,Matlab函数与R函数语句对比能更进一步解释算法的同向性和计算机语言功能上的相似性;在优化函数方面R的optimize()函数与Matlab的优化函数结果稍有不同;Matlab统计工具箱中自带的多个库函数可与R进行对比。总之,R特有的数据框操作更便捷,虽然Matlab通过构造结构体,可以构造类似于数据框的数据类型,但是操作仍然不够方便,针对统计应用而言,R比Matlab更有效。
R可以连接SQL Server[4]。这首先需要R安装程序包RODBC(如果第一次安装程序包,R会让你选择一个链接点,下载程序包);然后在Windows下的ODBC中配置数据源,使用library(RODBC) 载入RODBC库,再使用odbcConnect()和sqlQuery()分别连接Windows中添加的数据库和查询数据库。值得注意的是在R环境下,应用SQL语句,可以对源数据库进行添加、删除、编辑,从而达到更改的目的。
R软件可以与Eviews[5]交叉。在回归分析中,回归诊断比回归本身更重要,因为这涉及回归方法的合理性。其中关于残差的白噪声(正态的同方差、独立的残差序列)检验是回归诊断的重要内容。真正的误差服从正态分布,反之,如果回归的残差不是正态分布,则回归方程存在系统偏差,从而导致回归不合理,所以回归残差序列首先需要服从正态分布;同时残差也不应该与自变量的大小有关,不会因为自变量的值越大,误差就越大,也即多次试验的误差的方差不变;误差序列自身也不相关性,即非自相关,误差不会在误差序列内部传播。关于数据的正态性检验R可以由shapiro.test()或ks.test完成,但是关于异方差的检验教材中仅介绍了图示法,通过将残差数列导入Eviews,可分别由Eviews的White检验和Q检验完成残差序列的同方差性检验和相关性检验。
2.课程交叉
《R软件》与《数值分析》[6]交叉。教材[1]中,有些等价变形涉及数值分析、数值扰动。比如例6.5中,关于沸点与气压之间的关系,在回归之前,先将气压取对数,再扩大100倍,可以避免小数据对大数据的扰动。在回归分析中,微观尺度的数据与宏观尺度的数据在一起回归,往往需要有一个预处理,将他们转化为相同尺度的数据,再回归。
《R软件》与《英语》的交叉。R软件的学习,总是离不开帮助文件,而帮助文件建立在英语基础上,为此,学好R软件需要一定的英语文档阅读能力,帮助文档,一般由主旨描述(Description)、使用语法(Usage)、参数解释(Arguments)、细节(Details)和例子(Examples)构成,其中参数解释和细节往往需要认真阅读,比较实用的方法是对照例子,在R软件中反复测试例子的变形形式。
3.案例教学
由于《R软件》课程的实践性,在教学中加入案例教学,会收到事半功倍的效果。如在编制函数部分加入华为、中兴公司的笔试题目;在假设检验中,加入招聘案例:10道4个备选的单项选择题,做对6道可以考虑录用;在聚类分析中,根据学生的作业等级,加入聚类分析,从而分析学生的人际关系;特别是加入大学生数学建模竞赛的部分内容,更能体现统计理论解决应用问题的方式。总之,案例教学,具有针对性、实践性、启发性、研究性和时效性,能够突出统计软件课程的应用性、实践性,激发学生的学习兴趣,带动课堂气氛,让枯燥的统计原理、统计方法变得生动形象,能提高教学质量。
4.结论
作为一门软件,R是一款功能强大的统计软件包,R是属于GNU系统的一个自由、免费、源代码开放的软件,全世界的R爱好者不断的开发,使R软件的发展很快。随着我国对于软件知识产权法规不断完善的情况下,学习、利用和基于R软件平台进行二次开发对于我国的科研人员来说越来越重要,学术界也更倾向于R,高级论文R实现较多,R正变得越来越流行。
作为一门统计学实践课程,《R软件》是以统计理论、统计方法为基础,计算机语言为具体实现手段的专业方向课,为上好这门课,授课教师不可陷入统计学理论的讲解,在交代统计理论的来龙去脉的基础上,需将统计理论与统计软件相结合,将复杂的统计理论具体化、程序化、可视化。本文所提多种软件交叉、课程交叉,兼具案例渗透的教学方式,能够较好地将统计理论应用于统计实践,获得较好地教学质量。
参考文献:
[1]薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社, 2007.
[2]张文彤,邝春伟.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011.
[3]张贤明.MATLAB语言及应用案例[M].南京:东南大学出版社,2010.
[4]黄维通,刘艳民. SQL Server数据库技术与应用[M].北京:高等教育出版社,2011.
[5]易丹辉. 数据分析与Eviews应用[M].北京:中国人民大学出版社,2008.
[6]王兵团,张作泉,赵平福. 数值分析简明教程[M].北京:清华大学出版社,2012.