pg电子

首页 > 新闻信息 > 正文

【研创基地·专题培训】R软件探秘——第134期专题培训成功举办!

发布时间:2021-09-23作者:点击次数:

R软件探秘

——第134期专题培训成功举办!



2021916日晚19:00,pg电子研究生创新实践基地第134期专题培训——“R软件探秘”,第134期名专题培训成功举办!线上讲座在腾讯会议顺利举办,参会50余人次,整个活动持续了两个余小时,讲座氛围十分热烈。本期专题培训主讲人——pg电子数学与统计学院硕士生导师张应应老师从R软件简介、数字、字符与向量、对象和它的模式与属性、因子、多维数组和矩阵以及列表与数据框等多个方面进行了分享。

一、R软件简介

R是一个开放的统计编程环境,是一种语言,是S语言的一种实现。S语言是由AT&T Bell 实验室的Rick Becker,John Chambers和 Allan Wilks开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft 公司的统计科学部进一步完善。

与其说R软件是一种统计软件,还不如说R是一种数学计算环境.因为R提供了有弹性的、互动的环境来分析、可视及展示数据;它提供了若干统计程序包,以及一些集成的统计工具和各种数学计算、统计计算的函数,用户只需根据统计模型,指定相应的数据库及相关的参数,便可灵活机动的进行数据分析等工作,甚至创造出符合需要的新的统计计算方法.使用R软件可以简化你的数据分析过程,从数据的存。郊扑憬峁姆窒,R软件提供了更加方便的计算工具,帮助你更好地决策.通过R软件的许多内嵌统计函数,用户可以很容易学习和掌握R软件的语法,也可以编制自己的函数来扩展现有的R语言,完成你的科研工作。

关于R软件的下载,R软件是全免费的,在网站:http: // cran.r-project.org/bin/windows/base/可下载到R软件的Windows版,当前的版本是R-2.3.1版(2006年6月1日发布),大约是27兆,点击 R-2.3.1-win32下载,或者选择距离你最近的镜像(mirror near you)下载.注意,在 R-2.2.0版本以前是点击rwXXXX.exe下载,其中XXXX是版的序号,如本书使用的版本是R-2.1.1,则点击rw2011.exe下载。

除此之外,老师还将一些资源分享到了QQ群中,感兴趣的同学可以扫码加入老师的QQ群,获得老师上传的更多资源。

 

紧接着,老师通过一个具体的操作实例,进行了R软件的实际运行操作,如“#”号是说明语句字符,#后面的语句是说明语句,<-表示赋值,c()表示数组, X1<-c()即表示将一组数据赋给变量X1,mean()是求均值函数, mean(X1)表示计算数组x1的均值。老师认为同学们要学习运用说明语句,来说明程序要作的工作,以增加程序的可读性。

 

R软件除了老师演示的基本程序包外,还有许多程序包,只是在使用前需要调入。如需要读SPSS 软件的数据文件,需要用函数read.spss,但在使用前需要调入foreign程序包。

二、数字、字符与向量

R软件中最简单的运算向量赋值,如果打算建立一个名为r的向量,相应的分量是10.4,5.6,3.1,6.4和21.7,用R命令是> x <- c(10.4,5.6,3.1,6.4,21.7)。中α是变量名,<-为赋值符, c( )为向量建立函数.上述命令就是将函数c( )中数据赋给变量心。另一个赋值函数是assign( ),第三种赋值形式为> c(10.4,5.6,3.1,6.4,21.7)->x。对于向量可以作加(+)、减(一)、乘(*)、除(/)和乘方()运算,其含意是对向量的每一个元素进行运算,其中加、减和数乘运算与我们通常的向量运算基本相同。

 

三、对象和它的模式与属性

R是一种基于对象的语言,R的对象包含了若干个元素作为其数据,另外还可以有一些特殊数据称为属性(attribute),并规定了一些特定操作(如打印、绘图)。比如,一个向量是一个对象,一个图形也是一个对象。R对象分为单纯(atomic)对象和复合(recursive)对象两种,单纯对象的所有元素都是同一种基本类型(如数值、字符串),元素不再是对象;复合对象的元素可以是不同类型的对象,每一个元素是一个对象。

对象可以取0长度或正整数为长度,R允许对超出对象长度的下标赋值,这时对象长度自动伸长以包括此下标,未赋值的元素取缺失值(NA)。

四、因子

统计中的变量有几种重要类别:区间变量、名义变量和有序变量。区间变量取连续的数值,可以进行求和、平均值等运算。名义变量和有序变量取离散值,可以用数值代表,也可以是字符型值,其具体数值没有加减乘除的意义,不能用来计算,而只能用来分类或计数,名义变量如性别、省份、职业,有序变量如班级、名次。

因为离散变量有各种不同表示方法,在R软件中,为了统一起见,使用因子(factor)来表示这种类型的变量。gl()函数可以方便地产生因子,其一般用法是gl(n,k,length = n*k,labels = 1:n,ordered = FALSE)。

五、多维数组和矩阵

数组(array)可以看成是带多个下标的类型相同的元素的集合,常用的是数值型的数组如矩阵,也可以有其它类型(如字符型、逻辑型、复数型)。R可以很容易地生成和处理数组,特别是矩阵(二维数组)。

数组有一个特征属性叫做维数向量(dim属性),维数向量是一个元素取正整数值的向量,其长度是数组的维数,比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量的每一个元素指定了该下标的上界,下标的下界总为1。

向量只有定义了维数向量(dim属性)后才能被看作是数组。R软件可以用array()函数直接构造数组,其构造形式为array(data = NA,dim = length(data), dimnames = NULL)。其中data是一个向量数据, dim是数组各维的长度,缺省时为原向量的长度。dimnames是数组维的名字,缺省时为空。

六、列表与数据框

列表是一种特别的对象集合,它的元素也由序号(下标)区分,但是各元素的类型可以是任意对象,不同元素不必是同一类型,元素本身允许是其它复杂数据类型,比如,列表的一个元素也允许是列表。

数据框是R的一种数据结构。它通常是矩阵形式的数据,但矩阵各列可以是不同类型的。数据框每列是一个变量,每行是一个观测。但是,数据框有更一般的定义。它是一种特殊的列表对象,有一个值为“data.frame”的class属性,各列表成员必须是向量(数值型、字符型、逻辑型)、因子、数值型矩、列表,或其它数据框。向量、因子成员为数据框提供一个变量,如果向量非数值型会被强制转换为因子,而矩阵、列表、数据框这样的成员为新数据框提供了和其列数、成员数、变量数相同个数的变量。作为数据框变量的向量、因子或矩阵必须具有相同的长度(行数)。

尽管如此,一般还是可以把数据框看作是一种推广了的矩阵,它可以用矩阵形式显示,可以用对矩阵的下标引用方法来引用其元素或子集。

 

在张老师结束内容讲解后,同学们纷纷留言向张老师请教R软件使用方面的问题,张老师也就同学们所请教的问题一一进行了详细的解答,对此不少同学反馈通过这次活动收获匪浅,在活动最后还对老师进行了感谢。

(由于本次讲座更多内容由老师进行实际操作演示,无法进行详尽的文字阐释,同学们想要获取更详细的讲座内容,可以自取下方百度云链接进行学习。)

 

此次线上活动的回放链接:

第一部分链接:https://pan.baidu.com/s/1T1P1AjrU_yBc7dRs-yEQDg

提取码:4x91

第二部分链接:https://pan.baidu.com/s/1OeGEJ41dCf9KmAD7-3JjPA

提取码:gpn8

如对本次专题培训讲座内容有相关疑惑可加入QQ群(群号:615660517)进行讨论,研究生创新实践基地将竭力为同学们提供更优质的培训服务。

 

   办:pg电子

pg电子科学技术学会

   办:pg电子研究生创新实践基地

         pg电子研究生科学技术协会

欢迎关注“pg电子研究生创新实践基地”

 

pg电子研究生创新实践基地

pg电子研究生科学技术协会

2021923

pp电子 - 财神运财PP电子