多语言展示
当前在线:500今日阅读:31今日分享:25

R语言学习经验(二):数据结构介绍

通过【R语言学习经验(一):R的获取和安装】,完成操作环境的搭建后,即可开始使用R软件。对于任何数据分析软件而言,【创建、导入数据】是开展数据分析的准备工作,在开始学习R语言,创建、导入数据集的经验之前,必须先要了解R的主要数据结构。3R语言学习经验(一):R的获取和安装
工具/原料
1

电脑

2

R环境(已安装)

1、主要数据结构简介
1

向量:向量是用于存储数值型(例如:1,2,3,4,5)、字符型(例如:a,b,c)或逻辑型数据(例如:TRUE,FALSE)的一维数组。请在脑中构建下图所示的概念。执行组合功能的函数c()可用来创建向量。R语言,通过 【<-】 进行赋值!注:示例中用中文名代替变量名,便于初学者识别,正常工作中,请用英文名代替,且R语言区分大小写,即abc和ABC是不同的两个变量。

2

矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。请在脑中构建下图所示的概念。通过函数matrix创建矩阵,公式如下图所示,其中,vector包含了矩阵的元素,nrow和ncol用以指定行和列的维数,选项byrow则表明矩阵应当按行填充(byrow=TRUE)还是按列填充(byrow=FALSE),默认情况下按列填充,dimnames包含了行名、列名。

3

数组(array)与矩阵类似,但是维度可以大于2。请在脑中构建下图所示的概念。通过array函数创建,公式如下图所示。其中vector包含了数组中的数据,dimensions是一个数值型向量,给出了各个维度下标的最大值,而dimnames是可选的、各维度名称标签的列表。

4

数据框与矩阵类似,不同的列可以包含不同模式(数值型、字符型等)的数据。请在脑中构建下图所示的概念。通过函数data.frame()创建,公式如下图所示。其中的列向量col1, col2, col3,… 可为任何类型(如字符型、数值型或逻辑型)。每一列的名称可由函数names指定。END

2、数据结构中值的引用
1

数据结构中,值的引用主要通过【变量名+[]】来实现,例如a<-c(1,2,3,4,5)变量名[1],表示第一个数变量名[1:2],表示第1个数到第2个数

2

对于矩阵而言,值的引用主要通过【变量名+[行,列]】来实现变量名[,1],表示第一列数据变量名[1,],表示第一行数据。变量名[2,3],表示第二行第三列数据。END

注意事项
1

数据库中可以包含不同类型的数据模式(数字,字符,逻辑),矩阵只能包含一种

2

为便于理解,经验中示例的变量名采用中文,日常工作学习中,请使用英文变量名

推荐信息