当前位置:首页>维修大全>综合>

r语言data函数怎么用(r语言怎么把values变成data)

r语言data函数怎么用(r语言怎么把values变成data)

更新时间:2024-06-30 18:41:50

r语言data函数怎么用

在 R 语言中,`data` 函数是用来加载 R 中已经内置的数据集。它将加载数据集的原始数据以及数据集的描述信息(元数据)一起载入到 R 的工作环境中。以下是使用 `data` 函数的步骤:

1. 载入数据集。

要使用 `data` 函数加载数据集,首先需要知道要载入哪个数据集。 R 内置有许多数据集,您可以使用自带的文档或搜索引擎来浏览和查找数据集。例如,要加载名为 `mtcars` 的数据集,可以在 R 代码中输入以下命令:

```r

data(mtcars)

```

2. 查看数据集。

加载数据集后,您可以使用 `head`、`tail` 或 `View` 等函数来查看数据集的前几行、后几行或整个数据集。例如,使用 `head` 函数查看 `mtcars` 数据集的前 6 行:

```r

head(mtcars, n = 6)

```

3. 操作数据集。

一旦数据集成功加载到 R 中,您便可以执行针对数据集的各种操作,如统计分析、绘图等。例如,使用 `summary` 函数对 `mtcars` 数据集进行描述性统计:

```r

summary(mtcars)

```

注意:如果您的 R 版本较老或未更新,可能会发现某些先进或更高级别的数据集未能发现,您可以尝试通过 `install.packages` 函数下载并安装最新的数据包。例如,使用以下命令安装 `ggplot2` 包:

```r

install.packages("ggplot2")

```

完成安装后,即可使用 `data` 函数加载包中的数据集。

data.table用法解析

R语言中的data.table是一种数据处理时的高效率工具。在了解data.table之前先简单说明一下管道函数的使用方法。

管道函数的使用方法

常用的管道函数有以下三种:

%in%:表示包含于

%>%:表示向右传递

%$%:表示向右传递列,并可以直接按列操作

data.table使用方法

1. 首先将数据变成data.table格式

data = data%>%

as.data.table()

2. 将数据按照以下5个变量汇总

data = data%>%

as.data.table()%$%

.[,.(value = sum(value,na.rm = TRUE)),

by = c("period","index","area","id1","id2")]

3. 按照某类别列的变量值筛选

data = data%$%

.[index%in%c("UV","DB","XS"),]

4.改变类别列中变量名称

data = data%$%

.[index_name == "DB",index_name := "DB_PV"]%$%

.[index_name == "GZ",index_name := "GZ_UV"]%$%

.[index_name == "XSLZ",index_name := "XSLZ_UV"]

5. 取某列全部值的前6个字母

data = data %$%

.[,":="(id1 = substr(id1,1,6),

id2 = substr(id2,1,6))]%$%

.[,.(value = sum(value,na.rm = TRUE)),

by = c("period","index","area","id1","id2")]

6. 筛选列

data = data %$%

.[,.(period,id1,id2,area,index,value)]

7. 筛选行列

N <- rank.P[ID2%in%target,.(ID2, Month, prov_ID, Province, Index_name,Value_adj_per)]

8. 变更列名称

data = data%>%

setnames(c("period","car_id1","car_id2","area","value"), c("Month","ID1","ID2","Province","Value"))

9. 按照某列合并表格,并筛选某些列

data = data %>%

merge(data2, by.x="Province",by.y="Province",all.x = TRUE)%$%

.[,.(Month,Province,ID,index_name,ID2,Value)]

9.1 合并后出现列名重复现象

new_data <- data%>%

merge(data2,

by.x = c("ID1","ID2","Month","prov_ID","Province","Index_name"),

by.y = c("ID2","ID1","Month","prov_ID","Province","Index_name"),

suffixes = c("_P","_N"))

10. 定义新列

new_data <- new_data[, ":="(Score = (Value_adj_per_P+Value_adj_per_N)/2)]%$%

.[, Rank := row_number(-Score),

by = c("ID2","Month","prov_ID","Province","Index_name")]%>%

merge(phase, by = "Index_name")%$%

.[, Index_name := NULL]

更多栏目