分享

R语言 | 向量化操作purrr包

 大邓的Python 2021-02-23

Python网络爬虫与文本数据分析

在不少实际问题中有许多具有规律性的重复操作,因此在程序中就需要重复执行某些语句。

问题

比如有一个序列ns,现在想得到res,让ns中每一个数字变为平方数,代码如下

ns <- c(12345678910)

res <- c()
for (n in ns) {
    res <- c(res, n*n)
}

res
##  [1]   1   4   9  16  25  36  49  64  81 100

R语言tidyverse中的purrr包含三个向量化操作函数,如果熟悉Python的map会很容易理解R语言的purrr;求平方用purrr解决代码如下

library(purrr)

# map(数据, 操作函数)
res <- map(ns, function(x)x*x) 
unlist(res)
##  [1]   1   4   9  16  25  36  49  64  81 100

purrr包

purrr包是R语言中提高代码效率的包,常见的函数有


  • purrr::map(.x, .f) 对x实行f操作
  • purrr::map2(.x, y, .f) 对x和y实行f操作
  • purrr::pmap(.l, .f) 对多维列表l实行f操作
参数含义
.x数组(类似于Python中的列表)
y数组(类似于Python中的列表)
.f应用到数组上的操作(函数)
.l列表(列表中一般含有多个数组)

map计算年龄

library(tibble)

infos <- tibble(
    family=c("张""李""王""赵"),
    name=c("三""四""五""六"),
    born=c(1990199220001985)
)

infos

计算年龄

age <- purrr::map(infos$born, function(x, y){2020-x}) %>% unlist()
infos$age <- age
infos


map2拼接姓名

fullname <- purrr::map2(infos$family, infos$name, function(x, y)paste0(x,y)) %>% unlist()
infos$fullname <- fullname
infos


pmap拼接姓名

上面所有的操作都使用的map和map2,现在使用pmap操作拼接姓名

infos <- tibble(
    family=c("张""李""王""赵"),
    name=c("三""四""五""六"),
    born=c(1990199220001985)
)

infos


fullname <- purrr::pmap(list(x=infos$family, 
                             y=infos$name), 
                        function(x, y)paste0(x, y)) %>% unlist()
infos$fullname <- fullname
infos

R语言相关

R语言 | 读写txt、csv、excel文件 
R语言 | 数据操作tidyr包
R语言 | 数据操作dplyr包  
R语言 | jiebaR中文分词包
R语言 | 词频统计 
R语言 | 制作词云图  

后台回复关键词【purrr】获取本文代码和数据

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多