分享

dplyr和tidyr简介|数据处理

 iceer1212 2020-07-09

数据处理两大利器:dplyr和tidyr

1 dplyr 简介

dplyr是Hadley Wickham设计,创建和维护的数据处理包。
它提供了一些易于使用,功能强大的函数集,方便对数据进行管理和探索。

dplyr常用函数:

  • select():选择所需列

  • filter():选择所需行

  • mutate():添加新列

  • arrange():改变行的顺序

  • summarise():聚合操作,常与group_by()函数结合使用

  • group_by():分组函数

  • inner_join():内连接操作

  • left_join():左连接操作

  • right_join():右连接操作

2 tidyr简介

tidyr是Hadley Wickham创建用于数据整理的包。它通常与dplyr包结合使用。

tidyr常用函数:

  • gather():宽数据转换为长数据

  • spread():长数据转换为宽数据

参考资料:
1 https://www./packages/dplyr/versions/0.7.3
2 https://www./data-manipulation-with-tidyr/

您在阅读中,关于dplyr和tidyr包有什么见解,请评论。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多