分享

Python数据分析库-Pandas的介绍与安装

 徐_清风 2021-06-14

各位客官姥爷好,欢迎回来。我们之前的内容一直围绕着正则表达式展开,这次我们就讲点别的。既然我的公众号名称叫做转行学数据分析,那么我们今天就来讲讲数据分析有关的,一个常见的Python的数据分析库--Pandas库

1. Pandas的介绍

    Pandas是python中的一个数据分析包,Pandas的名称来源于面板数据(Panel Aata)和python数据分析(Data Analysis)。支持数据的增、 删、查、改,并且带有丰富的数据处理函数,支持灵活处理缺失数据等。目前是python下最强大的数据分析工具。 

    这里有两个关键词:面板数据数据分析

2. 面板数据

    什么是面板数据呢?

    面板数据具有时间序列和截面两个维度, 当这类数据按照这两个维度排列时, 整个表格像是一个面板, 所以称作"面板数据". 也就是说. 它是将时间序列数据截面数据综合化的一种数据形式.

    1)时间序列数据: 是某一事物在不同时间上收集的数据, 根据观察时间的不同, 时间序列数据中的时间可以是年份、季度、月份或其他任何时间形式.

    比如XXXX有限公司A厂区的销售额就是时间序列数据:

    2)截面数据: 不同主体在同一时间点或同一时间段的数据, 也称为静态数据.

    比如XXXX有限公司四个厂区在第一季度的销售额就是截面数据:

    3)面板数据: 将XXXX有限公司销售额按照时间序列和截面两个维度排列:

    可以把面板数据看成是m*n的矩阵, 即m个时间序列上,取n个截面对象的某项数据指标.

3. 数据分析

    数据分析是一个过程,根据实际需求收集相应的数据,随后将收集到的原始数据经过处理、转换、分析成对决策有用的信息。

    主要包括:明确目的、数据收集、数据处理、数据分析与展现、撰写报告这五大步骤。而我们的Pandas库主要负责数据的处理、数据分析与展现这两大环节。

    到目前为止,我们了解了Pandas库的介绍,下面我们进入Pandas库的安装环节。

4. Pandas库的安装

    1)安装环境

    需先安装好Python并配置好环境变量等。

    2)pip安装命令

    在CMD命令行窗口执行以下命令:

pip install pandas

安装成功,到这里pandas的介绍与安装就介绍完毕了,后续会讲Pandas的用法。

以上就是本次的分享,欢迎各位客官姥爷关注我,方便您第一次时间收到【干货】!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多