各位客官姥爷好,欢迎回来。我们之前的内容一直围绕着正则表达式展开,这次我们就讲点别的。既然我的公众号名称叫做转行学数据分析,那么我们今天就来讲讲数据分析有关的,一个常见的Python的数据分析库--Pandas库 1. Pandas的介绍 Pandas是python中的一个数据分析包,Pandas的名称来源于面板数据(Panel Aata)和python数据分析(Data Analysis)。支持数据的增、 删、查、改,并且带有丰富的数据处理函数,支持灵活处理缺失数据等。目前是python下最强大的数据分析工具。 这里有两个关键词:面板数据和数据分析。 2. 面板数据 什么是面板数据呢? 面板数据具有时间序列和截面两个维度, 当这类数据按照这两个维度排列时, 整个表格像是一个面板, 所以称作"面板数据". 也就是说. 它是将时间序列数据和截面数据综合化的一种数据形式. 1)时间序列数据: 是某一事物在不同时间上收集的数据, 根据观察时间的不同, 时间序列数据中的时间可以是年份、季度、月份或其他任何时间形式. 比如XXXX有限公司A厂区的销售额就是时间序列数据: 2)截面数据: 不同主体在同一时间点或同一时间段的数据, 也称为静态数据. 比如XXXX有限公司四个厂区在第一季度的销售额就是截面数据: 3)面板数据: 将XXXX有限公司销售额按照时间序列和截面两个维度排列: 可以把面板数据看成是m*n的矩阵, 即m个时间序列上,取n个截面对象的某项数据指标. 3. 数据分析 数据分析是一个过程,根据实际需求收集相应的数据,随后将收集到的原始数据经过处理、转换、分析成对决策有用的信息。 主要包括:明确目的、数据收集、数据处理、数据分析与展现、撰写报告这五大步骤。而我们的Pandas库主要负责数据的处理、数据分析与展现这两大环节。 到目前为止,我们了解了Pandas库的介绍,下面我们进入Pandas库的安装环节。 4. Pandas库的安装 1)安装环境 需先安装好Python并配置好环境变量等。 2)pip安装命令 在CMD命令行窗口执行以下命令: pip install pandas 安装成功,到这里pandas的介绍与安装就介绍完毕了,后续会讲Pandas的用法。 以上就是本次的分享,欢迎各位客官姥爷关注我,方便您第一次时间收到【干货】! |
|