Python中用Pandas进行数据分析,最常用的就是Dataframe数据结构,之前写过一篇文章介绍Pandas的基本用法,后来有些朋友问Pandas怎么从数据库中读取数据,怎么从文件中读取数据之类的问题,因此单独开篇文章介绍Pandas如何读取数据到Dataframe。
1. Pandas读取Mysql数据
要读取Mysql中的数据,首先要安装Mysqldb包。假设我数据库安装在本地,用户名位myusername,密码为mypassword,要读取mydb数据库中的数据,那么对应的代码如下:
1 2 3 4 5 | import pandas as pd import MySQLdb mysql_cn = MySQLdb.connect(host = 'localhost' , port = 3306 ,user = 'myusername' , passwd = 'mypassword' , db = 'mydb' ) df = pd.read_sql( 'select * from test;' , con = mysql_cn) mysql_cn.close() |
上面的代码读取了test表中所有的数据到df中,而df的数据结构为Dataframe。
2. Pandas读取csv文件数据
Pandas读取csv文件中的数据要简单的多,不用额外安装程序包,假设我们要读取test.csv中的数据, 对应的代码如下:
1 | df = pd.read_csv(loggerfile, header = None , sep = ',' ) |
header=None表示没有头部,sep=’,’表示字段之间的分隔符为逗号。