分享

Python 读取csv的某列 | LFhacks.com

 乙甲壬 2020-07-06

CSV 本质上是文本文件,能提供与 Excel 的表格类似的二维数据结构。因为是文本文件,读写都比 Excel 方便容易的多,经常拿来作为数据的中转格式。本文讨论如何快速有效的按列读取 CSV 文件。

站长用Python写了一个可以提取csv任一列的代码。
https://github.com/pilicurg/GetCsvColumn

假设“A.csv“文件内容是:

No.,Name,Age,Score1,Apple,12,982,Ben,13,973,Celia,14,964,Dave,15,95

用 Excel 打开这个 csv, 看起来是这样的:

利用Python自带的 csv 模块 ,有两种方法可以提取其中的一列:

方法一 reader函数

第一种方法使用reader函数,接收一个可迭代的对象(比如csv文件),能返回一个生成器,就可以从其中解析出csv的内容:比如下面的代码可以读取csv的全部内容,以行为单位:

import csvwith open('A.csv','rb') as csvfile:    reader = csv.reader(csvfile)    rows= [row for row in reader]print rows

得到:

[['No.', 'Name', 'Age', 'Score'],['1', 'Apple', '12', '98'],['2', 'Ben', '13', '97'],['3', 'Celia', '14', '96'],['4', 'Dave', '15', '95']]

要提取其中某一列,可以用下面的代码:

import csvwith open('A.csv','rb') as csvfile:    reader = csv.reader(csvfile)    column = [row[2] for row in reader]print column

得到:

['Age', '12', '13', '14', '15']

注意从csv读出的都是str类型。这种方法要事先知道列的序号,比如Age在第2列,而不能根据’Age’这个标题查询。所以,这种方法适合读取记录,而不适合按列的方向读取csv文件。这时可以采用第二种方法,即DictReader:

方法二 DictReader

第二种方法是使用DictReader,和reader函数类似,接收一个可迭代的对象,能返回一个生成器,但是返回的每一个单元格都放在一个字典的值内,而这个字典的键则是这个单元格的标题(即列头)。用下面的代码可以看到DictReader的结构:

import csvwith open('A.csv','rb') as csvfile:    reader = csv.DictReader(csvfile)    column = [row for row in reader]print column

得到:

[{'Age': '12', 'No.': '1', 'Score': '98', 'Name': 'Apple'},{'Age': '13', 'No.': '2', 'Score': '97', 'Name': 'Ben'},{'Age': '14', 'No.': '3', 'Score': '96', 'Name': 'Celia'},{'Age': '15', 'No.': '4', 'Score': '95', 'Name': 'Dave'}]

如果我们想用DictReader读取csv的某一列,就可以用列的标题查询:

import csvwith open('A.csv','rb') as csvfile:    reader = csv.DictReader(csvfile)    column = [row['Age'] for row in reader]print column

就得到:

['12', '13', '14', '15']

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多