分享

Python 读取大文件

 文炳春秋 2020-10-16

https://www.jianshu.com/p/560ff3adfee3

Python 读取文件一般可以使用 read()readlines(),但这两种方法在读取大文件时都会存储内存缺陷。

1. read() 接口的问题

f = open(filename, 'rb')f.read()

我们来读取 1 个规模为 3Gb 大小的文件,如人的参考基因组序列(hg19.fa)。read() 方法执行的操作,是一次性全部读入内存,显然会造成:MemoryError,也即会发生内存溢出!

2. readlines() 接口的问题

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多