python切割文件，我的''大马士革刀'' ！

flyk0tcfb46p9f 2019-03-24

展开全文

在大型项目中，经常需要执行数据库脚本，有些脚本特别大。如几十兆的sql文件，盲目地执行可能会导致很多的问题。如：

1）进度不可控，时间难把握。

2）脚本中间出现差错，导致后续报错，甚至跑错语句。

3）有重启工程，意外宕机，就会中断执行任务。

4）不利于检查和完善。

如果能够将这么大sql文件进行切割，分成多个小任务，每天按照计划跑，以上问题基本可以得到解决。

安老师通过实战总结了一些经验，下面就开始为大家介绍如何精准切割文件。

大纲

1. 使用os.path模块和open模块

2. 切割文件演示

使用os.path模块和open模块

1. os.path模块

2. open模块

切割文件演示

1. 演示场景

本次默认Windows切割文件，演示的图片如下

1.1 原文件

文件路径 F:\python\py自动化运维\公众号\5 python切割文件\test.sql

文件首部(图一,总1416行，此sql脚本为数据库劈2016年的月分区。)

文件尾部(图二)

2. 切割文件代码

1import os 2import time 3 4def mkSubFile(bufferline, filenamepath, num): 5 [desfilename, typename] = os.path.splitext(filenamepath) 6 nfilename = desfilename + '_' + str(num) + typename 7 print('make file: %s' % nfilename) 8 scriptfile = open(nfilename, 'w') 9 try:10 scriptfile.writelines(bufferline)11 return num + 112 finally:13 scriptfile.close()1415def splitByLineCount(filenamepath, count):16 filename = open(filenamepath, 'r')17 try:18 bufferline = []19 num = 120 filename.seek(0)21 for line in filename:22 bufferline.append(line)23 if len(bufferline) == count and num >=1 :24 num = mkSubFile(bufferline, filenamepath, num)25 bufferline = []26 if len(bufferline) != count and num >=1 :27 num = mkSubFile(bufferline, filenamepath, num)28 finally:29 filename.close()3031if __name__ == '__main__':32 begin = time.time()33 filenamepath = r'F:\python\py自动化运维\公众号\5 python切割文件\test.sql'34 splitByLineCount(filenamepath, 500)35 end = time.time()36 print('time is %d seconds ' % (end - begin))

2.1 重点代码详解

1）执行流

begin = time.time() 开始切割时间

filenamepath 需要被切割的文件路径

splitByLineCount(filenamepath, 500) 切割函数(被切割文件路径，满500行切割文件)

end = time.time() 结束切割时间

1）第5行 os.path.splitext 拆分原文件路径，得到文件名和扩展名

2）第6行标记切割第几个文件

3）第8行 scriptfile = open(nfilename, 'w') 开始写入文件

4）第11行 return num + 1 返回num值，下次切割文件为num+1值

5）第18行 bufferline = []，新建数组，记录读取行数值

6）第19行 num = 1，第一个切割文件