分享

采用python批量统计分析Excel表格数据

 鹰击彩霞 2019-11-03

       最近为了做点小事情,需要对12个Excel文件进行处理,每个Excel文件的数据量都非常庞大。所处理的数据是全国196个站点2000年至2011年每天的降水数据,需要根据这些数据统计出每个站点的年降水量以及每年每个月的降水量,如果纯粹采用手工操作Excel表格,显得相当的麻烦,为了简单起见,就用python写了个小程序来帮我自动实现批处理。

      下面就详细的讲述整个实现过程。

      1、在计算机上安装python(x,y)2.6.6版本。这一步是确保机器上的python开发环境,具体的安装过程在此就不在赘述,网上相关资料比较多

      2、建议安装一个Notepad++,这样写代码比较方便

      3、在Notepad++中进行相关的设置,因为python对行缩进符比较敏感,用Tab键和space键混合使用,会导致编译错误,程序无法执行;但是一般tab键和Space键所敲出来的空格是隐藏的,为了编辑方便,就需要在Notepad中将空格符显示出来。设置如下图所示。

     

     4、安装相应的开发包,这里采用的开发包为xlrd-0.9.3包(读取excel)和xlwt-0.7.5包(存写excel,只支持.xls格式,不支持.xlsx格式,如果需要.xlsx格式,请下载更高版本的安装包)。具体的安装过程在此不再赘述,请详见点击打开链接http://blog.csdn.net/dxh0907070012/article/details/23967247

    5、为所要处理的excel文件单独建立一个文件夹。

    6、具体代码如下:

  1. #coding=utf-8
  2. import xlrd
  3. import xlwt
  4. import string
  5. import numpy as np
  6. import os
  7. class OperExcel():
  8. def rExcel(self,inEfile,strfilename,outfile):
  9. rfile=xlrd.open_workbook(inEfile)
  10. table=rfile.sheet_by_index(0)
  11. nrows=table.nrows-1
  12. ncols=table.ncols
  13. stationsheet=xlrd.open_workbook('D://rainfall_deal//stationposition.xlsx')
  14. stationtable=stationsheet.sheet_by_index(0)
  15. nstnrows=stationtable.nrows-1
  16. wb=xlwt.Workbook()
  17. ws=wb.add_sheet('year_month')
  18. month=['1','2','3','4','5','6','7','8','9','10','11','12']
  19. for stationindex in range(1,nstnrows):
  20. eachday_rf=[]
  21. yearsum=0
  22. monthday_rf=[]
  23. eachmon_rf=0
  24. stncode=stationtable.cell(stationindex,0).value
  25. #计算每个站点的年降水总量
  26. for r in range(1,nrows):
  27. if(table.cell(r,0).value==stncode):
  28. strvalue=table.cell(r,4).value
  29. eachday_rf.append(strvalue)
  30. if(table.cell(r,0).value!=stncode):
  31. continue
  32. for k in range(0,len(eachday_rf)):
  33. eachday_rainfall=int(eachday_rf[k])
  34. yearsum=yearsum+eachday_rainfall
  35. del(eachday_rf)
  36. ws.write(stationindex,0,stationtable.cell(stationindex,0).value)
  37. ws.write(stationindex,1,yearsum)
  38. yearsum=0
  39. #计算每个站点每个月的降水总量
  40. for monindex in range(0,len(month)):
  41. for r in range(1,nrows):
  42. if(int(table.cell(r,2).value)==(monindex+1) and table.cell(r,0).value==stncode):
  43. monthday_rf.append(table.cell(r,4).value)
  44. for monrfindex in range(0,len(monthday_rf)):
  45. eachmon_rf=eachmon_rf+int(monthday_rf[monrfindex])
  46. monthday_rf=[]
  47. ws.write(stationindex,monindex+2,eachmon_rf)
  48. eachmon_rf=0
  49. savepth='D://rainfall_deal'
  50. strsavepth=savepth+'//'+strfilename
  51. wb.save(strsavepth)
  52. if __name__ == '__main__':
  53. path='D://rainfall_deal//rainfall_excel'
  54. lista=os.listdir(path)
  55. monthname=['2000','2001','2002','2003','2004','2005','2006','2007','2008','2009','2010','2011']
  56. for k in range(0,len(lista)):
  57. strPth=path+'//'+lista[k]
  58. t = OperExcel()
  59. strfilename='stat_'+monthname[k]+'rf.xls'
  60. t.rExcel(strPth,strfilename,'test')

   7、在dos下面,执行代码。坐等收获想要的数据。

   8、结果如下:

总结:python是一门很有用的语言,能帮助做不少的事情。很容易学。我的这个程序还有不少问题,还望高手指教!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多