分享

使用Tie::File模块对记录型文件进行原地修改

 cicy000 2013-01-29
注意:Tie::File模块不适用于处理存放大量短小记录的文件!!
  
     这里所说的记录型文件,是指文件读写时的最小单位是记录而不是通常的字节。数据记录之间以记录分隔符隔开,故要求文件有效数据的内容不会与记录分隔符相混 淆。通常我们使用的文本文件就属于记录型文件,它的记录分隔符在win32下是\r\n序列,在unix下则是\n。对于记录型文件,Perl提供了一个 模块Tie::File将文件同一个数组关联起来,对数组进行操作就等价于对文件本身进行操作,数组内容所有的改变都会立即反映在文件中。更令人兴奋的是 同文件相关的这个数组是一个“虚拟”数组,本身并不会占用多少空间,因此即使操作数以GB计的文件也十分轻松。其用法如下:
  
use strict;                                                                      
use warnings;                                                                    
use Tie::File;                                                                    
  
my @lines; # 文件关联数组                                                        
my $filename='./test.dat'; # 记录文件名                                          
  
tie(@lines,'Tie::File',$filename) or die; # 将记录文件同数组关联,默认为文本型文件
                                          
# 记录分隔符使用"\r\n"或"\n"            
  
$lines[0]="Hello"; # 这里对数组内容的操作就直接反映到文件中去了                  
$lines[1]="world!"; # 增加一条新记录                                              
splice(@lines,1,0,"insert another line"); # 在老记录之间插入记录                  
print "$lines[1]\n"; # 读出已有记录的内容                                        
$lines[0].=" folks"; # 修改已有记录的内容                                        
delete $lines[0]; # 删除记录                                                      
  
untie(@lines); # 解除文件同数组的关联                                            
  
这就是对文本文件的一系列操作,可以看出该模块使用起来十分灵活简便。除此之外模块还有几个选项可以调整细节行为,常用选项如下:
  
recsep
     用于指定记录分隔符,分隔符可以是任意字符串。每条记录写入文件时都会自动附加上一个记录分隔符,如果记录内容本身已经附加有分隔符则会忽略(模块不对这 一行为作任何担保,最好不要自行附加记录分隔符),读出记录内容时会自动去除分隔符(由autochomp选项控制)。默认的记录分隔符是"\r\n" 或"\n",我们可以任意改变它以适应自己的需求。唯一需要注意的地方就是记录分隔符不可与有效数据内容混淆,也不能为空(没有记录分隔符就谈不上记录型 文件了)。比如我们可以用C语言存放字符串的形式将字符串写入文件:
tie(@lines,'Tie::File',$filename,recsep=>chr(0)) or die
push(@lines,"Hello,world!");                            
push(@lines,"That's all, folks!");                      
也可以用特定的字节序列作为分隔符,在文件中存放二进制数据:
tie(@lines,'Tie::File',$filename,recsep=>pack("C*",0xff,0x0,0xff,0x0)) or die
$lines[0]=pack("C*",0xaa,0xbb,0xcc,0xdd,0xee);                                
  
autochomp
指定读出记录时是否去除记录分隔符,为真值时会自动去除分隔符。如:
tie(@lines,'Tie::File',$filename,autochomp=>0) or die; # 保留记录分隔符
print "'$lines[0]'\n"; # 打印出的内容会包含回车符                      
  
除此之外还有mode、memory、dw_size等选项。另外在指定选项时可以在选项前加一个“-”号,即tie(...,-recsep=& gt;...)和tie(...,recsep=>...)这两种形式是等价的。对该模块的进一步说明请参考perldoc Tie::File
  
--
               出塞
              王昌龄
  秦时明月汉时关,万里长征人未还。
  但使龙城飞将在,不教胡马度阴山。
  
  
※ 修改:·chaoslawful 于 Aug  4 23:38:22 修改本文·[FROM: 222.81.18.71]
※ 来源:·BBS 水木清华站 smth.org·[FROM: 222.81.19.69]

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多