注意:Tie::File模块不适用于处理存放大量短小记录的文件!! 这里所说的记录型文件,是指文件读写时的最小单位是记录而不是通常的字节。数据记录之间以记录分隔符隔开,故要求文件有效数据的内容不会与记录分隔符相混 淆。通常我们使用的文本文件就属于记录型文件,它的记录分隔符在win32下是\r\n序列,在unix下则是\n。对于记录型文件,Perl提供了一个 模块Tie::File将文件同一个数组关联起来,对数组进行操作就等价于对文件本身进行操作,数组内容所有的改变都会立即反映在文件中。更令人兴奋的是 同文件相关的这个数组是一个“虚拟”数组,本身并不会占用多少空间,因此即使操作数以GB计的文件也十分轻松。其用法如下: use strict; use warnings; use Tie::File; my @lines; # 文件关联数组 my $filename='./test.dat'; # 记录文件名 tie(@lines,'Tie::File',$filename) or die; # 将记录文件同数组关联,默认为文本型文件 # 记录分隔符使用"\r\n"或"\n" $lines[0]="Hello"; # 这里对数组内容的操作就直接反映到文件中去了 $lines[1]="world!"; # 增加一条新记录 splice(@lines,1,0,"insert another line"); # 在老记录之间插入记录 print "$lines[1]\n"; # 读出已有记录的内容 $lines[0].=" folks"; # 修改已有记录的内容 delete $lines[0]; # 删除记录 untie(@lines); # 解除文件同数组的关联 这就是对文本文件的一系列操作,可以看出该模块使用起来十分灵活简便。除此之外模块还有几个选项可以调整细节行为,常用选项如下: recsep 用于指定记录分隔符,分隔符可以是任意字符串。每条记录写入文件时都会自动附加上一个记录分隔符,如果记录内容本身已经附加有分隔符则会忽略(模块不对这 一行为作任何担保,最好不要自行附加记录分隔符),读出记录内容时会自动去除分隔符(由autochomp选项控制)。默认的记录分隔符是"\r\n" 或"\n",我们可以任意改变它以适应自己的需求。唯一需要注意的地方就是记录分隔符不可与有效数据内容混淆,也不能为空(没有记录分隔符就谈不上记录型 文件了)。比如我们可以用C语言存放字符串的形式将字符串写入文件: tie(@lines,'Tie::File',$filename,recsep=>chr(0)) or die push(@lines,"Hello,world!"); push(@lines,"That's all, folks!"); 也可以用特定的字节序列作为分隔符,在文件中存放二进制数据: tie(@lines,'Tie::File',$filename,recsep=>pack("C*",0xff,0x0,0xff,0x0)) or die $lines[0]=pack("C*",0xaa,0xbb,0xcc,0xdd,0xee); autochomp 指定读出记录时是否去除记录分隔符,为真值时会自动去除分隔符。如: tie(@lines,'Tie::File',$filename,autochomp=>0) or die; # 保留记录分隔符 print "'$lines[0]'\n"; # 打印出的内容会包含回车符 除此之外还有mode、memory、dw_size等选项。另外在指定选项时可以在选项前加一个“-”号,即tie(...,-recsep=& gt;...)和tie(...,recsep=>...)这两种形式是等价的。对该模块的进一步说明请参考perldoc Tie::File -- 出塞 王昌龄 秦时明月汉时关,万里长征人未还。 但使龙城飞将在,不教胡马度阴山。 ※ 修改:·chaoslawful 于 Aug 4 23:38:22 修改本文·[FROM: 222.81.18.71] ※ 来源:·BBS 水木清华站 smth.org·[FROM: 222.81.19.69] |
|