分享

ICONV用 法

 木芙蓉的图书馆 2011-07-29
iconv命令可以将一种已知的字符集文件转换成另一种已知的字符集文件。
例如:从GB2312转换为UTF-8。

用法: iconv [选项...] [文件...]
Convert encoding of given files from one encoding to another.
输入/输出格式规范:
  -f, --from-code=NAME       原始文本编码
  -t, --to-code=NAME         输出编码
信息:
  -l, --list                 列举所有已知的字符集
输出控制:
  -c                         从输出中忽略无效的字符
  -o, --output=FILE          输出文件
  -s, --silent               suppress warnings
      --verbose              打印进度信息
  -?, --help                 给出该系统求助列表
      --usage                给出简要的用法信息
  -V, --version              打印程序版本号
Mandatory or optional arguments to long options are also mandatory or optional
for any corresponding short options.
用“glibcbug”脚本将错误报告给 <bugs@gnu.org>。

指令:
#iconv -f GB2312 -t UTF-8 gb1.txt >gb2.txt 将gb1里的编码从GB2312转化成UTF-8  并重定向到gb2.txt


在linux下其实也可以完成这样的工作

这个命令就是iconv
例如要将一个编码格式是GB2312的文本文件foo.txt转成BIG5的内码可以用
iconv -f GB2312 -t BIG5 foo.txt > foo1.txt
这样新的文件foo1.txt就是BIG5内码的了

将内码是BIG5的文件foo.txt转成GB2312的内码用
iconv -f BIG5 -t GB2312 foo.txt >foo2.txt

将GB2312内码文件转成UTF-8
iconv -f GB2312 -t UTF-8 foo.txt >foo3.txt

最后是批量转换,将一个目录下所有的文件转换成我们需要的内码
假设当前目录下有foo1.txt foo2.txt foo3.txt.... foon.txt都是GB2312内码
将他们全部专程BIG5内码,并在后面加上BIG5作为后缀
创建一个脚本gb2312_2_big5.sh,内容如下

ls *.txt |while read i
do iconv -f GB2312 -t BIG5 $i>$i.big5
done

保存之后执行
sh gb2312_2_big5.sh
即可完成转换

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多