分享

正则表达式

 freety 2013-11-21

有同事在公司的OA上发了个贴子,介绍在javascript中如何得到中英文混合字符串的长度。

用的是正则表达式。

var str = ”坦克是tank的音译”;

var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;

我查了一下书,有点明白了:

西文常用字符集由空格“ ”(0x20)到“~”(0x7e)构成,汉字会落在这个字符集外,而正则表达式[^ -~]表示除空格到“~”外的字符集。

string.match(regex) 会以数组形式返回字符串string中匹配正则表达式regex的子串,所以,

str.match(/[^ -~]/g)会以数组的形式返回一个个汉字。例如

var str = "dd大哥";

//显示"大,哥",数组中返回两个汉字,数组长度为2

alert(str.match(/[^ -~]/g));

 这样,var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;就可以得到str的正确长度了。

在javascript中,一个汉字的长度也被计算为1,常常在提交到数据库中造成长度超标的错误,现在用这个方法,可以在提交前先检测一番了。


这个是去掉回车的字符长度的计算的方法
 var noteLen = note.match(/[^\r|\n| -~]/g) == null ? note.replace(/[\r|\n]/g,"").length : note.replace(/[\r|\n]/g,"").length + note.match(/[^\r|\n| -~]/g).length ;

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多