分享

Java 正则中的(.*?)vs(.*)

 ProgramCat 2015-12-09

[java]
public static void main(String[] args) { 
 
        //选择最小和最大重复次数  
        String a="{user=\"administrator\",password=\"root\"}"; 
        String b="user   =\"a\"";//注意=号之间有空格  
        String c="user\r\n=\"c\"";//注意有换行符号  
         
        //获取双引号之间的内容,分别获得a,b,c中的所有的用户的名称  
        String regex="(?s)user.*?=(\".*?\")"; 
        match(regex,a);//user="administrator"  
        match(regex,b);//user   ="a"  
        match(regex,c);//user  
                       //="c"  
         
        //上面的非常简单,注意以下事例  
        //选择最小和最大重复数  
        //注意以下几点,user =这个之间可能有空格  
        //我们需要的结果是找出user='xxx'的信息,其余不要  
        String notice="[{user='admin',password='admin'}," + 
                       "{user='yhc',password='yhc'}]"; 
        //也许大家会觉得.*?为什么需要?号,那么一下我们看看  
        //有?和没有?的区别  
        String regex1="user.*='(.*?)'";//user.*=之间没有?  
        match(regex1, notice); 
        //输出结果(错误):user='admin',password='admin'},{user='yhc',password='yhc'  
         
        String regex2="user.*?='(.*?)'";//user.*=之间有?  
        match(regex2, notice); 
        //输出结果(正确):  
        //user='admin'  
        //user='yhc'  
         
        //为什么上面就因为一个?号而有这么大的区别咧?  
        //解释以上代码运行机制  
        //有了匹配文本中的第一个user之后,引擎就会到达(.*),其中点号(.)可以  
        //匹配任意字符,其中包括换行符,星号(*)则把它重复0次或更多次,请注意,  
        //这里的星号(*)是贪心的,因此点星(.*)会匹配直到目标文件结束的所有的  
        //内容,注意=====>>>>(.*)会吃了所有的目标文件内容,从第一个匹配  
        //user的地方开始;  
         
        //当(.*)把肚子吃饱之后,引擎才会试图去匹配在目标文本末尾的=  
        //这个表达式,当然,一定会匹配失败,但这并不会代表此次匹配就结束了,  
        //正则引擎会进行回溯backtrack,当匹配某一个位置之后  
        //,正则表达式都会保存一个回溯位置,如果正则表达式匹配之后的文本失败后  
        //那么正则引擎还可以回到这些位置  
        //当=匹配匹配失败之后,引擎进行回溯,让(.*)放弃它的匹配中的一个  
        //字符接着=会被再次尝试匹配,这次在文本中的最后一个字符的位置,  
        //如果依然失败的话,那么引擎会再一次进行回溯在文件的倒数第2个字符出尝试匹配  
        //这个过程会一直继续,直到=匹配成功位置,如果一直没有匹配成功,那么最终(.*)  
        //会用完所有的回溯位置,然后正则匹配失败  
         
        //如果在整个回溯的过程中=在某个点匹配成功,那么就会接着尝试匹配'如果'匹配  
        //失败,引擎接着进行回溯,这个过程会一直重复,直到='(.*?)'可以被匹配为止  
         
        //问题就出现在.*上,因为星号是贪心的,所以你们要注意哦!  
        //我们需要使用lazy 懒惰 可以在后面放一个?使其变为懒惰  
        //例如:(*?),(+?),(??) ,{1,100}? 都可以将其变为懒惰   
         
    } 
     
    public static void match(String regex,String input){ 
            //创建正则对象  
            Pattern pattern=Pattern.compile(regex); 
            //匹配对象  
            Matcher matcher=pattern.matcher(input); 
            //输出匹配字符串  
            while(matcher.find()){ 
                System.out.println(matcher.group()); 
            } 
    } 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多