分享

求两字符串的公共子串

 WindySky 2008-09-28
求两字符串的公共子串,如abc123与123456的公共字串为123,基本想法是在长的字符串前面加上长度等于短字符串的空格前缀,然后拿短字符串与新字符串挨个匹配,匹配上的置上匹配字符,否则置上空格,这样的新串就包含了匹配字串和空格,再劈分放入set即可,重复的元素会被set略过去。

代码如下:
package com.sitinspring;

import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

/**
 * 求两字符串的公共子串,如abc123与123456的公共字串为123
 * 
 * 
@author sitinspring(junglesong@gmail.com)
 * 
@since 2008-6-12 下午02:04:06
 * @vsersion 1.00 创建 sitinspring 2008-6-12 下午02:04:06
 
*/

public class CommonChildString{
    
private static final char Space = ' ';
    Set
<String> commonChildStrSet;

    
public CommonChildString(String str1,String str2){
        
// 在str1前加上与str2等长的空格,以免漏过前面的共同字串,这样做让str1也必然比str2长了
        str1=getPrefix(str2.length())+str1;

        
// 用来存放匹配字串,set能自动过滤掉重复的元素
        commonChildStrSet=new HashSet<String>();
        
for(int i=0;i<str1.length();i++){
            
// 先取字串
            String childStr=getSubString(str1,i, str2.length());
            
            
// 找字串和str2匹配的部分,匹配不上的位置上空格,如123和1a3匹配完变成1_1
            String commonStr=getCommonString(childStr,str2);
            
            
// 把匹配的结果按空格劈分后加入到Set中
            commonChildStrSet.addAll(getSplitResult(commonStr));
        }

    }

    
    
/**
     * 去掉空格部分,把不是空格的匹配字串取出放入到链表中返回
     * 
@param str
     * 
@return
     
*/

    
public List<String> getSplitResult(String str){
        List
<String> ls=new ArrayList<String>();
        
        str
=str.trim();
        
        String[] arr
=str.split("\\s+");
        
for(String tmp:arr){
            
if(tmp.length()>0){
                ls.add(tmp);
            }

        }

        
        
return ls;
    }

    
    
    
/**
     * 返回长度为为n的空格字符串
     * 
@param n
     * 
@return
     
*/

    
private String getPrefix(int n){
        StringBuffer sb
=new StringBuffer();
        
for(int i=0;i<n;i++){
            sb.append(Space);
        }

        
        
return sb.toString();
    }

    
    
/**
     * 将op1和op2按位比较,相等取哪一位所在的字符,否则留为空格,比较结果返回
     *
     * 
@param op1
     * 
@param op2
     * 
@return
     
*/

    
public String getCommonString(String op1,String op2){
        StringBuffer sb
=new StringBuffer();
        
        
for(int i=0;i<op1.length();i++){
            
char c1=op1.charAt(i);
            
char c2=op2.charAt(i);
            
            sb.append(c1
==c2?c1:Space);
        }

        
        
return sb.toString();
    }

    
    
/**
     * 从str中从startIndex开始截取长度为length的子字符串
     * 
@param str
     * 
@param startIndex
     * 
@param length
     * 
@return
     
*/

    
private String getSubString(String str,int startIndex,int length){
        String strTmp
=str.substring(startIndex);    
        
int n=strTmp.length();
        
return strTmp.substring(0, length>n?n:length);
    }

    
    
public Set<String> getCommonChildStrSet() {
        
return commonChildStrSet;
    }

    
    
/**
     * 测试
     * 
@param args
     
*/

    
public static void main(String[] args){
        String op1
="123abc456";
        String op2
="abcdef123789655";
        CommonChildString commonChildString
=new CommonChildString(op1,op2);
        
// 输出观察
        System.out.print(op1+""+op2+"的匹配字串有:");
        
for(String tmp:commonChildString.getCommonChildStrSet()){
            System.out.print(tmp
+",");
        }

        System.out.print(
"\n");
    }

}

测试结果:
123abc456和abcdef123789655的匹配字串有:5,123,abc,6,

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多