分享

pinyin4j简介

 Blex 2011-04-07

pinyin4j的主页:http://pinyin4j./

pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。

特征:

1. 支持多种拼音系统:

 

  • 汉语拼音
  • 通用拼音
  • 威氏拼音
  • 注音二式
  • 雅礼
  • 国语罗马字

2. 支持多音字

    能够根据上下文获得正确的拼音

3. 支持多种拼音格式

 

  • 大小写
  • 支持unicode ü 、v 和 u
  • 支持数字音调(lü3)、音调符号 (lǚ)和无音调标识(lü)

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class Pinyin
{
/**
* 将汉字转换为全拼
*
* @param src
* @return String
*/
public static String getPinYin(String src)
{
   char[] t1 = null;
   t1 = src.toCharArray();
   // System.out.println(t1.length);
   String[] t2 = new String[t1.length];
   // System.out.println(t2.length);
   // 设置汉字拼音输出的格式
   HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
   t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
   t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
   t3.setVCharType(HanyuPinyinVCharType.WITH_V);
   String t4 = "";
   int t0 = t1.length;
   try
   {
    for (int i = 0; i < t0; i++)
    {
     // 判断能否为汉字字符
     // System.out.println(t1[i]);
     if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+"))
     {
      t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中
      t4 += t2[0];// 取出该汉字全拼的第一种读音并连接到字符串t4后
     }
     else
     {
      // 如果不是汉字字符,间接取出字符并连接到字符串t4后
      t4 += Character.toString(t1[i]);
     }
    }
   }
   catch (BadHanyuPinyinOutputFormatCombination e)
   {
    // TODO Auto-generated catch block
    e.printStackTrace();
   }
   return t4;
}

/**
* 提取每个汉字的首字母
*
* @param str
* @return String
*/
public static String getPinYinHeadChar(String str)
{
   String convert = "";
   for (int j = 0; j < str.length(); j++)
   {
    char word = str.charAt(j);
    // 提取汉字的首字母
    String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
    if (pinyinArray != null)
    {
     convert += pinyinArray[0].charAt(0);
    }
    else
    {
     convert += word;
    }
   }
   return convert;
}

/**
* 将字符串转换成ASCII码
*
* @param cnStr
* @return String
*/
public static String getCnASCII(String cnStr)
{
   StringBuffer strBuf = new StringBuffer();
   // 将字符串转换成字节序列
   byte[] bGBK = cnStr.getBytes();
   for (int i = 0; i < bGBK.length; i++)
   {
    // System.out.println(Integer.toHexString(bGBK[i] & 0xff));
    // 将每个字符转换成ASCII码
    strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
   }
   return strBuf.toString();
}

public static void main(String[] args)
{
   String cnStr = "嘅囧誰說壞學生來勼髮視頻裆児";
   System.out.println(getPinYin(cnStr));
   System.out.println(getPinYinHeadChar(cnStr));
   System.out.println(getCnASCII(cnStr));
}
}

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多