PinYin4J 使用

package test;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class TestPinYin4J {

 /**
  * 將漢字轉換爲全拼
  *
  * @param src
  * @return String
  */
 public static String getPinYin(String src) {
  char[] t1 = null;
  t1 = src.toCharArray();
  // System.out.println(t1.length);
  String[] t2 = new String[t1.length];
  // System.out.println(t2.length);
  // 設置漢字拼音輸出的格式
  HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
  t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
  t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  t3.setVCharType(HanyuPinyinVCharType.WITH_V);
  StringBuilder sb = new StringBuilder();
  int t0 = t1.length;
  try {
   for (int i = 0; i < t0; i++) {
    // 判斷能否爲漢字字符
    // System.out.println(t1[i]);
    if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+")) {
     t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 將漢字的幾種全拼都存到t2數組中
     sb.append(t2[0]);// 取出該漢字全拼的第一種讀音並連接到字符串t4後
    } else {
     // 如果不是漢字字符,間接取出字符並連接到字符串t4後
     sb.append(Character.toString(t1[i]));
    }
   }
  } catch (BadHanyuPinyinOutputFormatCombination e) {
   e.printStackTrace();
  }
  return sb.toString();
 }

 /**
  * 提取每個漢字的首字母
  *
  * @param str
  * @return String
  */
 public static String getPinYinHeadChar(String str) {
  StringBuilder convert = new StringBuilder();
  for (int j = 0; j < str.length(); j++) {
   char word = str.charAt(j);
   // 提取漢字的首字母
   String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
   if (pinyinArray != null) {
    convert.append( pinyinArray[0].charAt(0) );
   } else {
    convert.append(word);
   }
  }
  return convert.toString();
 }

 /**
  * 將字符串轉換成ASCII碼
  *
  * @param cnStr
  * @return String
  */
 public static String getCnASCII(String cnStr) {
  StringBuilder strBuf = new StringBuilder();
  // 將字符串轉換成字節序列
  byte[] bGBK = cnStr.getBytes();
  for (int i = 0; i < bGBK.length; i++) {
   // System.out.println(Integer.toHexString(bGBK[i] & 0xff));
   // 將每個字符轉換成ASCII碼
   strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
  }
  return strBuf.toString();
 }

 public static void main(String[] args) {
  String cnStr = "哈哈";
  System.out.println(getPinYin(cnStr));
  System.out.println(getPinYinHeadChar(cnStr));
  System.out.println(getCnASCII(cnStr));
 }
}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章