將漢字轉爲漢語拼音

將漢字轉爲漢語拼音

基本用途:將中文轉換爲拼音,最主要用途就是名稱。例如:淘寶,在搜索框中輸入 “手機”兩個字,下面就會查詢出各種各樣的手機。重新輸入 shouji,下面依然能夠查詢出於手機相關的信息。當我們存儲商品名稱的時候,就可以創建兩個字段,一箇中文字段,一個英文字段。將商品的中文名稱轉換爲拼音保存,這樣搜索的時候,無論是拼音還是中文名稱都可以檢索到了。

  • 引入jar
<dependency>
    <groupId>com.belerweb</groupId>
    <artifactId>pinyin4j</artifactId>
    <version>2.5.0</version>
</dependency>
package com.atguigu.mp.test;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
 
/**
 * @author yangxin_ryan
 * 漢語轉換成拼音類
 */
public class HanyuPinyinUtil {
 
    private Log LOG = LogFactory.getLog(HanyuPinyinUtil.class);
 
    /**
     * 將文字轉爲漢語拼音
     * @param ChineseLanguage 要轉成拼音的中文
     */
    public String toHanyuPinyin(String ChineseLanguage){
        char[] cl_chars = ChineseLanguage.trim().toCharArray();
//        定義變量保存生成的漢語拼音
        String hanyupinyin = "";
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); // 輸出拼音全部小寫
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); // 不帶聲調
        defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_V) ;
        try {
            for (int i=0; i<cl_chars.length; i++){
                if (String.valueOf(cl_chars[i]).matches("[\u4e00-\u9fa5]+")){// 如果字符是中文,則將中文轉爲漢語拼音
//                  將生成的拼音保存到變量中,並將每個漢語拼音之間用空格隔開
                    hanyupinyin += PinyinHelper.toHanyuPinyinStringArray(cl_chars[i], defaultFormat)[0]+" ";
                } else {// 如果字符不是中文,則不轉換
                    hanyupinyin += cl_chars[i];
                }
            }
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            LOG.info("字符不能轉成漢語拼音");
        }
        return hanyupinyin;
    }
 
    /**
     * 轉換拼音字符串中第一個爲大寫
     * @param ChineseLanguage
     * @return
     */
    public String getFirstLettersUp(String ChineseLanguage){
        return getFirstLetters(ChineseLanguage ,HanyuPinyinCaseType.UPPERCASE);
    }
 
    /**
     * 轉換拼音字符串第一個爲小寫
     * @param ChineseLanguage
     * @return
     */
    public String getFirstLettersLo(String ChineseLanguage){
        return getFirstLetters(ChineseLanguage ,HanyuPinyinCaseType.LOWERCASE);
    }
 
    /**
     * 獲取第一個位置
     * @param ChineseLanguage
     * @param caseType
     * @return
     */
    public String getFirstLetters(String ChineseLanguage,HanyuPinyinCaseType caseType) {
        char[] cl_chars = ChineseLanguage.trim().toCharArray();
        String hanyupinyin = "";
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        defaultFormat.setCaseType(caseType);// 輸出拼音全部大寫
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 不帶聲調
        try {
            for (int i = 0; i < cl_chars.length; i++) {
                String str = String.valueOf(cl_chars[i]);
                if (str.matches("[\u4e00-\u9fa5]+")) {// 如果字符是中文,則將中文轉爲漢語拼音,並取第一個字母
                    hanyupinyin += PinyinHelper.toHanyuPinyinStringArray(cl_chars[i], defaultFormat)[0].substring(0, 1);
                } else if (str.matches("[0-9]+")) {// 如果字符是數字,取數字
                    hanyupinyin += cl_chars[i];
                } else if (str.matches("[a-zA-Z]+")) {// 如果字符是字母,取字母
                    hanyupinyin += cl_chars[i];
                } else {// 否則不轉換
                    hanyupinyin += cl_chars[i];//如果是標點符號的話,帶着
                }
            }
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            LOG.error("字符不能轉成漢語拼音");
        }
        return hanyupinyin;
    }
 
    /**
     * 獲取拼音字符串
     * @param ChineseLanguage
     * @return
     */
    public String getPinyinString(String ChineseLanguage){
        char[] cl_chars = ChineseLanguage.trim().toCharArray();
        String hanyupinyin = "";
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);// 輸出拼音全部大寫
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 不帶聲調
        try {
            for (int i = 0; i < cl_chars.length; i++) {
                String str = String.valueOf(cl_chars[i]);
                if (str.matches("[\u4e00-\u9fa5]+")) {// 如果字符是中文,則將中文轉爲漢語拼音,並取第一個字母
                    hanyupinyin += PinyinHelper.toHanyuPinyinStringArray(
                            cl_chars[i], defaultFormat)[0];
                } else if (str.matches("[0-9]+")) {// 如果字符是數字,取數字
                    hanyupinyin += cl_chars[i];
                } else if (str.matches("[a-zA-Z]+")) {// 如果字符是字母,取字母
 
                    hanyupinyin += cl_chars[i];
                } else {// 否則不轉換
                }
            }
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            LOG.error("字符不能轉成漢語拼音");
        }
        return hanyupinyin;
    }
    /**
     * 取第一個漢字的第一個字符
     * @Title: getFirstLetter
     * @Description: TODO
     * @return String
     * @throws
     */
    public String getFirstLetter(String ChineseLanguage){
        char[] cl_chars = ChineseLanguage.trim().toCharArray();
        String hanyupinyin = "";
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
        defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);// 輸出拼音全部大寫
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);// 不帶聲調
        try {
            String str = String.valueOf(cl_chars[0]);
            if (str.matches("[\u4e00-\u9fa5]+")) {// 如果字符是中文,則將中文轉爲漢語拼音,並取第一個字母
                hanyupinyin = PinyinHelper.toHanyuPinyinStringArray(
                        cl_chars[0], defaultFormat)[0].substring(0, 1);;
            } else if (str.matches("[0-9]+")) {// 如果字符是數字,取數字
                hanyupinyin += cl_chars[0];
            } else if (str.matches("[a-zA-Z]+")) {// 如果字符是字母,取字母
 
                hanyupinyin += cl_chars[0];
            } else {// 否則不轉換
 
            }
        } catch (BadHanyuPinyinOutputFormatCombination e) {
            LOG.error("字符不能轉成漢語拼音");
        }
        return hanyupinyin;
    }
 
    /**
     * 測試程序入口
     * @param args
     */
    public static void main(String[] args) {
        HanyuPinyinUtil hanyuPinyinUtil = new HanyuPinyinUtil();
        System.out.println(hanyuPinyinUtil.toHanyuPinyin("測試漢語字符串"));
    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章