本拉是Java中取漢字拼音的首字母 ,現在是net中取漢字拼音的首字母

說明:用來取漢字拼音首字母的一個java類,舉例如:漢字"中華人民共和國"取漢字拼音首字母的結果是ZHRMGHG。

程序如下:

package gov.mca;

/**
 * Created by IntelliJ IDEA.
 * User: 裴賀先
 * Date: 2004-5-17
 * Time: 10:59:59
 * ClassDescription:取出漢字字符串的拼音首字母
 */

import java.lang.*;

public class GB2Alpha {

    //字母Z使用了兩個標籤,這裏有27個值
    //i, u, v都不做聲母, 跟隨前面的字母
    private char[] chartable =
            {
                '啊', '芭', '擦', '搭', '蛾', '發', '噶', '哈', '哈',
                '擊', '喀', '垃', '媽', '拿', '哦', '啪', '期', '然',
                '撒', '塌', '塌', '塌', '挖', '昔', '壓', '匝', '座'
            };

    private char[] alphatable =
            {
                'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I',

                'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z'
            };


    private int[] table = new int[27];

    //初始化
    {
        for (int i = 0; i < 27; ++i) {
            table[i] = gbValue(chartable[i]);
        }
    }

    public GB2Alpha() {

    }

    //主函數,輸入字符,得到他的聲母,
    //英文字母返回對應的大寫字母
    //其他非簡體漢字返回 '0'

    public char Char2Alpha(char ch) {

        if (ch >= 'a' && ch <= 'z')
            return (char) (ch - 'a' + 'A');
        if (ch >= 'A' && ch <= 'Z')
            return ch;


        int gb = gbValue(ch);
        if (gb < table[0])
            return '0';


        int i;
        for (i = 0; i < 26; ++i) {
            if (match(i, gb))
                break;
        }

        if (i >= 26)
            return '0';
        else
            return alphatable[i];
    }

    //根據一個包含漢字的字符串返回一個漢字拼音首字母的字符串
    public String String2Alpha(String SourceStr) {
        String Result = "";
        int StrLength = SourceStr.length();
        int i;
        try {
            for (i = 0; i < StrLength; i++) {
                Result += Char2Alpha(SourceStr.charAt(i));
            }
        } catch (Exception e) {
            Result = "";
        }
        return Result;
    }

    private boolean match(int i, int gb) {
        if (gb < table[i])
            return false;

        int j = i + 1;

        //字母Z使用了兩個標籤
        while (j < 26 && (table[j] == table[i]))
            ++j;

        if (j == 26)
            return gb <= table[j];
        else
            return gb < table[j];

    }

    //取出漢字的編碼
    private int gbValue(char ch) {
        String str = new String();
        str += ch;
        try {
            byte[] bytes = str.getBytes("GB2312");
            if (bytes.length < 2)
                return 0;
            return (bytes[0] << 8 & 0xff00) + (bytes[1] &
                    0xff);
        } catch (Exception e) {
            return 0;
        }

    }


    public static void main(String[] args) {
        com.mkrx.GB2Alpha obj1 = new GB2Alpha();
        System.out.println(obj1.String2Alpha("測試:中華人民共和國!"));
        System.out.println(obj1.String2Alpha("裴賀先"));
        return;
    }
}

 


本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/peihexian/archive/2004/05/31/5026.aspx

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章