`
沙舟狼客
  • 浏览: 158124 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

JAVA将汉字转化成拼音的方法

阅读更多

/** *//**

#############################################################################

# DESCRIBE 将汉字转化成拼音

# DATE 2006-7-12

# COMPANY FLX

# PORJECT JAVA

#############################################################################

*/

import java.util.Iterator;

import java.util.LinkedHashMap;

import java.util.Set;

public class CnToSpell ...{

private static LinkedHashMap spellMap = null;

static ...{

if (spellMap == null) ...{

spellMap = new LinkedHashMap(400);

}

initialize();

System.out.println("Chinese transfer Spell Done.");

}

private CnToSpell() ...{

}

/** *//**

* 获得单个汉字的Ascii.

* @param cn char

* 汉字字符

* @return int

* 错误返回 0,否则返回ascii

*/

public static int getCnAscii(char cn) ...{

byte[] bytes = (String.valueOf(cn)).getBytes();

if (bytes == null || bytes.length > 2 || bytes.length <= 0) ...{ //错误

return 0;

}

if (bytes.length == 1) ...{ //英文字符

return bytes[0];

}

if (bytes.length == 2) ...{ //中文字符

int hightByte = 256 + bytes[0];

int lowByte = 256 + bytes[1];

int ascii = (256 * hightByte + lowByte) - 256 * 256;

return ascii;

}

return 0; //错误

}

/** *//**

* 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换

* @param cnStr String

* 字符串

* @return String

* 转换成全拼后的字符串

*/

public static String getFullSpell(String cnStr) ...{

if (null == cnStr || "".equals(cnStr.trim())) ...{

return cnStr;

}

char[] chars = cnStr.toCharArray();

StringBuffer retuBuf = new StringBuffer();

for (int i = 0, Len = chars.length; i < Len; i++) ...{

int ascii = getCnAscii(chars[i]);

if (ascii == 0) ...{ //ascii时出错

retuBuf.append(chars[i]);

} else ...{

String spell = getSpellByAscii(ascii);

if (spell == null) ...{

retuBuf.append(chars[i]);

} else ...{

retuBuf.append(spell);

} // end of if spell == null

} // end of if ascii <= -20400

} // end of for

return retuBuf.toString();

}

/** *//**

* 根据ASCII码到SpellMap中查找对应的拼音

* @param ascii int

* 字符对应的ASCII

* @return String

* 拼音,首先判断ASCII是否>0&<160,如果是返回对应的字符,

*

否则到SpellMap中查找,如果没有找到拼音,则返回null,如果找到则返回拼音.

*/

public static String getSpellByAscii(int ascii) ...{

if (ascii > 0 && ascii < 160) ...{ //单字符

return String.valueOf((char) ascii);

}

if (ascii < -20319 || ascii > -10247) ...{ //不知道的字符

return null;

}

Set keySet = spellMap.keySet();

Iterator it = keySet.iterator();

String spell0 = null;

;

String spell = null;

int asciiRang0 = -20319;

int asciiRang;

while (it.hasNext()) ...{

spell = (String) it.next();

Object valObj = spellMap.get(spell);

if (valObj instanceof Integer) ...{

asciiRang = ((Integer) valObj).intValue();

if (ascii >= asciiRang0 && ascii < asciiRang) ...{ //区间找到

return (spell0 == null) ? spell : spell0;

} else ...{

spell0 = spell;

asciiRang0 = asciiRang;

}

}

}

return null;

}

private static void initialize() ...{

spellPut("a", -20319);

spellPut("ai", -20317);

spellPut("an", -20304);

spellPut("ang", -20295);

spellPut("ao", -20292);

spellPut("ba", -20283);

spellPut("bai", -20265);

spellPut("ban", -20257);

spellPut("bang", -20242);

spellPut("bao", -20230);

spellPut("bei", -20051);

spellPut("ben", -20036);

spellPut("beng", -20032);

spellPut("bi", -20026);

spellPut("bian", -20002);

spellPut("biao", -19990);

spellPut("bie", -19986);

spellPut("bin", -19982);

spellPut("bing", -19976);

spellPut("bo", -19805);

spellPut("bu", -19784);

spellPut("ca", -19775);

spellPut("cai", -19774);

spellPut("can", -19763);

spellPut("cang", -19756);

spellPut("cao", -19751);

spellPut("ce", -19746);

spellPut("ceng", -19741);

spellPut("cha", -19739);

spellPut("chai", -19728);

spellPut("chan", -19725);

spellPut("chang", -19715);

spellPut("chao", -19540);

spellPut("che", -19531);

spellPut("chen", -19525);

spellPut("cheng", -19515);

spellPut("chi", -19500);

spellPut("chong", -19484);

spellPut("chou", -19479);

spellPut("chu", -19467);

spellPut("chuai", -19289);

spellPut("chuan", -19288);

spellPut("chuang", -19281);

spellPut("chui", -19275);

spellPut("chun", -19270);

spellPut("chuo", -19263);

spellPut("ci", -19261);

spellPut("cong", -19249);

spellPut("cou", -19243);

spellPut("cu", -19242);

spellPut("cuan", -19238);

spellPut("cui", -19235);

spellPut("cun", -19227);

spellPut("cuo", -19224);

spellPut("da", -19218);

spellPut("dai", -19212);

spellPut("dan", -19038);

spellPut("dang", -19023);

spellPut("dao", -19018);

spellPut("de", -19006);

spellPut("deng", -19003);

spellPut("di", -18996);

spellPut("dian", -18977);

spellPut("diao", -18961);

spellPut("die", -18952);

spellPut("ding", -18783);

spellPut("diu", -18774);

spellPut("dong", -18773);

spellPut("dou", -18763);

spellPut("du", -18756);

spellPut("duan", -18741);

spellPut("dui", -18735);

spellPut("dun", -18731);

spellPut("duo", -18722);

spellPut("e", -18710);

spellPut("en", -18697);

spellPut("er", -18696);

spellPut("fa", -18526);

spellPut("fan", -18518);

spellPut("fang", -18501);

spellPut("fei", -18490);

spellPut("fen", -18478);

spellPut("feng", -18463);

spellPut("fo", -18448);

spellPut("fou", -18447);

spellPut("fu", -18446);

spellPut("ga", -18239);

spellPut("gai", -18237);

spellPut("gan", -18231);

spellPut("gang", -18220);

spellPut("gao", -18211);

spellPut("ge", -18201);

spellPut("gei", -18184);

spellPut("gen", -18183);

spellPut("geng", -18181);

spellPut("gong", -18012);

spellPut("gou", -17997);

spellPut("gu", -17988);

spellPut("gua", -17970);

spellPut("guai", -17964);

spellPut("guan", -17961);

spellPut("guang", -17950);

spellPut("gui", -17947);

spellPut("gun", -17931);

spellPut("guo", -17928);

spellPut("ha", -17922);

spellPut("hai", -17759);

spellPut("han", -17752);

spellPut("hang", -17733);

spellPut("hao", -17730);

spellPut("he", -17721);

spellPut("hei", -17703);

spellPut("hen", -17701);

spellPut("heng", -17697);

spellPut("hong", -17692);

spellPut("hou", -17683);

spellPut("hu", -17676);

spellPut("hua", -17496);

spellPut("huai", -17487);

spellPut("huan", -17482);

spellPut("huang", -17468);

spellPut("hui", -17454);

spellPut("hun", -17433);

spellPut("huo", -17427);

spellPut("ji", -17417);

spellPut("jia", -17202);

spellPut("jian", -17185);

spellPut("jiang", -16983);

spellPut("jiao", -16970);

spellPut("jie", -16942);

spellPut("jin", -16915);

spellPut("jing", -16733);

spellPut("jiong", -16708);

spellPut("jiu", -16706);

spellPut("ju", -16689);

spellPut("juan", -16664);

spellPut("jue", -16657);

spellPut("jun", -16647);

spellPut("ka", -16474);

spellPut("kai", -16470);

spellPut("kan", -16465);

spellPut("kang", -16459);

spellPut("kao", -16452);

spellPut("ke", -16448);

spellPut("ken", -16433);

spellPut("keng", -16429);

spellPut("kong", -16427);

spellPut("kou", -16423);

spellPut("ku", -16419);

spellPut("kua", -16412);

spellPut("kuai", -16407);

spellPut("kuan", -16403);

spellPut("kuang", -16401);

spellPut("kui", -16393);

spellPut("kun", -16220);

spellPut("kuo", -16216);

spellPut("la", -16212);

spellPut("lai", -16205);

spellPut("lan", -16202);

spellPut("lang", -16187);

spellPut("lao", -16180);

spellPut("le", -16171);

spellPut("lei", -16169);

spellPut("leng", -16158);

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics