`
lovexz365
  • 浏览: 107038 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

PinYin4J 汉字转化成拼音

    博客分类:
  • java
阅读更多
   汉字转成拼音如果自己实现起来有点麻烦,主要是怕有些汉字转不了,所以就准备使用一个开源的工具Pinyin4j.
      汉子转化成拼音主要是应用了相关对应的字典编码。通过字典编码进行相关的转化,比如:Ascii码。
      pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
       1. 支持简体中文和繁体中文字符;
      2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
      3. 支持多音字,即可以获取一个中文字符的多种发音;
      4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。
     5.相关Jar包请自己下载


package org.lycandjava.util.charactor;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 
 
/**
* @className:PinyingUtil.java
* @classDescription:拼音操作工具类
* @author:liyingchao
* @createTime:2011-06-23
*/ 
 
public class PinyinUtil { 
 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @return
     */ 
    public static String[] stringToPinyin(String src) { 
        return stringToPinyin(src, false, null); 
    } 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @return
     */ 
    public static String[] stringToPinyin(String src,String separator) { 
        return stringToPinyin(src, true, separator); 
    } 
 
    /**
     * 将字符串转换成拼音数组
     * 
     * @param src
     * @param isPolyphone
     *            是否查出多音字的所有拼音
     * @param separator
     *            多音字拼音之间的分隔符
     * @return
     */ 
    public static String[] stringToPinyin(String src, boolean isPolyphone, 
            String separator) { 
        // 判断字符串是否为空 
        if ("".equals(src) || null == src) { 
            return null; 
        } 
        char[] srcChar = src.toCharArray(); 
        int srcCount = srcChar.length; 
        String[] srcStr = new String[srcCount]; 
 
        for (int i = 0; i < srcCount; i++) { 
            srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); 
        } 
        return srcStr; 
    } 
 
    /**
     * 将单个字符转换成拼音
     * 
     * @param src
     * @return
     */ 
    public static String charToPinyin(char src, boolean isPolyphone, 
            String separator) { 
        // 创建汉语拼音处理类 
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
        // 输出设置,大小写,音标方式 
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
 
        StringBuffer tempPinying = new StringBuffer(); 
         
 
        // 如果是中文 
        if (src > 128) { 
            try { 
                // 转换得出结果 
                String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, 
                        defaultFormat); 
                 
                         
                // 是否查出多音字,默认是查出多音字的第一个字符 
                if (isPolyphone && null != separator) { 
                    for (int i = 0; i < strs.length; i++) { 
                        tempPinying.append(strs[i]); 
                        if (strs.length != (i + 1)) { 
                            // 多音字之间用特殊符号间隔起来 
                            tempPinying.append(separator); 
                        } 
                    } 
                } else { 
                    tempPinying.append(strs[0]); 
                } 
 
            } catch (BadHanyuPinyinOutputFormatCombination e) { 
                e.printStackTrace(); 
            } 
        } else { 
            tempPinying.append(src); 
        } 
 
        return tempPinying.toString(); 
 
    } 
 
     
    public static String hanziToPinyin(String hanzi){ 
        return hanziToPinyin(hanzi," "); 
    } 
    /**
     * 将汉字转换成拼音
     * @param hanzi
     * @param separator
     * @return
     */ 
    public static String hanziToPinyin(String hanzi,String separator){ 
            // 创建汉语拼音处理类 
            HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
            // 输出设置,大小写,音标方式 
            defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
            defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
             
            String pinyingStr=""; 
            try { 
                pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator); 
            } catch (BadHanyuPinyinOutputFormatCombination e) { 
                // TODO Auto-generated catch block 
                e.printStackTrace(); 
            }    
            return pinyingStr; 
    } 
   
    /**
     * 将字符串数组转换成字符串
     * @param str 
     * @param separator 各个字符串之间的分隔符
     * @return
     */ 
    public static String stringArrayToString(String[] str, String separator) { 
        StringBuffer sb = new StringBuffer(); 
        for (int i = 0; i < str.length; i++) { 
            sb.append(str[i]); 
            if (str.length != (i + 1)) { 
                sb.append(separator); 
            } 
        } 
        return sb.toString(); 
    } 
    /**
     * 简单的将各个字符数组之间连接起来
     * @param str
     * @return
     */ 
    public  static String stringArrayToString(String[] str){ 
        return stringArrayToString(str,""); 
    } 
    /**
     * 将字符数组转换成字符串
     * @param str 
     * @param separator 各个字符串之间的分隔符
     * @return
     */ 
    public static String charArrayToString(char[] ch, String separator) { 
        StringBuffer sb = new StringBuffer(); 
        for (int i = 0; i < ch.length; i++) { 
            sb.append(ch[i]); 
            if (ch.length != (i + 1)) { 
                sb.append(separator); 
            } 
        } 
        return sb.toString(); 
    } 
     
    /**
     * 将字符数组转换成字符串
     * @param str 
     * @return
     */ 
    public static String charArrayToString(char[] ch) { 
        return charArrayToString(ch," "); 
    } 
 
    /**
     * 取汉字的首字母
     * @param src
     * @param isCapital 是否是大写
     * @return
     */ 
    public static char[]  getHeadByChar(char src,boolean isCapital){ 
        //如果不是汉字直接返回 
        if (src <= 128) { 
            return new char[]{src}; 
        } 
        //获取所有的拼音 
        String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src); 
        //创建返回对象 
        int polyphoneSize=pinyingStr.length; 
        char [] headChars=new char[polyphoneSize]; 
        int i=0; 
        //截取首字符 
        for(String s:pinyingStr){ 
            char headChar=s.charAt(0); 
            //首字母是否大写,默认是小写 
            if(isCapital){ 
                headChars[i]=Character.toUpperCase(headChar); 
             }else{ 
                headChars[i]=headChar; 
             } 
            i++; 
        } 
         
        return headChars; 
    } 
    /**
     * 取汉字的首字母(默认是大写)
     * @param src
     * @return
     */ 
    public static char[]  getHeadByChar(char src){ 
        return getHeadByChar(src,true); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @return
     */ 
    public  static String[] getHeadByString(String src){ 
        return getHeadByString( src, true); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @param isCapital 是否大写
     * @return
     */ 
    public  static String[] getHeadByString(String src,boolean isCapital){ 
        return getHeadByString( src, isCapital,null); 
    } 
    /**
     * 查找字符串首字母
     * @param src 
     * @param isCapital 是否大写
     * @param separator 分隔符
     * @return
     */ 
    public  static String[] getHeadByString(String src,boolean isCapital,String separator){ 
        char[]chars=src.toCharArray(); 
        String[] headString=new String[chars.length]; 
        int i=0; 
        for(char ch:chars){ 
             
            char[]chs=getHeadByChar(ch,isCapital); 
            StringBuffer sb=new StringBuffer(); 
            if(null!=separator){ 
                int j=1; 
                 
                for(char ch1:chs){ 
                    sb.append(ch1); 
                    if(j!=chs.length){ 
                        sb.append(separator); 
                    } 
                    j++; 
                } 
            }else{ 
                sb.append(chs[0]); 
            } 
            headString[i]=sb.toString(); 
            i++; 
        } 
        return headString; 
    } 
     
    public static void main(String[] args) { 
        System.out.println(stringArrayToString(getHeadByString("我se 心"))); 
        System.out.println(hanziToPinyin("李颖超","")); 
    } 
 
}
分享到:
评论

相关推荐

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    Java中,汉语转换成拼音的jar包。放到项目下,直接引用pinyin4j-2.5.0.jar就行。或者直接放到maven本地资源文件下解压压缩包直接再项目配置文件中引用。

    pinyin4J java拼音转换工具

    pinyin4J java拼音转换工具 java汉字转换拼音工具

    pinyin4j.zip pinyin4j.jar

    Pinyin4j是一个功能强悍的汉语拼音工具包,是sourceforge.net上的一个开源项目。 包里面有 pinyin4j.zip pinyin4j.jar 两种

    探索PinYin4j.jar将汉字转换为拼音的基本用法

    Pinyin4j是一个功能强悍的汉语拼音工具包,是sourceforge.net上的一个开源项目。 主要的功能有: - 支持同一汉字有多个发音 - 支持拼音的格式化输出,比如第几声之类的 - 支持简体中文、繁体中文转换为拼音

    pinyin4j-2.5.0.jar 中文转化拼音,获取首字母

    pinyin4j-2.5.0.jar 中文转化拼音,获取首字母

    将简体中文和繁体中文转换拼音的jar包 pinyin4j-2.5.0.jar

    将简体中文和繁体中文转换拼音的jar包,将简体中文和繁体中文转换拼音的jar包

    pinyin4j工具类和jar包

    Pinyin4j的基本用法 1. 简单介绍 有时候,需要将汉字编程对应的拼音,以方便...+ 同时支持简体中文、繁体中文转换为拼音…使用起来也非常简单。下面是其官方网址,其中提供了下载: http://pinyin4j.sourceforge.net/

    数据库中将汉字转换成拼音

    自定义函数,将汉字转换成每个汉语拼音的首字母

    pinyin4j拼音java

    class PinYin4jUtils 拼音 java 将字符串转换成拼音数组 将单个字符转换成拼音 将汉字转换成拼音 查找字符串首字母

    pinyin4j pinyin4j

    将中文转换成拼音 将中文转换成拼音 将中文转换成拼音 将中文转换成拼音

    使用pinyin4j的Java库进行汉字转拼音

    对pinyin4j的封装,并且能够进行汉字和拼音已经ASCII码的转换

    使用pinyin4j将中文转换为拼音

    NULL 博文链接:https://liuxing87327.iteye.com/blog/1634752

    Pinyin4j工具类

    将字符串转换成拼音数组;将字符串转换成拼音数组;将字符串转换成拼音数组;将单个字符转换成拼音;...本工具类需要pinyin4j.jar包。jar包地址-&gt;https://download.csdn.net/download/lihaibo858/10134053

    pinyin4j-2.5.0.rar

    Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换,拼音输出格式可以定制,在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,这时候Pinyin4j就可以派上用场

    pinyin4j.zip

    Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换,拼音输出格式可以定制,在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,这时候Pinyin4j就可以派上用场

    pinyin4j示例代码

    Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。

    汉字转换成中文拼音pinyin4j-2.5.0.jar

    输入汉字可以转换成中文拼音。内包含jar包和demo public class PinYin { public static String getPinYin(String src){ char[] t1 = null; t1=src.toCharArray(); String[] t2 = new String[t1.length]; ...

    pinyin4j汉字转拼音.zip

    一个汉字转拼音的小例子,使用pinyin4j-2.5.0.jar提供的转换函数,转换出来的拼音还有音调,本项目默认编译版本2.3.3编码GBK源码有注释。   

    pinyin4j jar包

    Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换,拼音输出格式可以定制。 Pinyin4jUtils工具类是进行包装,进行支持一一些转换方法

Global site tag (gtag.js) - Google Analytics