anduo1989 发表于 2013-2-1 11:23:59

开发自己的jar包 pinyin4j

今天开发了自己的第二个开源工具 jar包
名称:pinyin4j.jar
功能: 将汉语拼音转换为汉语拼音

算法:
从对应的资源文件中(文件中包含了常用汉字的unicode编码-拼音)
文件格式如下:
3007 (ling2)
4E00 (yi1)
4E01 (ding1,zheng1)
4E02 (kao3)
4E03 (qi1)
4E04 (shang4,shang3)
.
.
.
用数据流的方式读取 然后将unicode码以key,pinyin为value存入一个HashMap中

接口:
    传入:汉语拼音的字符串
    返回:拼音的字符串数组(即每个汉语拼音对应相应的拼音)


源码:
package com.anduo.pinyin4j;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.HashMap;public class PinYinHelper {private static HashMap<String, String> hashMap = new HashMap<String, String>();/** * 将unicode-to-hanyu-pinyin.txt文件 以unicode为key pinyin为value 加到hashmap中 */private static void myReader() {InputStream is = PinYinHelper.class.getClass().getResourceAsStream("/resource/unicode_to_hanyu_pinyin.txt");BufferedReader breader = new BufferedReader(new InputStreamReader(is));String s;String unicode;String pinyin;try {while ((s = breader.readLine()) != null) {// 提取文件流每行中的unicode码以及 pinyin字符串unicode = s.substring(0, 4);pinyin = s.substring(6, s.length() - 1);hashMap.put(unicode.toLowerCase(), pinyin);}} catch (IOException e) {e.printStackTrace();}}/** * 将汉语转换为汉语拼音 ** @param value * @return pinyin[] */public static String[] toHanYuPinYin(String value) {myReader();String[] result = new String;String unicode;String pinyin;for (int i = 0; i < value.length(); i++) {Character c = value.charAt(i);unicode = Integer.toHexString(c);// 得到汉字的unicode编码pinyin = hashMap.get(unicode);// 从hashMap中找到汉子的拼音result = pinyin;}return result;}}

然后导出为jar包

测试一下:
新建一个java工程,然后将刚做好的jar包导入的工程中
新建一个test类
package com.anduo;import com.anduo.pinyin4j.PinYinHelper;public class test {public static void main(String[] args) {String s[] = PinYinHelper.toHanYuPinYin("大但是关键的是概多少了攻击多少");for (String string : s) {System.out.println(string);}}}

测试效果:
da4,dai4
dan4
shi4
guan1
jian4
de5,di4,di2
shi4
gai4
duo1
shao3,shao4
le5,liao3,liao4
gong1
ji1
duo1
shao3,shao4


遇到的问题,在导出jar包的时候出了很多错误
主要问题出在: 如何读取jar包中的资源文件 这个可以参考我收藏的一篇文章
页: [1]
查看完整版本: 开发自己的jar包 pinyin4j