2011年最后一篇。。。。
上一篇中的代码最好需要优化,特别对字库文件需要优化。股票成千上万个,如何做到快速匹配是很值得研究的。
写了一个转换函数,将类似4E48 (me5,ma5,yao1)的文本转换成4E48 (m,y),代码如下:
修改PinYin4j.java:
其他地方可以保持不变。
最后,采用AutoCompleteTextView做出来的提示很丑,漂亮一点的看下图,这可不是AutoCompleteTextView做的哦。
想做这样的效果吗。
上一篇中的代码最好需要优化,特别对字库文件需要优化。股票成千上万个,如何做到快速匹配是很值得研究的。
写了一个转换函数,将类似4E48 (me5,ma5,yao1)的文本转换成4E48 (m,y),代码如下:
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
public class TestMain {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
final String fromName = "e:\\unicode_to_hanyu_pinyin.txt";
final String toName = "e:\\unicode_to_simple_pinyin.txt";
TestMain t=new TestMain();
t.convert(fromName,toName);
}
public void convert(String fromFile,String toFile) {
try {
BufferedWriter writer = new BufferedWriter(new FileWriter(new File(toFile)));
BufferedReader reader = new BufferedReader(new FileReader(new File(fromFile)));
String tempString = null;
int line = 1;
while ((tempString = reader.readLine()) != null) {
// 显示行号
String pre=getPre(tempString);//获得“(”前面部分
String[] t=getMiddle(tempString);//
String s="";
for(int i=0;i<t.length;i++){
String sub=t[i].substring(0, 1);
if(i+1<t.length){//去掉重复项
String sub2=t[i+1].substring(0, 1);
if(sub.equals(sub2)){
continue;
}
}
s+=","+sub;
}
s=pre+s.substring(1)+")";
writer.write(s);
writer.newLine();
line++;
}
reader.close();
writer.close();
} catch (IOException e) {
e.printStackTrace();
}
}
private String getPre(String pinyinRecord){
int indexOfLeftBracket = pinyinRecord.indexOf("(")+1;
String stripedString = pinyinRecord.substring(0,indexOfLeftBracket);
return stripedString;
}
private String[] getMiddle(String pinyinRecord){
int left= pinyinRecord.indexOf("(");
int right= pinyinRecord.lastIndexOf(")");
String middle = pinyinRecord.substring(left+ "(".length(), right);
return middle.split(",");
}
}
修改PinYin4j.java:
package com.ql.util;
import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;
public class PinYin4j {
public PinYin4j(){
}
/**
* 字符串集合转换字符串(逗号分隔),测试用
*
* @param stringSet
* @return
*/
public String makeStringByStringSet(Set<String> stringSet) {
StringBuilder str = new StringBuilder();
int i = 0;
for (String s : stringSet) {
if (i == stringSet.size() - 1) {
str.append(s);
} else {
str.append(s + ",");
}
i++;
}
return str.toString().toLowerCase();
}
/**
* 获取拼音集合
*
* @author wyh
* @param src
* @return Set<String>
*/
public Set<String> getPinyin(String src) {
char[] srcChar;
srcChar = src.toCharArray();
//1:多少个汉字
//2:每个汉字多少种读音
String[][] temp = new String[src.length()][];
for (int i = 0; i < srcChar.length; i++) {
char c = srcChar[i];
// 是中文或者a-z或者A-Z转换拼音(我的需求,是保留中文或者a-z或者A-Z)
if (String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")) {//中文
String[] t = PinyinHelper.getUnformattedHanyuPinyinStringArray(c);
temp[i] = new String[t.length];
for(int j=0;j<t.length;j++){
// temp[i][j]=t[j].substring(0,1);//获取首字母
temp[i][j]=t[j];//获取首字母,不需要再截取了
}
} else if (((int) c >= 65 && (int) c <= 90)
|| ((int) c >= 97 && (int) c <= 122)
||c>=48&&c<=57||c==42) {//a-zA-Z0-9*
temp[i] = new String[] { String.valueOf(srcChar[i]) };
} else {
temp[i] = new String[] {"null!"};
}
}
return paiLie(temp);//直接返回Set
}
/*
* 求2维数组所有排列组合情况
* 比如:{{1,2},{3},{4},{5,6}}共有2中排列,为:1345,1346,2345,2346
*/
private Set<String> paiLie(String[][] str){
int max=1;
for(int i=0;i<str.length;i++){
max*=str[i].length;
}
Set<String> result=new HashSet<String>();
for(int i = 0; i < max; i++){
String s = "";
int temp = 1; //注意这个temp的用法。
for(int j = 0; j < str.length; j++){
temp *= str[j].length;
s += str[j][i / (max / temp) % str[j].length];
}
result.add(s);
}
return result;
}
/**
* @param args
*/
public static void main(String[] args) {
//nongyeyinheng,nongyeyinhang,nongyeyinxing
PinYin4j t=new PinYin4j();
String str = "农业银行1234567890abcdefghijklmnopqrstuvwxyz*";
System.out.println(t.makeStringByStringSet(t.getPinyin(str)));
}
}
其他地方可以保持不变。
最后,采用AutoCompleteTextView做出来的提示很丑,漂亮一点的看下图,这可不是AutoCompleteTextView做的哦。
想做这样的效果吗。

