Java实现汉字转拼音,多音字处理,简单明了
短信预约 -IT技能 免费直播动态提醒
背景:
之前一直是前端直接调用公司公共城市组件获取城市列表,现在由于公共组件不再支持,需要由后端接口提供城市查询,并且按照城市首字母分组展示。
后端实现:
最开始选择pinyin4j来实现,但发现对多音字的处理不太友好,比如需要转重庆的拼音(可以看到结果并不是我们想要的):
解决方法就需要自己定义多音字字典来实现,解析这个文件优先从这个文件中获取拼音,如下:
以上自己定义字典的方式比较麻烦,经过在网上的一顿搜索,发现可以使用具有语义的依赖包:
com.hankcs hanlp portable-1.8.3
在项目中定义一个工具类,专门处理拼音转换:
public class PinyinUtil { public static String getPinyin(String chineseStr) { List pinyins = PinyinDictionary.convertToPinyin(chineseStr); StringBuilder stringBuilder = new StringBuilder(); for (Pinyin pinyin : pinyins) { stringBuilder.append(pinyin.getPinyinWithoutTone()); } return stringBuilder.toString(); } public static String getInitial(String chineseStr) { List pinyins = PinyinDictionary.convertToPinyin(chineseStr); if (CollectionUtils.isEmpty(pinyins)) { return StringUtils.EMPTY; } return String.valueOf(pinyins.get(0).getPinyinWithoutTone().charAt(0)); }}
结果演示:
更多方法使用:
好,到此结束。简单直接,没有一个字是多余的。😄
来源地址:https://blog.csdn.net/qq_37150935/article/details/130155565
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341