如何使用Python实现提取语句中的人名
短信预约 -IT技能 免费直播动态提醒
这篇文章主要介绍如何使用Python实现提取语句中的人名,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
环境依赖
需要安装两个库,其实一个也可以,但是我这边准备了两个库做个比较。
安装命令如下:
pip install LAC -i https://pypi.douban.com/simplepip install ltp -i https://pypi.douban.com/simple
代码
不废话,上代码。
#!/user/bin/env python# coding=utf-8"""@project : csdn@author : 剑客阿良_ALiang@file : extract_sentence_name_tool.py@ide : PyCharm@time : 2022-01-25 11:11:43"""from LAC import LACfrom ltp import LTPimport time lac = LAC(mode="lac")ltp = LTP() # 句子提取名字def extract_name(sentence: str, type='lac'): user_name_lis = [] if type == 'lac': _result = lac.run(sentence) for _index, _label in enumerate(_result[1]): if _label == "PER": user_name_lis.append(_result[0][_index]) elif type == 'ltp': _seg, _hidden = ltp.seg([sentence]) _pos_hidden = ltp.pos(_hidden) for _seg_i, _seg_v in enumerate(_seg): _hidden_v = _pos_hidden[_seg_i] for _h_i, _h_v in enumerate(_hidden_v): if _h_v == "nh": user_name_lis.append(_seg_v[_h_i]) else: raise Exception('type not suppose') return user_name_lis if __name__ == '__main__': _start_lac = time.time() lis1 = extract_name("就因为看了沈腾和贾玲的王牌对王牌节目,所以杨迪肯定偷题了。", 'lac') _end_lac = time.time() print("LAC: {} <- 耗时[{}]秒".format(lis1, (_end_lac - _start_lac))) _start_ltp = time.time() lis2 = extract_name("就因为看了沈腾和贾玲的王牌对王牌节目,所以杨迪肯定偷题了。", 'ltp') _end_ltp = time.time() print("LTP: {} <- 耗时[{}]秒".format(lis2, (_end_ltp - _start_ltp)))
代码说明:
extract_name方法入参分别为:语句参数、类型参数。其中默认为lac模式,可以选择ltp模式。
其中lac模型提取人名的速率较快,但是ltp的提取人名准确率更高。
验证一下
执行看看效率。
以上是“如何使用Python实现提取语句中的人名”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网行业资讯频道!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341