python将中文数字转化成阿拉伯数字的简单方法
短信预约 -IT技能 免费直播动态提醒
正则表达式提取文本中的数字
这里演示一下文本中提取中文年份
import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
提取年份如:‘1949', ‘1990', ‘1996'
这里给出许多正则表达式的样例:example
中文转化成阿拉伯数字
创建一个字典然后讲数字进项匹配:
CN_NUM = {
'〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
'壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}
for i in range(len(time1)):
new_str = ''
for j in time1[i]:
new_str += str(CN_NUM[j])
time1[i] = new_str
time1
这样结果就出来啦,成功将上文例子中文年份转化成阿拉伯数字:‘1949', ‘1990', ‘1996'
完整代码
# 2、将句子中年份的大写数字改为阿拉伯数字
import re
m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'
time1 = re.findall(pattrern1,m0)#转化数字
CN_NUM = {
'〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
'壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}
for i in range(len(time1)):
new_str = ''
for j in time1[i]:
new_str += str(CN_NUM[j])
time1[i] = new_str
time1
总结
到此这篇关于python将中文数字转化成阿拉伯数字的文章就介绍到这了,更多相关python中文数字转阿拉伯数字内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341