python实现的简版iconv
系统管理中,经常涉及的文件编码就是UTF8和GB1803,下面是实现iconv简化功能(UTF8,GB18030互转)的python代码:
def to_unicode(str_a):
if type(str_a) is unicode:
return str_a
try:
u=str_a.decode('utf-8')
return u
except:
try:
u=str_a.decode('gb18030')
return u
except:
pass
return str_a
def iconv(file,to,from_t='',sep=False):
u'''
sep :是否转换换行符
'''
if os.path.exists(file):
try:
import re
f=open(file,'rb')
lines=f.readlines()
f.close()
new_lines=[]
for v in lines:
if from_t!='':
s=v.decode(from_t).encode(to)
else:
s=to_unicode(v).encode(to)
if sep:
if re.match('utf.*',to,re.I):
s=re.sub('\r\n$','\n',s,re.I)
else:#gbk:使用windows换行符
s=re.sub('\r\n$','\n',s,re.I)
s=re.sub('\n$','\r\n',s,re.I)
new_lines.append(s)
import shutil
shutil.move(file, file+'.bak')
f=open(file,'wb')
f.writelines(new_lines)
f.close()
return NORMAL
except:
return ERROR
return ERROR
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341