Python xml解析记录
短信预约 -IT技能 免费直播动态提醒
Python的xml解析方式自带的有3种,xml.dom.*、xml.sax.*以及xml.etree.ElementTree,相对来说,xml.etree.ElementTree最快捷方便。
因为自己只使用了xml.etree.ElementTree,所以下面就简单记录下xml.etree.ElementTree相关的东西。
基本读写
参考:http://blog.csdn.net/wklken/article/details/7603071
xmlTree = ElementTree.parse('a.xml') #读入
xmlNodeList = xmlTree.getiterator('Item') #获取指定节点
for node in xmlNodeList:
print 'node.tag:%s' % node.tag #节点名
print 'node.text:%s' % node.text #节点文字
if node.attrib.has_key('attr_name'): #节点attribute
print 'node.attrib[%s]:%s' % ('attr_name',node.attrib['attr_name']))
keyPath = node.attrib['attr_name']
xml内含有namespace的坑
如果xml文件有namespace的,ElementTree会修改namespace的名字,一般会改成ns0之类的,如果不希望被更改的话,这样玩:
XML_NS_NAME = 'my_ns'
XML_NS_VALUE = 'http://xxx'
ElementTree.register_namespace(XML_NS_NAME, XML_NS_VALUE) #在parse之前调用
有namespace的时候,查找需要转换namespace,比如有个节点的attr是:my_ns:name,那么在ElementTree内部会解析成{http://xxx}name,所以查找的时候也需要用{http://xxx}name才能找到。
附一个转换函数:
#xml有namespace的转换成正常可解析的值 有则转换,没有则返回原值
def ParseNameSpace(class="lazy" data-src, nsName, nsValue):
if class="lazy" data-src.find(nsName) != -1:
dst = class="lazy" data-src.replace('%s:' % nsName, '{%s}' % nsValue)
print 'ns class="lazy" data-src:%s dst:%s' % (class="lazy" data-src, dst)
return dst
return class="lazy" data-src
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341