分享

Python xml属性/节点/文本的增删改[xml.etree.ElementTree]

 imelee 2016-12-10

博客已迁移, 新地址


========================

需求:

在实际应用中,需要对xml配置文件进行实时修改, 

 1.增加、删除 某些节点

 2.增加,删除,修改某个节点下的某些属性

 3.增加,删除,修改某些节点的文本


xml源文件格式[例]

  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <framework>  
  3.     <processers>  
  4.         <processer name="AProcesser" file="lib64/A.so"  
  5.             path="/tmp">  
  6.         </processer>  
  7.         <processer name="BProcesser" file="lib64/B.so" value="fordelete">  
  8.         </processer>  
  9.         <processer name="BProcesser" file="lib64/B.so2222222"/>  
  10.           
  11.         <services>  
  12.             <service name="search" prefix="/bin/search?"  
  13.                 output_formatter="OutPutFormatter:service_inc">  
  14.                   
  15.                 <chain sequency="chain1"/>  
  16.                 <chain sequency="chain2"></chain>  
  17.             </service>  
  18.             <service name="update" prefix="/bin/update?">  
  19.                 <chain sequency="chain3" value="fordelete"/>  
  20.             </service>  
  21.         </services>  
  22.     </processers>  
  23. </framework>  

使用库:

xml.etree.ElementTree 

官方文档地址:http://docs./library/xml.etree.elementtree.html


实现思想:

使用ElementTree,先将文件读入,解析成树,之后,根据路径,可以定位到树的每个节点,再对节点进行修改,最后直接将其输出


代码附文档:

  1. #!/usr/bin/python  
  2. # -*- coding=utf-8 -*-  
  3. # author : wklken@yeah.net  
  4. # date: 2012-05-25  
  5. # version: 0.1  
  6.   
  7. from xml.etree.ElementTree import ElementTree,Element  
  8.   
  9. def read_xml(in_path):  
  10.     '''''读取并解析xml文件 
  11.        in_path: xml路径 
  12.        return: ElementTree'''  
  13.     tree = ElementTree()  
  14.     tree.parse(in_path)  
  15.     return tree  
  16.   
  17. def write_xml(tree, out_path):  
  18.     '''''将xml文件写出 
  19.        tree: xml树 
  20.        out_path: 写出路径'''  
  21.     tree.write(out_path, encoding="utf-8",xml_declaration=True)  
  22.   
  23. def if_match(node, kv_map):  
  24.     '''''判断某个节点是否包含所有传入参数属性 
  25.        node: 节点 
  26.        kv_map: 属性及属性值组成的map'''  
  27.     for key in kv_map:  
  28.         if node.get(key) != kv_map.get(key):  
  29.             return False  
  30.     return True  
  31.   
  32. #---------------search -----  
  33.   
  34. def find_nodes(tree, path):  
  35.     '''''查找某个路径匹配的所有节点 
  36.        tree: xml树 
  37.        path: 节点路径'''  
  38.     return tree.findall(path)  
  39.   
  40.   
  41. def get_node_by_keyvalue(nodelist, kv_map):  
  42.     '''''根据属性及属性值定位符合的节点,返回节点 
  43.        nodelist: 节点列表 
  44.        kv_map: 匹配属性及属性值map'''  
  45.     result_nodes = []  
  46.     for node in nodelist:  
  47.         if if_match(node, kv_map):  
  48.             result_nodes.append(node)  
  49.     return result_nodes  
  50.   
  51. #---------------change -----  
  52.   
  53. def change_node_properties(nodelist, kv_map, is_delete=False):  
  54.     '''''修改/增加 /删除 节点的属性及属性值 
  55.        nodelist: 节点列表 
  56.        kv_map:属性及属性值map'''  
  57.     for node in nodelist:  
  58.         for key in kv_map:  
  59.             if is_delete:   
  60.                 if key in node.attrib:  
  61.                     del node.attrib[key]  
  62.             else:  
  63.                 node.set(key, kv_map.get(key))  
  64.               
  65. def change_node_text(nodelist, text, is_add=False, is_delete=False):  
  66.     '''''改变/增加/删除一个节点的文本 
  67.        nodelist:节点列表 
  68.        text : 更新后的文本'''  
  69.     for node in nodelist:  
  70.         if is_add:  
  71.             node.text += text  
  72.         elif is_delete:  
  73.             node.text = ""  
  74.         else:  
  75.             node.text = text  
  76.               
  77. def create_node(tag, property_map, content):  
  78.     '''''新造一个节点 
  79.        tag:节点标签 
  80.        property_map:属性及属性值map 
  81.        content: 节点闭合标签里的文本内容 
  82.        return 新节点'''  
  83.     element = Element(tag, property_map)  
  84.     element.text = content  
  85.     return element  
  86.           
  87. def add_child_node(nodelist, element):  
  88.     '''''给一个节点添加子节点 
  89.        nodelist: 节点列表 
  90.        element: 子节点'''  
  91.     for node in nodelist:  
  92.         node.append(element)  
  93.           
  94. def del_node_by_tagkeyvalue(nodelist, tag, kv_map):  
  95.     '''''同过属性及属性值定位一个节点,并删除之 
  96.        nodelist: 父节点列表 
  97.        tag:子节点标签 
  98.        kv_map: 属性及属性值列表'''  
  99.     for parent_node in nodelist:  
  100.         children = parent_node.getchildren()  
  101.         for child in children:  
  102.             if child.tag == tag and if_match(child, kv_map):  
  103.                 parent_node.remove(child)  
  104.                           
  105.   
  106.   
  107. if __name__ == "__main__":  
  108.       
  109.     #1. 读取xml文件  
  110.     tree = read_xml("./test.xml")  
  111.       
  112.     #2. 属性修改  
  113.       #A. 找到父节点  
  114.     nodes = find_nodes(tree, "processers/processer")  
  115.       #B. 通过属性准确定位子节点  
  116.     result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"})  
  117.       #C. 修改节点属性  
  118.     change_node_properties(result_nodes, {"age": "1"})  
  119.       #D. 删除节点属性  
  120.     change_node_properties(result_nodes, {"value":""}, True)  
  121.       
  122.     #3. 节点修改  
  123.       #A.新建节点  
  124.     a = create_node("person", {"age":"15","money":"200000"}, "this is the firest content")  
  125.       #B.插入到父节点之下  
  126.     add_child_node(result_nodes, a)  
  127.       
  128.     #4. 删除节点  
  129.        #定位父节点  
  130.     del_parent_nodes = find_nodes(tree, "processers/services/service")  
  131.        #准确定位子节点并删除之  
  132.     target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"})  
  133.       
  134.     #5. 修改节点文本  
  135.        #定位节点  
  136.     text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"})  
  137.     change_node_text(text_nodes, "new text")  
  138.       
  139.     #6. 输出到结果文件  
  140.     write_xml(tree, "./out.xml")  
  141.       
  142.    


通过main处理后的结果文件:

  1. <?xml version='1.0' encoding='utf-8'?>  
  2. <framework>  
  3.     <processers>  
  4.         <processer file="lib64/A.so" name="AProcesser" path="/tmp">  
  5.         </processer>  
  6.         <processer age="1" file="lib64/B.so" name="BProcesser">  
  7.             <person age="15" money="200000">this is the firest content</person>  
  8.         </processer>  
  9.         <processer age="1" file="lib64/B.so2222222" name="BProcesser">  
  10.             <person age="15" money="200000">this is the firest content</person>  
  11.         </processer>  
  12.   
  13.         <services>  
  14.             <service name="search" output_formatter="OutPutFormatter:service_inc"  
  15.                 prefix="/bin/search?">  
  16.   
  17.                 <chain sequency="chain2" />  
  18.             </service>  
  19.             <service name="update" prefix="/bin/update?">  
  20.                 <chain sequency="chain3" value="fordelete">new text</chain>  
  21.             </service>  
  22.         </services>  
  23.     </processers>  
  24. </framework>  



The end!

wklken

2012-05-25



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多