# -*- coding: utf-8 -*-
"""
Created on Fri May 5 10:34:46 2023
@author: Administrator
介绍如何用python来读取xml类型的文件
来源:https://zhuanlan.zhihu.com/p/100136477
"""
import os
os.chdir(r'D:\Python\pubmedParse')
import xml.dom.minidom
# 打开xml文档
dom = xml.dom.minidom.parse('data/abc.xml')
# 得到文档元素对象
root = dom.documentElement #用于得到dom对象的文档元素,并把获得的对象给root
# 每一个结点都有它的nodeName,nodeValue,nodeType属性
print(root.nodeName)
print(root.nodeValue)
print(root.nodeType)
print(root.ELEMENT_NODE)
# 对于知道元素名字的子元素,可以使用getElementsByTagName方法获取
bb = root.getElementsByTagName('maxid')
print(bb[0].nodeName)
bb = root.getElementsByTagName('login')
print(bb[0].nodeName)
# 获得标签属性值,使用.getAttribute()
itemlist = root.getElementsByTagName('login')
item = itemlist[0]
print(item.getAttribute("username"))
print(item.getAttribute("passwd"))
ii = root.getElementsByTagName('item')
i1 = ii[0]
print(i1.getAttribute("id"))
# 获得标签对之间的数据,使用.data
cc=dom.getElementsByTagName('caption')
c1=cc[0]
print(c1.firstChild.data)# firstChild 属性返回被选节点的第一个子节点,.data表示获取该节点数据