Я использую пакет cElementTree в Python, и у меня возникают проблемы с тегами элемента. Они включают атрибут в сам тег. Похоже проблема с парсером. Пожалуйста, просмотрите приведенный ниже код:
from xml.etree import cElementTree as ET
path='C:\\Users\\myusername\\Desktop\\test.xml'
tree=ET.parse(path)
root=tree.getroot()
root.tag
>>> '{http://www.aftmark.org}DATA'
Где xml такой:
<DATA xmlns:xsd = "http://www.w.org/2008/XMLsca" xmlns = "http://www.aftmark.org">
<Header>
<DATAVersion>6.5</DATAVersion>
</Header>
<Items>
<Item MaintenanceType = "A">
<HazardousMaterialCode>N</HazardousMaterialCode>
<ExtendedInformation>
</Item>
Есть идеи, почему включен URL-адрес "{http://www.aftmark.org}"? Я анализирую много файлов, и этот URL-адрес меняется. Однако тег DATA этого не делает. (Резервное копирование заключается в использовании root.tag, взятии этого URL-адреса и добавлении его ко всем ET.find() позже) Спасибо!






Это потому, что DATA (и все потомки) находятся в пространстве имен по умолчанию http://www.aftmark.org.
То, что вы видите, — это uri пространства имен и расширенное локальное имя (также известное как нотация Кларка).
Посмотреть здесь для получения дополнительной информации о пространствах имен в ElementTree.
Посмотреть здесь для получения дополнительной информации о пространствах имен XML в целом.
Кроме того, увидеть этот ответ для другого способа захвата неизвестных пространств имен для использования в find/findall.