Вопрос:

Доступ к неструктурированным XML-данным в Python

python xml xml-parsing

15 просмотра

1 ответ

321 Репутация автора

У меня есть несколько XML-файлов, которые я хочу проанализировать в Python. Я знаю о пакете ElementTree в python, однако мои xml-файлы не хранятся в древовидной структуре. Ниже приведен пример

<tag1 attribute1="at1" attribute2="at2">My files are text that I annotated with a tool 
to create these xml files.</tag1>
Some parts of the text are enclosed in an xml tag, whereas others are not. 
<tag1 attribute1="at1" attribute2="at2"><tag2 attribute3="at3" attribute4="at4">Some
are even enclosed in multiple tags.</tag1></tag2>
And some have overlapping tags:
<tag1 attribute1="at1" attribute2="at2">This is an example sentence
<tag3 attribute5="at5">containing a nested example sentence</tag3></tag1>

Всякий раз, когда я использую функцию ElementTree для анализа файла, я могу получить доступ только к самому первому тегу. Я ищу способ разобрать все теги и не хочу древовидную структуру. Любая помощь очень ценится.

Автор: imc Источник Размещён: 14.04.2017 11:03

Ответы (1)


0 плюса

1948 Репутация автора

Если у вас есть один XML-фрагмент на строку, просто проанализируйте каждую строку отдельно.

for line in some_file:
    # parse using ET and getroot.
Автор: Javier Размещён: 14.04.2017 12:48
Вопросы из категории :
32x32