Как читать все файлы xml один за другим и обрабатывать их один за другим

Я разбираю xml-файл на ноутбуке jupyter и использую этот код для открытия файла:

from lxml import etree as ET
tree = ET.parse('C:\Users\mysky\Documents\Decoded\F804187.xml')
root = tree.getroot()

И после этого я выполняю некоторую обработку с помощью xpath и pandas, например, я делаю:

CODE = [ ]
for errors in root.findall('.//Book/Message/Param/Buffer/Data/Field[11]'):
    error_code = errors.find('RawValue').text
    if error_code is not None:
        CODE.append(error_code)

У меня есть около 10 таких небольших блоков кода для извлечения данных, и в конце я сохраняю фрейм данных в файле CSV.

У меня много XML-файлов, и я хочу прочитать все файлы в моем каталоге Decoded один за другим, а затем обработать их один за другим и добавить каждый результат в свой CSV-файл.

Спасибо!

python xml pandas elementtree

25.04.2018 10:57

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

1 369

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Чтобы перечислить все файлы xml в вашем каталоге, вы можете использовать например glob(второй ответ).

Это может выглядеть так:

import glob

files = glob.glob('C:\Users\mysky\Documents\Decoded\*.xml')

    for file in files:
        tree = ET.parse(file)
        root = tree.getroot()
        CODE = [ ]
        for errors in root.findall('.//Book/Message/Param/Buffer/Data/Field[11]'):
            error_code = errors.find('RawValue').text
            if error_code is not None:
                CODE.append(error_code)

Спасибо @Qback, работает. Но когда я запускаю другие коды для обработки моих XML-данных, требуется только первый файл. Итак, как я могу сделать это с помощью цикла, который обрабатывает файлы один за другим. Например, если у меня есть 5 таких блоков кода: CODE = [ ] for errors in root.findall('.//Book/Message/Param/Buffer/Data/Field[11]'): error_code = errors.find('RawValue').text if error_code is not None: CODE.append(error_code) Я хочу, чтобы для каждого файла выполнялся код 1, 2, 3, 4 и 5, а затем перезапускался для следующего файла, подобного этому, до конца моего списка файлов.

— 25.04.2018 11:50

Почему бы не определить функцию для объединения этих 5 блоков кода?

— 25.04.2018 12:10

25.04.2018 11:07