Как мне разделить строку LSF?

Предположим, у меня есть следующий LSF:

873411_ExtraNode -q lnx64 -P someprog:98.90:PV:DY -W 90:08 -R "rusage[mem=5000] select[(OSME==Linux) && ( (OEL==EV70&&SFIPLATFORM>=c0896)||(OEL==EG70&&SFIPLATFORM>=d0298)||(OEL==SHGS12&&SFIPLATFORM>=d0298)||(OEL==SHGS11&&SFIPLATFORM>=d0290))]"

Я хочу разделить это так, чтобы я мог получить JSON или словарь всех переключателей (в виде ключей) вместе со значениями. Первое буквенно-цифровое слово также является значением для ключа «name». Также должно быть внутреннее разделение по каждому атрибуту, передаваемому в rusage.

Я не могу сформировать такое сложное регулярное выражение, и разделение этого значения в каждой точке кажется очень непитоническим способом кодирования.

Ожидаемый результат:

lsf =

{ "name" : "873411_ExtraNode",

 "-q" : "lnx64",
 "-P" : "someprog:98.90:PV:DY",
 "-W" : "90:08",
 "-R" : "rusage"
 "rusage" :[
   {
       "mem" : "5000",
       "OSME" : "Linux",
       "OEL" : "EV70, EG70, SHGS12, SHGS11",
       "SFIPLATFORM" : ">=c0896, d0298, d0298, d0290"
   }
]
}

Любые выводы приветствуются. Спасибо.

Предоставьте ожидаемый результат.

— 04.08.2018 17:01

@andrew_reece сделал это.

— 04.08.2018 17:16

rusage должен быть ключом dict?

— 04.08.2018 17:18

да, вместе с подключами (если возможно в какой-либо структуре данных) mem, OSME и т. д.

— 04.08.2018 17:21

В этом случае отформатируйте код правильно.

— 04.08.2018 17:22

но это формат, который я буду читать из текстового файла.

— 04.08.2018 17:23

Я имею в виду правильно отформатировать ожидаемый выход. В настоящее время rusage записывается как переменная, а не как ключ к dict.

— 04.08.2018 17:24

python regex python-3.x

04.08.2018 16:59

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете разделить строку из примера с помощью shlex.split (документы здесь), регулярное выражение не требуется:

import shlex
from pprint import pprint

s = '''873411_ExtraNode -q lnx64 -P someprog:98.90:PV:DY -W 90:08 -R "rusage[mem=5000] select[(OSME==Linux) && ( (OEL==EV70&&SFIPLATFORM>=c0896)||(OEL==EG70&&SFIPLATFORM>=d0298)||(OEL==SHGS12&&SFIPLATFORM>=d0298)||(OEL==SHGS11&&SFIPLATFORM>=d0290))]"'''

l = shlex.split(s)
d = {switch:value for switch, value in zip(l[1::2], l[2::2])}
d['name'] = l[0]
pprint(d)

Печать:

{'-P': 'someprog:98.90:PV:DY',
 '-R': 'rusage[mem=5000] select[(OSME==Linux) && ( '
       '(OEL==EV70&&SFIPLATFORM>=c0896)||(OEL==EG70&&SFIPLATFORM>=d0298)||(OEL==SHGS12&&SFIPLATFORM>=d0298)||(OEL==SHGS11&&SFIPLATFORM>=d0290))]',
 '-W': '90:08',
 '-q': 'lnx64',
 'name': '873411_ExtraNode'}

Обновлено:

Для разбора параметра -R можно использовать re. (объяснение регулярного выражения здесь).

import shlex
import re
from collections import defaultdict, OrderedDict
from pprint import pprint

s = '''873411_ExtraNode -q lnx64 -P someprog:98.90:PV:DY -W 90:08 -R "rusage[mem=5000] select[(OSME==Linux) && ( (OEL==EV70&&SFIPLATFORM>=c0896)||(OEL==EG70&&SFIPLATFORM>=d0298)||(OEL==SHGS12&&SFIPLATFORM>=d0298)||(OEL==SHGS11&&SFIPLATFORM>=d0290))]"'''

def parse_r(s):
    d = defaultdict(list)
    groups = re.finditer(r'rusage.*?(?P<rusage>\d+)|OSME.*?(?P<osme>\w+)|OEL.*?(?P<oel>\w+)|SFIPLATFORM.*?(?P<sfiplatform>[<>=\w]+)', s)
    for g in groups:
        for k, v in g.groupdict().items():
            if not v:
                continue
            d[k] += [v]
    return d

l = shlex.split(s)
d = OrderedDict(( (switch, value) for switch, value in zip(l[1::2], l[2::2]) ))
d['name'] = l[0]
d['-R'] = parse_r(d['-R'])
pprint(d)

Печать:

OrderedDict([('-q', 'lnx64'),
             ('-P', 'someprog:98.90:PV:DY'),
             ('-W', '90:08'),
             ('-R',
              defaultdict(<class 'list'>,
                          {'oel': ['EV70', 'EG70', 'SHGS12', 'SHGS11'],
                           'osme': ['Linux'],
                           'rusage': ['5000'],
                           'sfiplatform': ['>=c0896',
                                           '>=d0298',
                                           '>=d0298',
                                           '>=d0290']})),
             ('name', '873411_ExtraNode')])

это здорово. но две вещи, порядок не тот, также могу ли я дополнительно разбить данные rusage. Я обновил вопрос с ожидаемым результатом. Пожалуйста, проверьте.

— 04.08.2018 17:18

04.08.2018 17:07