Извлечение узлов из json на основе пользовательского ввода с сохранением части объекта более высокого уровня

необходимо извлечь объект из данного json на основе цепочки узлов, переданной пользователем, и игнорировать те, которых нет в пользовательский ввод, затем создайте новый объект json

мой мастер json:

{
"menustructure": 
[
        {
         "node":"Admin",
         "path":"admin",
            "child":[
                    {
                        "id": "resouce0",
                        "node": "Admin.resouce0",
                        "path":"resouce0",
                        "rank":0,
                        "child":[
                             {   
                                "id": "res_child",
                                "node": "Admin.resouce0.res_child",
                                "path":"res_child",
                                "rank":1
                             },
                             {   
                                "id": "res_child2",
                                "node": "Admin.resouce0.res_child2",
                                "path":"res_child",
                                "rank":1
                             }
                                ]
                     },
                    {
                        "id": "resouce1",
                        "node": "Admin.resouce1",
                        "path":"resouce1",
                        "rank":1
                     },
                
                    {
                        "id": "resouce2",
                        "node":"Admin.resouce2",
                        "path": "oath",
                        "rank":2
                    }
                   ]
        },
        {
            "node":"Workspace",
            "path": "wsp",
            "child":[{
                    "id":"system1",
                    "node": "Workspace.system1",
                    "path":"sys1",
                    "child":[{
                           "id": "child1",
                           "node": "Workspace.system1.child1",
                           "path":"ch1"
                
                        }]
                
                },
                {   
                    "id":"system2",
                    "node": "Workspace.system2",
                    "path":"sys2"
                }
            ]
        }]}

например, если пользователь проходит ['Admin.resource1', 'Workspace'], ожидаемый вывод json будет Примечание '.' в элементе введенного пользователем списка означает, что узел имеет дочерние узлы, а новый json будет иметь все эти сведения о дочернем узле, включая сведения о родительском узле.

{
    "menustructure": 
    [
            {
             "node":"Admin",
             "path":"admin",
                "child":[
                        {   "id": "resouce1",
                            "node": "Admin.resouce1",
                            "path":"resouce1",
                            "rank":1
                         }
                       ]
            },
            {
                "node":"Workspace",
                "path": "wsp",
                "child":[{
                        "id": "system1",
                        "node": "Workspace.system1",
                        "path":"sys1"
                         "child":[{
                           "id": "child1",
                           "node": "Workspace.system1.child1",
                           "path":"ch1"
                    
                    },
                    {   "id": "system2",
                        "node": "Workspace.system2",
                        "path":"sys2"
                    }
                ]
            }

        
    ]
}

или другой пример: ['Admin.resouce2', 'workspace.system1'] тогда ожидаемый json будет:

{
    "menustructure": 
    [
            {
             "node":"Admin",
             "path":"admin",
                "child":[
                        
                        {"id": "resouce2","node":"Admin.resouce2",
                            "path": "oath",
                            "rank":2
                        }
                       ]
            },
            {
                "node":"Workspace",
                "path": "wsp",
                "child":[{
                        "id": "system1",
                        "node": "Workspace.system1",
                        "path":"sys1"
                        "child":[{
                           "id": "child1",
                           "node": "Workspace.system1.child1",
                           "path":"ch1"
                    
                    }
                ]
            }
    ]
}

или если прошел только один узел ['Admin'], то вывод json будет:

{
    "menustructure": 
    [
            {
             "node":"Admin",
             "path":"admin",
                "child":[
                        {
                            "id": "resouce1",
                            "node": "Admin.resouce1",
                            "path":"resouce1",
                            "rank":1
                         },
                    
                        {"id": "resouce2","node":"Admin.resouce2",
                            "path": "oath",
                            "rank":2
                        }
                       ]
            }   
    ]
}

Код, который я пробовал, работает для одного уровня ребенка:

master = json.loads(m)
menustruct = []
test_master = master['menustructure']
temp_json = test_master
nde = ['Admin.resouce1', 'Admin.resouce0', 'Workspace.system2']
temp_data = master['menustructure']
#print(temp_data)
final_data = []
parent_node = []
for m in nde:
    items = copy.deepcopy(temp_data)
    if "." in m:
        menu_series = m.split(".")
        for item in items:
            if item['node'] == menu_series[0]:
                item_child_nodes = item['child']
                child = None
                for node in item_child_nodes:
                    if node['id'] != menu_series[1]:
                        item_child_nodes.remove(node)
                    else:
                        child = node

                if menu_series[0] in parent_node:
                    for i in final_data:
                        if i['node'] == menu_series[0]:
                            i['child'].append(child)
                else:
                    final_data.append(item)
                #print(item_child_nodes)
        parent_node.append(menu_series[0])

    else:
        for item in items:
            if item['node'] == m:
                final_data.append(item)
t = {}
t['menustructure'] = final_data
print(t)

но не понимаю, как обрабатывать несколько дочерних уровней, например

{master -> child -> child} or {master -> child -> child -> child}

многоуровневый дочерний элемент присутствует в Workspace.system1 Если дочерний родитель уже существует, то дочерний элемент должен быть добавлен в родительский узел в результате json

Я попробовал Glom lib, но он не работает должным образом. Любая помощь в том, как решить многоуровневую дочернюю проблему.

В вашем примере, используя «мастер json», я не знаю, правильно ли вы скопировали его в SO, но он пронизан отсутствующими разделителями/запятыми и скобками. Я хочу сделать решение, но я был бы признателен, если бы вы сначала исправили это (чтобы он правильно работал с json.loads)

Nordine Lotfi 22.11.2022 11:08

@NordineLotfi Я обновил мастер json, извините за ошибку

vineet singh 22.11.2022 11:30
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
2
127
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вот мое решение. Идея состоит в том, чтобы рекурсивно пройти по структуре и удалить узлы, которые не соответствуют вводу пользователя. Алгоритм не изменяет входные данные, а создает неглубокую копию поддерева только при изменении атрибута child.

def extract(data, query):
    return {
        "menustructure": extract_nodes(
            data["menustructure"], [x.split(".") for x in query]
        )
    }


def matches(name, query):
    name = name.split(".")
    for q in query:
        size = min(len(q), len(name))
        if name[:size] == q[:size]:
            return True

    return False


def extract_nodes(data, query):
    if isinstance(data, list):
        data = [
            extract_nodes(x, query)
            for x in data
            if matches(x["node"], query)
        ]
        return [x for x in data if x is not None]

    if isinstance(data, dict) and matches(data["node"], query):
        if "child" in data:
            children = extract_nodes(data["child"], query)
            if len(children) != len(data["child"]):
                data = data.copy()  # copy-on-write
                data["child"] = children
            if not data["child"]:
                return None
        return data

Применение:

import json
data = json.loads(m)
result = extract(data, ["Admin.resouce1", "Workspace.system1"])
print(json.dumps(result, indent=4))


result = extract(data, ["Admin.resouce0.res_child"])
print(json.dumps(result, indent=4))

этот код отлично работает для 1 уровня дочернего элемента, например, «Admin.resouce1», но не работает для дочернего элемента дочернего элемента, например: «Admin.resouce0.res_child». Вывод кода для него отфильтровывает дочерний элемент уровня 1, но возвращает все дочерние элементы resouce0 вместо возврата только res_child. любая идея о том, как применить ту же логику для дочернего элемента.

vineet singh 22.11.2022 16:00

Улучшенная логика сопоставления. Код вернул как res_child, так и res_child2, потому что у них одинаковый префикс. Теперь он возвращает только res_child для Admin.resouce0.res_child

Alexander Volkovsky 22.11.2022 16:16

Другие вопросы по теме