Если у меня есть словарь, содержащий списки в одном или нескольких его значениях:
data = {
'a':0,
'b':1,
'c':[0, 1, 2],
'pair':['one','two']
}
Как я могу получить список кортежей dict, спаренных pair и перебирающих c, при этом все остальное остается постоянным? Например.
output = [
({
'a':0,
'b':1,
'c':0,
'pair':'one'
},
{
'a':0,
'b':1,
'c':0,
'pair':'two'
}),
({
'a':0,
'b':1,
'c':1,
'pair':'one'
},
...
]
@ user3483203 есть многоточие
Вы заранее знаете ключи значений, которые хотите «расширить»? Правильно ли я понимаю, что полученный список сродни декартову произведению развернутых значений?
Ваша идея расширить диктовку могла бы стать интересным вопросом. Этот вопрос был специально о получении «списка кортежей dict, спаренных pair и перебирающих c, при этом все остальное остается постоянным» с учетом начального dict.
Я искренне думаю, что вы хотите попробовать решить проблему неверным решением. Возможно, опубликуйте отзывы и желаемый результат и опишите проблемную область.






Что ж, это не кажется особенно элегантным, но вы можете использовать вложенный цикл for или понимание списка:
output = []
for i in data['c']:
output.append(tuple({'a': 0, 'b': 1, 'c': i, 'pair': p} for p in data))
или же
output = [tuple({'a': 0, 'b': 1, 'c': i, 'pair': p} for p in data['pair']) for i in data['c']]
Более чистое решение могло бы выделить генерацию компонента dict в функцию, например:
def gen_output_dict(c, pair):
return {'a': 0, 'b': 1, 'c': c, 'pair': pair}
output = []
for i in data['c']:
output.append(tuple(gen_output_dict(i, p) for p in data['pair']))
Что, если OP имеет множество ключей и значений, он должен просмотреть весь словарь и найти ключи, значение которых является типом списка
Вы знаете, что такое @ U8-Forward, вы, вероятно, правы, что OP спрашивал о более общем случае итерации по спискам.
Вы можете использовать itertools.product для значений списка и отслеживать ключ, из которого произошел каждый элемент. Поскольку ключ 'pair' имеет особое значение, к нему следует относиться отдельно.
from itertools import product
def unzip_dict(d):
keys = [k for k, v in d.items() if isinstance(v, list) and k != 'pair']
values = [d[k] for k in keys]
for values in product(*values):
yield tuple({**d, **dict(zip(keys, values)), 'pair': pair} for pair in d['pair'])
data = {
'a': 0,
'c': [1, 2],
'pair': ['one', 'two']
}
print(*unzip_dict(data))
({'a': 0, 'c': 1, 'pair': 'one'}, {'a': 0, 'c': 1, 'pair': 'two'})
({'a': 0, 'c': 2, 'pair': 'one'}, {'a': 0, 'c': 2, 'pair': 'two'})
Это тоже было моим инстинктом, но потом я заметил, что у них есть требование об объединении элементов в кортежи внутри списка на основе значения ключа pair (фактически, на основе значения ключей c). Вы все еще можете использовать продукт itertools, но он будет немного менее общим.
@jedwards Есть обновленная версия, спасибо за внимание.
Вы можете использовать itertools:
import itertools
data = {
'a':0,
'b':1,
'c':[0, 1, 2],
'pair':['one','two']
}
def expand_dict(data):
grouped = [a for a, b in data.items() if isinstance(b, list)]
p = [[a, list(b)] for a, b in itertools.groupby(itertools.product(*[data[i] for i in grouped]), key=lambda x:x[0])]
return [tuple({**data, **dict(zip(grouped, i))} for i in c) for _, c in p]
print(expand_dict(data))
Выход:
[({'a': 0, 'b': 1, 'c': 0, 'pair': 'one'}, {'a': 0, 'b': 1, 'c': 0, 'pair': 'two'}),
({'a': 0, 'b': 1, 'c': 1, 'pair': 'one'}, {'a': 0, 'b': 1, 'c': 1, 'pair': 'two'}),
({'a': 0, 'b': 1, 'c': 2, 'pair': 'one'}, {'a': 0, 'b': 1, 'c': 2, 'pair': 'two'})]
Это решение также будет работать с вводом со многими возможными списками значений:
data = {'a':[5, 6, 1, 3], 'b':1, 'c':[0, 1, 2], 'pair':['one', 'two']}
print(expand_dict(data))
Выход:
[({'a': 5, 'b': 1, 'c': 0, 'pair': 'one'}, {'a': 5, 'b': 1, 'c': 0, 'pair': 'two'}, {'a': 5, 'b': 1, 'c': 1, 'pair': 'one'}, {'a': 5, 'b': 1, 'c': 1, 'pair': 'two'}, {'a': 5, 'b': 1, 'c': 2, 'pair': 'one'}, {'a': 5, 'b': 1, 'c': 2, 'pair': 'two'}), ({'a': 6, 'b': 1, 'c': 0, 'pair': 'one'}, {'a': 6, 'b': 1, 'c': 0, 'pair': 'two'}, {'a': 6, 'b': 1, 'c': 1, 'pair': 'one'}, {'a': 6, 'b': 1, 'c': 1, 'pair': 'two'}, {'a': 6, 'b': 1, 'c': 2, 'pair': 'one'}, {'a': 6, 'b': 1, 'c': 2, 'pair': 'two'}), ({'a': 1, 'b': 1, 'c': 0, 'pair': 'one'}, {'a': 1, 'b': 1, 'c': 0, 'pair': 'two'}, {'a': 1, 'b': 1, 'c': 1, 'pair': 'one'}, {'a': 1, 'b': 1, 'c': 1, 'pair': 'two'}, {'a': 1, 'b': 1, 'c': 2, 'pair': 'one'}, {'a': 1, 'b': 1, 'c': 2, 'pair': 'two'}), ({'a': 3, 'b': 1, 'c': 0, 'pair': 'one'}, {'a': 3, 'b': 1, 'c': 0, 'pair': 'two'}, {'a': 3, 'b': 1, 'c': 1, 'pair': 'one'}, {'a': 3, 'b': 1, 'c': 1, 'pair': 'two'}, {'a': 3, 'b': 1, 'c': 2, 'pair': 'one'}, {'a': 3, 'b': 1, 'c': 2, 'pair': 'two'})]
op хочет a list of dict tuples paired by pair and iterating over c, но ваш скрипт объединяет случайный ключ (data.items()) и выполняет итерацию по другому
@bobrobbob Да, но обратите внимание на [data[i] for i in grouped]. В то время как data.items() является случайным, [data[i] for i in grouped] найдет значения данных в порядке, созданном data.items(). Это действительное связывание по-прежнему поддерживается с zip(grouped, i).
возможно, я неправильно определил причину вашего случайного вывода, но он все равно случайный. я не думаю, что здесь можно избежать жесткого кодирования
Следующее - довольно расширенное решение:
data = {
'a':0,
'b':1,
'c':[0, 1, 2],
'pair':['one','two']
}
# Get the length of the longest sequence
length = max(map(lambda x: len(x) if isinstance(x, list) else 1, data.values()))
# Loop through the data and change scalars to sequences
# while also making sure that smaller sequences are stretched to match
# or exceed the length of the longest sequence
for k, v in data.items():
if isinstance(v, list):
data[k] = v * int(round(length/len(v), 0))
else:
data[k] = [v] * length
# Create a dictionary to keep track of which outputs
# need to end up in which tuple
seen = dict.fromkeys(data.get('pair'), 0)
output = [tuple()] * len(seen)
# Loop through the data and place dictionaries in their
# corresponding tuples.
for v in zip(*data.values()):
d = dict(zip(data, v))
output[seen[d.get('pair')]] += (d,)
seen[d.get('pair')] += 1
print(output)
Идея состоит в том, чтобы преобразовать скаляры в ваших данных в последовательности, длина которых соответствует длине самой длинной последовательности в исходных данных. Поэтому первым делом я присвоил переменной length размер самой длинной последовательности. Вооружившись этими знаниями, мы перебираем исходные данные и расширяем уже существующие последовательности, чтобы они соответствовали размеру самой длинной последовательности, при этом преобразуя скаляры в последовательности.
Как только это будет сделано, мы переходим к созданию переменной output. Но сначала мы создаем словарь под названием seen, чтобы помочь нам создать список кортежей и отслеживать, какая группа словарей попадает в какой кортеж.
Таким образом, это позволяет нам запустить последний цикл, чтобы поместить группы словарей в их соответствующие кортежи.
Текущий вывод выглядит следующим образом:
[({'a': 0, 'b': 1, 'c': 0, 'pair': 'one'},
{'a': 0, 'b': 1, 'c': 1, 'pair': 'two'}),
({'a': 0, 'b': 1, 'c': 2, 'pair': 'one'},)]
Пожалуйста, дайте мне знать, если вам понадобятся дополнительные уточняющие детали. В противном случае я действительно надеюсь, что это послужит какой-то цели.
data = { 'a':0, 'b':1, 'c':[0, 1, 2], 'pair':['one','two'] }
a,b = data['pair'], data['c']
for t in range(0, len(b)):
for u in range(0, len(a)):
for h in a:
data['c']=b[t]
data['pair']=a[u]
print(tuple([data]))
@ r3robertson, Вы также можете попробовать приведенный ниже код. Код основан на концепции list comprehension и deepcopy() operation в Python.
import pprint;
import copy;
data = {
'a': 0,
'b': 1,
'c': [0, 1, 2],
'pair': ['one','two'],
};
def get_updated_dict(data, index, pair_name):
d = copy.deepcopy(data);
d.update({'c': index, 'pair': pair_name});
return d;
output = [tuple(get_updated_dict(data, index, pair_name) for pair_name in data['pair']) for index in data['c']];
# Pretty printing the output list.
pprint.pprint(output, indent=4);
Выход "
[ ( { 'a': 0, 'b': 1, 'c': 0, 'pair': 'one'},
{ 'a': 0, 'b': 1, 'c': 0, 'pair': 'two'}),
( { 'a': 0, 'b': 1, 'c': 1, 'pair': 'one'},
{ 'a': 0, 'b': 1, 'c': 1, 'pair': 'two'}),
( { 'a': 0, 'b': 1, 'c': 2, 'pair': 'one'},
{ 'a': 0, 'b': 1, 'c': 2, 'pair': 'two'})]
Хорошая печать с использованием модуля json »
Note: Tuple will convert into list here as tuples are not supported inside JSON.
import json;
print(json.dumps(output, indent=4));
Выход "
[
[
{
"a": 0,
"c": 0,
"b": 1,
"pair": "one"
},
{
"a": 0,
"c": 0,
"b": 1,
"pair": "two"
}
],
[
{
"a": 0,
"c": 1,
"b": 1,
"pair": "one"
},
{
"a": 0,
"c": 1,
"b": 1,
"pair": "two"
}
],
[
{
"a": 0,
"c": 2,
"b": 1,
"pair": "one"
},
{
"a": 0,
"c": 2,
"b": 1,
"pair": "two"
}
]
]
Почему последний элемент
c1вместо2?