Учитывая такой список
arr = [1, 1, 2, 2, 2, 3, 3]
Я хотел бы вычислить количество вхождений каждого элемента и сохранить его в новом списке, но используя такое понимание списка:
occ = [arr.count(e) for e in arr]
но это распечатывает оригинал array: [1, 1, 2, 2, 2, 3, 3]
вместо [2, 3, 2]
, которые являются соответственно количеством вхождений 1, 2 и 3 во входном массиве.
Почему так происходит и как это исправить?
NB: по возможности обязательно использовать понимание списка.
Ну, причина в том, что когда вы делаете
arr = [1, 1, 2, 2, 2, 3, 3]
и arr.count(1) вы получите количество вхождений числа 1 в списке arr. И тогда, когда вы делаете
occ = [arr.count(e) for e in arr]
вы фактически вычисляете arr.count(1) 2 раза, затем arr.count(3) три раза, а затем arr.count(3) два раза.
Итак, что вам нужно сделать, чтобы не повторять числа, так это подсчитать уникальные числа в списке, а именно 1, 2 и 3. Таким образом, правильный код будет таким:
occ = [arr.count(e) for e in set(arr)]
и теперь, когда вы печатаете список, вы получите [2,3,2], как и ожидалось.
Он хочет [2, 3, 2]
не [2, 3, 1]
Вы, вероятно, хотите sorted(set(arr))
, если хотите последовательного заказа.
Наборы неупорядочены. Как бы вы определили, какое целое число на выходе соответствует какому целому числу на входе?
это была опечатка, но результат [2,3,2]
@Chris, это было бы довольно просто, просто выполните unique_arr = set(arr) occ = [arr.count(e) for e in unique_arr] import pandas as pd pd.DataFrame([unique_arr,occ]).T, а затем получить, какое число вы считаете
OP не использует Pandas, и это не помечено для Pandas. Не думайте, что такие библиотеки установлены, пожалуйста.
Извините, я просто подумал, что это самый простой и понятный способ увидеть, о чем вы спрашивали. Для тех, у кого панды не установлены, просто напишите pip install pandas на своем терминале.
Я получаю
occ == [2, 2, 3, 3, 3, 2, 2]