Как отсортировать список объектов по атрибуту объектов?

У меня есть список объектов Python, которые я хотел бы отсортировать по атрибуту самих объектов. Список выглядит так:

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

У каждого объекта есть счетчик:

>>> ut[1].count
1L

Мне нужно отсортировать список по убыванию количества отсчетов.

Я видел несколько методов для этого, но я ищу лучшие практики в Python.

Сортировка КАК для тех, кто ищет дополнительную информацию о сортировке в Python.
Jeyekomon 30.05.2018 11:48

помимо operator.attrgetter ('attribute_name') вы также можете использовать функторы в качестве ключа, например object_list.sort (key = my_sorting_functor ('my_key')), намеренно исключив реализацию.

vijay shanker 08.04.2019 23:07
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
920
3
629 902
8
Перейти к ответу Данный вопрос помечен как решенный

Ответы 8

Ответ принят как подходящий
# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

Подробнее о сортировка по ключам.

Без проблем. Кстати, если Мухук прав и это список объектов Django, вам следует рассмотреть его решение. Однако для общего случая сортировки объектов мое решение, вероятно, является наилучшей практикой.

Triptych 31.12.2008 20:12

В больших списках вы получите лучшую производительность, используя в качестве ключа operator.attrgetter ('count'). Это просто оптимизированная (нижний уровень) форма лямбда-функции в этом ответе.

David Eyk 31.12.2008 22:35

Спасибо за отличный ответ. В случае, если это список словарей и «count» является одним из его ключей, его необходимо изменить, как показано ниже: ut.sort (key = lambda x: x ['count'], reverse = True)

dganesh2002 09.12.2016 00:20

Я полагаю, он заслуживает следующего обновления: если есть необходимость в сортировке по нескольким полям, это может быть достигнуто последовательными вызовами sort (), потому что python использует стабильный алгоритм сортировки.

zzz777 23.02.2020 17:41

Я получаю эту ошибку, может ли кто-нибудь добавить в ответ, как ее решить? ValueError: истинное значение массива с более чем одним элементом неоднозначно. Используйте a.any () или a.all ()

mattsmith5 01.04.2021 10:38

Добавьте в класс объекта расширенные операторы сравнения, затем используйте метод sort () списка. См. богатое сравнение в питоне.


Обновлять: Хотя этот метод сработает, я думаю, что решение от Triptych лучше подходит для вашего случая, потому что оно проще.

Он очень похож на список экземпляров модели Django ORM.

Почему бы не отсортировать их по такому запросу:

ut = Tag.objects.order_by('-count')

Это так, но с использованием django-tagging, поэтому я использовал встроенную функцию для захвата набора тегов для конкретного набора запросов, например: Tag.objects.usage_for_queryset (QuerySet, counts = True)

Nick Sergeant 31.12.2008 20:39

Самый быстрый способ, особенно если в вашем списке много записей, - использовать operator.attrgetter("count"). Однако это может работать в версии Python до оператора, поэтому было бы неплохо иметь запасной механизм. Тогда вы можете сделать следующее:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

Здесь я бы использовал имя переменной «keyfun» вместо «cmpfun», чтобы избежать путаницы. Метод sort () также принимает функцию сравнения через аргумент cmp =.

akaihola 02.01.2009 15:16

Это не работает, если объект имеет динамически добавленные атрибуты (если вы выполнили self.__dict__ = {'some':'dict'} после метода __init__). Но я не знаю, почему это могло быть иначе.

tutuca 08.01.2013 00:40

@tutuca: Я никогда не заменял экземпляр __dict__. Обратите внимание, что «объект, имеющий динамически добавляемые атрибуты» и «установка атрибута объекта __dict__» являются почти ортогональными понятиями. Я говорю это, потому что ваш комментарий, кажется, подразумевает, что установка атрибута __dict__ является требованием для динамического добавления атрибутов.

tzot 10.01.2013 03:14

@tzot: Я смотрю прямо на это: github.com/stochastic-technologies/goatfish/blob/master/… и использую этот итератор здесь: github.com/TallerTechnologies/dishey/blob/master/app.py#L28 вызывает ошибку атрибута. Может быть, из-за python3, но все же ...

tutuca 10.01.2013 08:06

@tutuca: Я бы сделал self.__dict__.update(kwargs) вместо self.__dict__= kwargs. В любом случае, возможно, это проблема Python 3, поскольку 2.7.3 кажется беги нормально. Позже я займусь Python 3.

tzot 11.01.2013 01:26

И еще есть это, который может предположить, что здесь виноват метакласс класса Model.

tzot 11.01.2013 01:33

@tzot, это не связано с django, атрибут goatfish Meta - это просто необработанный объект без какого-либо волшебства ... Я тестировал его в проекте python 2.7 и, похоже, работает, как ожидалось. Мне нужно будет прочитать дальше по этому вопросу ...

tutuca 14.01.2013 19:21

@tzot: если я понимаю использование operator.attrgetter, я мог бы предоставить функцию с любым именем свойства и вернуть отсортированную коллекцию.

IAbstract 24.02.2016 21:16

Для тех, кто ищет дополнительную информацию: wiki.python.org/moin/HowTo/Sorting#Operator_Module_Functions

alxs 20.01.2017 18:01
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

Читатели должны заметить, что метод key =:

ut.sort(key=lambda x: x.count, reverse=True)

во много раз быстрее, чем добавление к объектам расширенных операторов сравнения. Я был удивлен, прочитав это (стр. 485 книги «Python в двух словах»). Вы можете подтвердить это, запустив тесты в этой маленькой программе:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

Мои очень минимальные тесты показывают, что первая сортировка более чем в 10 раз медленнее, но в книге говорится, что в целом она всего примерно в 5 раз медленнее. Причина, по их словам, связана с сильно оптимизированным алгоритмом сортировки, используемым в python (Timsort).

Тем не менее, очень странно, что .sort (lambda) быстрее, чем старый добрый .sort (). Надеюсь, они это исправят.

Определение __cmp__ эквивалентно вызову .sort(cmp=lambda), а не .sort(key=lambda), так что это совсем не странно.

tzot 09.09.2019 10:46

@tzot совершенно прав. Первая сортировка должна снова и снова сравнивать объекты друг с другом. Вторая сортировка обращается к каждому объекту только один раз, чтобы извлечь его значение счетчика, а затем выполняет простую числовую сортировку, которая сильно оптимизирована. Более справедливое сравнение было бы longList2.sort(cmp = cmp). Я попробовал это, и он работал почти так же, как .sort(). (Также: обратите внимание, что параметр сортировки "cmp" был удален в Python 3.)

Bryan Roach 29.10.2019 07:56
cmp устарел в Python 3: docs.python.org/3/howto/…
neves 03.02.2021 01:40

Объектно-ориентированный подход

Хорошая практика - сделать логику сортировки объектов, если применимо, свойством класса, а не включать в каждый экземпляр, где требуется упорядочение.

Это обеспечивает согласованность и устраняет необходимость в стандартном коде.

Как минимум, вы должны указать операции __eq__ и __lt__, чтобы это работало. Тогда просто используйте sorted(list_of_objects).

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

Вот что я искал! Не могли бы вы указать нам на некоторую документацию, в которой разъясняется, почему __eq__ и __lt__ являются минимальными требованиями к реализации?

FriendFX 07.08.2019 03:23

@FriendFX, я считаю, что это подразумевается это: •The sort routines are guaranteed to use __lt__() when making comparisons between two objects...

jpp 07.08.2019 11:04

@FriendFX: см. portingguide.readthedocs.io/en/latest/comparisons.html для сравнения и сортировки

Cornel Masson 19.02.2020 13:30

Если атрибут, по которому вы хотите выполнить сортировку, - это имущество, то вы можете избежать импорта operator.attrgetter и вместо этого использовать метод свойства fget.

Например, для класса Circle со свойством radius мы можем отсортировать список circles по радиусам следующим образом:

result = sorted(circles, key=Circle.radius.fget)

Это не самая известная функция, но она часто спасает меня от импорта.

Другие вопросы по теме