У меня есть список объектов Python, которые я хотел бы отсортировать по атрибуту самих объектов. Список выглядит так:
>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
<Tag: aes>, <Tag: ajax> ...]
У каждого объекта есть счетчик:
>>> ut[1].count
1L
Мне нужно отсортировать список по убыванию количества отсчетов.
Я видел несколько методов для этого, но я ищу лучшие практики в Python.
помимо operator.attrgetter ('attribute_name') вы также можете использовать функторы в качестве ключа, например object_list.sort (key = my_sorting_functor ('my_key')), намеренно исключив реализацию.






# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)
# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)
Подробнее о сортировка по ключам.
Без проблем. Кстати, если Мухук прав и это список объектов Django, вам следует рассмотреть его решение. Однако для общего случая сортировки объектов мое решение, вероятно, является наилучшей практикой.
В больших списках вы получите лучшую производительность, используя в качестве ключа operator.attrgetter ('count'). Это просто оптимизированная (нижний уровень) форма лямбда-функции в этом ответе.
Спасибо за отличный ответ. В случае, если это список словарей и «count» является одним из его ключей, его необходимо изменить, как показано ниже: ut.sort (key = lambda x: x ['count'], reverse = True)
Я полагаю, он заслуживает следующего обновления: если есть необходимость в сортировке по нескольким полям, это может быть достигнуто последовательными вызовами sort (), потому что python использует стабильный алгоритм сортировки.
Я получаю эту ошибку, может ли кто-нибудь добавить в ответ, как ее решить? ValueError: истинное значение массива с более чем одним элементом неоднозначно. Используйте a.any () или a.all ()
Добавьте в класс объекта расширенные операторы сравнения, затем используйте метод sort () списка. См. богатое сравнение в питоне.
Обновлять: Хотя этот метод сработает, я думаю, что решение от Triptych лучше подходит для вашего случая, потому что оно проще.
Он очень похож на список экземпляров модели Django ORM.
Почему бы не отсортировать их по такому запросу:
ut = Tag.objects.order_by('-count')
Это так, но с использованием django-tagging, поэтому я использовал встроенную функцию для захвата набора тегов для конкретного набора запросов, например: Tag.objects.usage_for_queryset (QuerySet, counts = True)
Самый быстрый способ, особенно если в вашем списке много записей, - использовать operator.attrgetter("count"). Однако это может работать в версии Python до оператора, поэтому было бы неплохо иметь запасной механизм. Тогда вы можете сделать следующее:
try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda
ut.sort(key=keyfun, reverse=True) # sort in-place
Здесь я бы использовал имя переменной «keyfun» вместо «cmpfun», чтобы избежать путаницы. Метод sort () также принимает функцию сравнения через аргумент cmp =.
Это не работает, если объект имеет динамически добавленные атрибуты (если вы выполнили self.__dict__ = {'some':'dict'} после метода __init__). Но я не знаю, почему это могло быть иначе.
@tutuca: Я никогда не заменял экземпляр __dict__. Обратите внимание, что «объект, имеющий динамически добавляемые атрибуты» и «установка атрибута объекта __dict__» являются почти ортогональными понятиями. Я говорю это, потому что ваш комментарий, кажется, подразумевает, что установка атрибута __dict__ является требованием для динамического добавления атрибутов.
@tzot: Я смотрю прямо на это: github.com/stochastic-technologies/goatfish/blob/master/… и использую этот итератор здесь: github.com/TallerTechnologies/dishey/blob/master/app.py#L28 вызывает ошибку атрибута. Может быть, из-за python3, но все же ...
@tutuca: Я бы сделал self.__dict__.update(kwargs) вместо self.__dict__= kwargs. В любом случае, возможно, это проблема Python 3, поскольку 2.7.3 кажется беги нормально. Позже я займусь Python 3.
И еще есть это, который может предположить, что здесь виноват метакласс класса Model.
@tzot, это не связано с django, атрибут goatfish Meta - это просто необработанный объект без какого-либо волшебства ... Я тестировал его в проекте python 2.7 и, похоже, работает, как ожидалось. Мне нужно будет прочитать дальше по этому вопросу ...
@tzot: если я понимаю использование operator.attrgetter, я мог бы предоставить функцию с любым именем свойства и вернуть отсортированную коллекцию.
Для тех, кто ищет дополнительную информацию: wiki.python.org/moin/HowTo/Sorting#Operator_Module_Functions
from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)
Читатели должны заметить, что метод key =:
ut.sort(key=lambda x: x.count, reverse=True)
во много раз быстрее, чем добавление к объектам расширенных операторов сравнения. Я был удивлен, прочитав это (стр. 485 книги «Python в двух словах»). Вы можете подтвердить это, запустив тесты в этой маленькой программе:
#!/usr/bin/env python
import random
class C:
def __init__(self,count):
self.count = count
def __cmp__(self,other):
return cmp(self.count,other.count)
longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]
longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs
Мои очень минимальные тесты показывают, что первая сортировка более чем в 10 раз медленнее, но в книге говорится, что в целом она всего примерно в 5 раз медленнее. Причина, по их словам, связана с сильно оптимизированным алгоритмом сортировки, используемым в python (Timsort).
Тем не менее, очень странно, что .sort (lambda) быстрее, чем старый добрый .sort (). Надеюсь, они это исправят.
Определение __cmp__ эквивалентно вызову .sort(cmp=lambda), а не .sort(key=lambda), так что это совсем не странно.
@tzot совершенно прав. Первая сортировка должна снова и снова сравнивать объекты друг с другом. Вторая сортировка обращается к каждому объекту только один раз, чтобы извлечь его значение счетчика, а затем выполняет простую числовую сортировку, которая сильно оптимизирована. Более справедливое сравнение было бы longList2.sort(cmp = cmp). Я попробовал это, и он работал почти так же, как .sort(). (Также: обратите внимание, что параметр сортировки "cmp" был удален в Python 3.)
Объектно-ориентированный подход
Хорошая практика - сделать логику сортировки объектов, если применимо, свойством класса, а не включать в каждый экземпляр, где требуется упорядочение.
Это обеспечивает согласованность и устраняет необходимость в стандартном коде.
Как минимум, вы должны указать операции __eq__ и __lt__, чтобы это работало. Тогда просто используйте sorted(list_of_objects).
class Card(object):
def __init__(self, rank, suit):
self.rank = rank
self.suit = suit
def __eq__(self, other):
return self.rank == other.rank and self.suit == other.suit
def __lt__(self, other):
return self.rank < other.rank
hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand] # [10, 2, 12, 13, 14]
hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted] # [2, 10, 12, 13, 14]
Вот что я искал! Не могли бы вы указать нам на некоторую документацию, в которой разъясняется, почему __eq__ и __lt__ являются минимальными требованиями к реализации?
@FriendFX, я считаю, что это подразумевается это: •The sort routines are guaranteed to use __lt__() when making comparisons between two objects...
@FriendFX: см. portingguide.readthedocs.io/en/latest/comparisons.html для сравнения и сортировки
Если атрибут, по которому вы хотите выполнить сортировку, - это имущество, то вы можете избежать импорта operator.attrgetter и вместо этого использовать метод свойства fget.
Например, для класса Circle со свойством radius мы можем отсортировать список circles по радиусам следующим образом:
result = sorted(circles, key=Circle.radius.fget)
Это не самая известная функция, но она часто спасает меня от импорта.
Dupe: stackoverflow.com/questions/157424/…, stackoverflow.com/questions/222752/…, stackoverflow.com/questions/327191/…