Понимание временной сложности вложенной сортировки

Я решаю задачу LeetCode 1636. Сортировка массива по возрастанию частоты:

Дан массив целых чисел nums, отсортируйте его в порядке возрастания в зависимости от частоты значений. Если несколько значений имеют одинаковую частоту, отсортируйте их в порядке убывания.
Вернуть отсортированный массив.

Я написал следующий рабочий код:

class Solution:
    def frequencySort(self, nums: List[int]) -> List[int]:
        ddict = Counter(nums)
        ddict = dict(sorted(ddict.items(), key=lambda x:(x[1], x[0])))

        defDict = defaultdict(list)
        res = []
        for k, v in ddict.items():
            defDict[v].append(k)
        
        del(ddict)
        for k, v in defDict.items():
            v.sort(reverse=True)
            for val in v:
                for _ in range(k):
                    res.append(val)

        return res

Я думаю, что его временная сложность равна O(n.(nlog(n)), потому что в худшем случае я сортирую каждый список в defaultdict для каждого ключа.

Но анализ временной сложности в LeetCode, а также инструменты искусственного интеллекта, такие как (nlog (n))?

Это O(n.(nlog(n)). Это просто не так уж и сложно.

— 23.07.2024 13:43

@nocomment Не могли бы вы объяснить подробнее, что вы имеете в виду под «не жесткой границей»? Вероятно, это пример, где это может быть O(n.(nlog(n)). Я запутался :(

— 23.07.2024 16:11

Точно так же, как, например, сортировка слиянием — O(n^3). Эта граница не является неправильной, она просто не жесткая.

— 23.07.2024 16:17

Вы имеете в виду трехстороннюю сортировку слиянием @nocomment?

— 23.07.2024 16:21

Нет, просто стандартная сортировка слиянием, которая также является O(n log n).

— 23.07.2024 16:42

Извините :( Но я не понимаю. У вас есть что-нибудь, на что я могу сослаться? @nocomment

— 23.07.2024 16:45

Вероятно, вам следует обратиться к определению обозначения big-O. Сортировка слиянием — это O(n log n) и O(n^3). Это даже O(n^1000). Точно так же, как яблоко, которое стоит менее 1 доллара, также стоит меньше 1000 долларов.

— 23.07.2024 16:50

python algorithm sorting data-structures defaultdict

23.07.2024 11:22

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Сортировка отдельных фрагментов данных по-прежнему будет занимать O(𝑛log𝑛). Например, предположим, что у вас есть ключи 𝑘 в defDict, каждый из которых имеет список (v) со средней длиной 𝑛/𝑘, тогда сортировка каждого из этих v составит сложность O(𝑘 (𝑛/𝑘) log(𝑛/𝑘)), что равно O(𝑛log(𝑛/𝑘)), что не хуже, чем O(𝑛log𝑛).

Обратите внимание, что ваш v уже отсортирован в порядке возрастания до того, как будет выполнен вызов v.sort, и вы могли бы просто поменять v. Поскольку встроенная сортировка Python (timsort) хорошо справляется с такими входными данными, она будет работать за O(𝑘), где 𝑘 — размер v, что означает, что эта часть вашего алгоритма представляет O(𝑛) как временную сложность, что делает начальная сортировка — определяющий шаг в отношении общей временной сложности: O(𝑛log𝑛).

Спасибо, теперь это имеет смысл. Итак, подведем итог: сортировка каждого списка в defDict не вносит существенного вклада в общую временную сложность в худшем случае. Потому что в худшем случае каждый список в defDict будет иметь максимальный размер, равный количеству элементов с одинаковой частотой. Это означает, что максимальный размер любого списка ограничен n (общее количество элементов в числах). Сортировка списка размера m (где m <= n) в худшем случае занимает время O(m log m). Однако, поскольку m всегда меньше или равно n, этот член поглощается доминирующим O(n log n)

— 23.07.2024 11:48

На самом деле их сортировка кусков занимает всего лишь линейное время.

— 23.07.2024 13:39

@nocomment, правда, поскольку v уже отсортирован в порядке возрастания до того, как будет выполнен вызов sort. Я добавил абзац по этому поводу.

— 23.07.2024 15:00

Я бы использовал другое имя для размера v, переопределение n сбивает с толку, особенно когда новое определение не длится даже до конца предложения, так что одно и то же имя имеет два разных значения в одном предложении.

— 23.07.2024 15:24

хорошее замечание. Используйте 𝑘 сейчас.

— 23.07.2024 15:51

23.07.2024 11:40