Хранение в std :: map / std :: set против сортировки вектора после сохранения всех данных

Язык: C++
Я могу выделить вектор размера n и сохранить все данные. а затем отсортируйте его с помощью sort (begin (), end ()). В противном случае я могу продолжать ставить данные на карте или наборе, которые упорядочены сами по себе, поэтому мне не нужно потом сортировать. Но в этом случае вставка элемента может быть больше затратно из-за переделок (наверное).
Итак, что является оптимальным выбором для минимального времени для широкого диапазона n (кол-во объектов)

Это вопрос о структурах данных. В std::set или std::map есть сбалансированное дерево, которое постоянно сортируется - каждая вставка / удаление стоит O(logn), что означает, что все вставки будут стоить O(nlogn). В векторе каждая вставка будет стоить вам O(1) (в среднем, потому что она иногда должна дублироваться), в то время как каждое удаление будет стоить вам O(n), а ее сортировка будет стоить вам O(nlogn)каждый раз. Если вам нужно постоянно сортировать, я бы сказал, что вам следует использовать дерево. В противном случае это может быть аналогично использованию вектора и его сортировке в конце.

— 06.05.2018 12:57

Вам нужно его измерить. Например: что быстрее вставить случайные int и сохранить контейнер отсортированным по карте, списку или вектору? Отвечаю через 2 минуты, когда найду презентацию.

— 06.05.2018 12:59

Смотрите channel9.msdn.com/Events/Build/2014/2-661 с 45:50

— 06.05.2018 13:03

c++ data-structures stdvector stdmap stdset

06.05.2018 12:49

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

1 147

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Это зависит от ситуации.

map и set - это красно-черные деревья обычно, они должны проделать большую работу, чтобы их сбалансировать, иначе работа с ними будет очень медленной. И он не поддерживает произвольный доступ. поэтому, если вы хотите отсортировать только один раз, вы не должны их использовать.

Однако, если вы хотите продолжить вставку элементов в контейнер и поддерживать порядок, map и set займут время O(logN), а отсортированный vector будет O(N). Последний работает намного медленнее, поэтому, если вам нужен часто вставлять и удалять, вы должны использовать map или set.

"Последний намного медленнее" не на моей машине.

— 06.05.2018 13:16

@Nelfeal Насколько велики данные? Что ж, «последнее намного медленнее» означает только то, что функция сложности растет намного быстрее.

— 06.05.2018 13:24

Верно, но это не значит, что по умолчанию следует использовать набор вместо вектора. А на вопрос «насколько велики данные?» Обычно ответ «достаточно мал». Но, конечно, как и многое другое, это зависит от обстоятельств.

— 06.05.2018 13:36

@Nelfeal Да, вы правы, но я также указал, что только «часто» операции должны использовать карту или набор. :)

— 06.05.2018 13:39

06.05.2018 13:00

Разница между 2 заметна!

Используя набор, вы получаете сложность O(log(N)) для каждого вставляемого вами элемента. Таким образом, в результате вы получите O(N log(N)), который представляет собой сложность сортировки вставкой.

Добавление всего в вектор представляет собой сложность O(1), а при сортировке это будет O(N log(N)), начиная с C++ 11 (до этого у std::sort в среднем был O(N log(N))). После сортировки вы можете использовать binary_search, чтобы получить ту же сложность, что и в наборе.

API использования вектора в том виде, в каком он установлен, не очень удобен, хотя дает хорошие преимущества в производительности. Это, конечно, полезно только тогда, когда вы можете выполнить массовую вставку данных или когда количество поисков намного больше, чем манипуляции с контентом. Возможность алгоритма сортировки по частично отсортированному вектору, когда вам нужно будет расширить его позже. Наконец, следует отметить, что у вас нет таких же гарантий аннулирования итератора.

Итак, почему векторы лучше? Место кеширования! Вектор содержит все данные в одном блоке памяти, поэтому процессор может выполнять предварительную выборку, в то время как для набора память разбросана по месту, требующему данных для поиска следующего адреса. Это делает вектор лучшей реализацией набора, чем std :: set для больших данных, когда вы можете жить с ограничениями.

Чтобы дать вам представление о кодовой базе, над которой я работаю, у нас есть несколько реализаций наборов и карт, основанных на векторах, которые имеют свои собственные повествования для работы. (Например: без стирания или без оператора [])

Честно говоря, некоторые из них проходили так, как будто касательная проходит мимо круга: P Но я думаю, что главное в том, что хотя оба дают O (NLogN) сложность на бумажном векторе лучше из-за более организованных данных в памяти

— 06.05.2018 15:02

Извините, я могу что-нибудь улучшить? Хотя это хорошее резюме!

— 06.05.2018 15:04

06.05.2018 13:54