Могу ли я заставить std::vector оставить утечку памяти?

Могу ли я заставить std::vector не освобождать память после того, как вектор выйдет за пределы области видимости?

Например, если у меня есть

int* foo() {
    std::vector<int> v(10,1); // trivial vector
    return &v[0];
}

int main()
{
    int* bar = foo();
    std::cout << bar[5] << std::endl;
}

Нет никакой гарантии, что значения будут по-прежнему доступны здесь.

Я сейчас просто делаю это

int* foo() {
  std::vector<int> v(10,1);
  int* w = new int[10];
  for (int i=0; i<10; i++) {
    w[i] = v[i];
  }
  return w;
}

но повторное заполнение всего нового массива немного расточительно. Есть ли способ заставить std::vector не удалять свой массив?

Примечание. Я не возвращаю сам вектор, потому что я взаимодействую с C++ с python с помощью SWIG, а ARG_OUTVIEW_ARRAY требует необработанного указателя и, по сути, преднамеренной утечки памяти. Однако я все же хотел бы иметь возможность использовать векторные функции при построении самих данных.

почему foo не возвращает int? В конце концов, кто-то должен хранить значение...

463035818_is_not_a_number 14.05.2019 12:09

Проблема в том, что код Python станет конечным владельцем вектора, и преобразование требует, чтобы я намеренно оставил «утечку памяти». Я не просто возвращаю int, потому что мне понадобится весь массив в python.

jxz12 14.05.2019 12:16

@TheZhengmeister: почему не std::vector<int> v = new std::vector<int>(10,1); в foo?

P.W 14.05.2019 12:17

Почему бы просто не использовать необработанный массив с SWIG? Возможно.

rustyx 14.05.2019 12:25

@P.W, это действительно работает! Тогда я могу просто взять &(*v)[0], верно?

jxz12 14.05.2019 12:29

@rustyx, можете ли вы рассказать, как это сделать? Моя проблема в том, что я не знаю размер массива до запуска кода С++, поэтому я не могу передать INPLACE_ARRAY и заполнить его во время.

jxz12 14.05.2019 12:31

@TheZhengmeister Нет, это ужасная идея. Если вы вернете &(*v)[0], вы утечете сам вектор, даже если освободите его внутренний массив.

HolyBlackCat 14.05.2019 12:31

@HolyBlackCat ах да, конечно, я буду этого избегать.

jxz12 14.05.2019 12:35

Почему бы вам не вернуть вектор вместо указателя на его данные?

CAF 14.05.2019 15:09

Вы хотите сделать это, потому что не знаете, как правильно вернуть std::vector<int>? Поддерживающие его карты типов поставляются с SWIG или используют карты типов numpy.

Mark Tolonen 15.05.2019 01:43

@MarkTolonen Я использую интерфейс numpy.i (документация здесь), но есть ли способ заставить его работать напрямую с std::vector?

jxz12 15.05.2019 09:17
%include <std_vector.i> то %template(IntVector) std::vector<int>; разрешит передачу и возврат векторов.
Mark Tolonen 15.05.2019 15:46
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
8
12
1 174
7
Перейти к ответу Данный вопрос помечен как решенный

Ответы 7

Нет.

Векторы не реализованы так, чтобы иметь утечки памяти, и интерфейс не предоставляет способ их создания.

Вы не можете «украсть» память (удалив право собственности на нее из вектора), что является, возможно, немного позорно.

Извините, но вам придется либо копировать (как вы делаете сейчас), либо не использовать вектор.

Как насчет использования специального распределителя, который не освобождает память? Я знаю, что это ужасная идея, но ее можно реализовать.

taskinoor 14.05.2019 12:13

Я не собираюсь развлекаться таким хакерством!

Lightness Races in Orbit 14.05.2019 12:15

Ржу не могу. Да, такого взлома следует избегать, но технически это возможно. По крайней мере, может быть просто для удовольствия :-)

taskinoor 14.05.2019 12:17

Не уверен, но да.

Вы можете создать пользовательский распределитель, который ничего не делает при освобождении => утечка

Или, может быть, вы можете просто создать свой vector в куче, чтобы он все равно протекал.

int* foo() {
    std::vector<int>* v = new std::vector<int>(10,1); 
    return &((*v)[0]);
    // no delete
}

int main()
{
    int* bar = foo();
    std::cout << bar[5] << std::endl;
}

Второй вариант приведет к фактической утечке (вместо того, чтобы лишить права собственности на буфер у vector, чего, похоже, хочет ОП).

HolyBlackCat 14.05.2019 12:23

Это создает слишком большой риск случайной утечки большего объема памяти, чем нужно. Кроме того, у вас нет стратегии освобождения памяти после того, как вы с ней закончите. Это ужасная идея.

user2357112 supports Monica 14.05.2019 12:24

Конечно, это ужасная идея, но ОП хочет создать утечку, я помогу ему в этом ^^

Martin Morterol 14.05.2019 12:26

Название вопроса вводит в заблуждение. OP, похоже, хочет повторно использовать буфер из вектора, а не пропускать его.

HolyBlackCat 14.05.2019 12:29

@HolyBlackCat, вы правы, мне нужно повторно использовать векторный буфер, но вне области действия кода C++ (с этим справится Python). Поэтому я также не уверен, что «утечка» — правильное слово.

jxz12 14.05.2019 14:05

@TheZhengmeister показанный здесь пример в дополнение к утечке массива приведет к утечке самого объекта vector. Не используйте его.

rustyx 14.05.2019 17:03

Это возможно, но вы никогда не должны этого делать. Заставить вектор оставить утечку памяти — ужасная идея, и если вам это нужно, вам нужно переосмыслить свой дизайн. std::vector — это тип управления ресурсами, одной из основных целей которого является обеспечение отсутствия утечек. Никогда не пытайтесь сломать это.

Теперь, чтобы ответить на ваш конкретный вопрос: std::vector принимает тип распределителя в качестве второго параметра шаблона, который по умолчанию равен std::allocator<T>. Теперь вы можете написать собственный распределитель, который не освобождает память, и использовать его с вашим вектором. Написание собственного распределителя — не очень тривиальная работа, поэтому я не буду описывать ее здесь (но вы можете найти руководства в Google).

Если вы действительно хотите использовать пользовательский распределитель, вы должны убедиться, что ваш вектор никогда не запускает операцию роста. Причина в том, что при увеличении емкости вектор будет перемещать/копировать данные в новое место и освобождать старые воспоминания с помощью распределителя. Если вы используете аллокатор, который дает утечки, то при выращивании вы не только сохраняете окончательные данные, но и сохраняете старые воспоминания, которые, я уверен, вы не хотите сохранять. Поэтому убедитесь, что вы создаете вектор с полной емкостью.

Нет.

И ты делаешь это неправильно. Вместо этого верните вектор, чтобы время жизни работало:

Напишите свой собственный специальный вектор памяти Python class, что-то вроде (наиболее грубо):

template <typename T>
class python_vector
{
    T* buffer_;
public:
    python_vector(size_t n, const T& value) : buffer_{new T(n)}
    {}
    // copy, assignment, operator[](), *etc*
    ~python_vector()
    {
        // DO NOTHING!
    }
}

python_vector<int> foo() {      
    python_vector<int> v(10,1);
    // process v
    return v;
}

int main()
{
    python_vector<int> bar = foo();  // copy allusion will build only one python_vector here
    std::cout << bar[5] << std::endl;
}

ОП упомянул, почему он не возвращает вектор в примечании в конце вопроса.

P.W 14.05.2019 12:27

@P.W Но он хочет, чтобы данные vector пережили это возвращение? Дизайн неправильный.

Paul Evans 14.05.2019 12:28

Да, я согласен с тобой.

P.W 14.05.2019 12:31

Мне нужны данные, чтобы пережить возврат, потому что SWIG нужна «утечка памяти», чтобы python мог взять под контроль память, а затем освободить ее по истечении срока службы С++.

jxz12 14.05.2019 12:33

@TheZhengmeister Тогда vector не тот инструмент. Выделяйте память и управляйте ею так, чтобы вы могли контролировать ее, чтобы она не освобождалась в течение времени существования C++.

Paul Evans 14.05.2019 12:37

Кто бы ни проголосовал: так вы думаете, что лучше изуродовать практику кодирования vector, чтобы сделать что-то, для чего она никогда не предназначалась, а не писать какой-то код, чтобы сделать это правильно?

Paul Evans 14.05.2019 12:59

Не поставил минус, но, может быть, это потому, что ваш python_vector очень неполный? и, вручную управляя собственной памятью, вы открываете еще одну банку червей. (написание правильных специальных функций-членов и т. д.).

Hatted Rooster 14.05.2019 13:04

@SombreroChicken Я сказал грубо. В спецификации vector не предусмотрено кражи его буфера, так что вы уже открыли банку с червями.

Paul Evans 14.05.2019 13:07
Ответ принят как подходящий

vector предназначен для предотвращения утечек.

Но если вы хотите выстрелить себе в ногу, это возможно. Вот как вы предотвращаете освобождение вектором своего внутреннего массива:

int *foo()
{
    std::vector<int> v(10,1);

    int *ret = v.data();
    new (&v) std::vector<int>; // Replace `v` with an empty vector. Old storage is leaked.
    return ret;
}

Как говорят другие ответы, вы никогда не должны этого делать.

Это намного проще и чище, чем использование пользовательского распределителя. Спасибо.

taskinoor 14.05.2019 13:12

Я почти уверен, что это UB, но, надеюсь, это должно работать в обычных средах выполнения...

Quentin 14.05.2019 15:18

@Quentin Можно было бы получить UB при delete[] использовании указателя позже, если по какой-то причине v[0] не находится в начале выделенного хранилища. Я думаю, что само размещение-новое здесь четко определено, поскольку можно уничтожать объекты, повторно используя их хранилище. Кроме того, если vector управляет каким-то другим ресурсом в дополнение к одному блоку памяти кучи, мы пропускаем это. Это звучит правильно?

HolyBlackCat 14.05.2019 15:31

Удаление @HolyBlackCat должно использовать ту же самую форму, которую std::vector использует внутри, распределители и все остальное - вероятно, будет соответствовать delete[] в простом случае, но не гарантируется. Я не уверен, является ли четко определенным сокращение времени жизни нетривиально разрушаемого объекта за счет нового размещения.

Quentin 14.05.2019 15:36

Это плохая идея, но ее можно создать, создав собственный распределитель, который не освобождается, как сказано в других ответах.

Например: (шаблон в основном из cppref)

#include <cstdlib>
#include <new>
#include <vector>

template <typename T>
struct LeakingAllocator 
{
  using value_type = T;
  LeakingAllocator() = default;

  template <typename U> constexpr LeakingAllocator(const LeakingAllocator<U>&) noexcept {}

  T* allocate(std::size_t n) 
  {
    if (n > std::size_t(-1) / sizeof(T)) throw std::bad_alloc(); // check for overflow

    if (auto p = static_cast<T*>(std::malloc(n*sizeof(T)))) return p; // return p if malloc returns a valid object
    throw std::bad_alloc(); // otherwise just throw.
  }

  void deallocate(T* p, std::size_t) noexcept { /*leak intentionally*/ }
};


template <typename T, typename U>
bool operator==(const LeakingAllocator<T>&, const LeakingAllocator<U>&) { return true; }
template <typename T, typename U>
bool operator!=(const LeakingAllocator<T>&, const LeakingAllocator<U>&) { return false; }

template <typename T>
using LeakingVector = std::vector<T, LeakingAllocator<T>>;

Затем код, как

int* ret()
{
    LeakingVector<int> a;
    a.resize(10);
    return &a[0];
}

int main()
{
    auto ptr = ret();
    *ptr = 10;
    std::cout << *ptr;
}

становится действительным.

В С++ вы, скорее всего, написали бы:

auto foo()
{
    std::vector<int> v(10,1); // trivial vector
    return v;
}

int main()
{
    const auto bar = foo();
    std::cout << bar[5] << std::endl;
}

Мне нужен необработанный указатель, потому что я использую SWIG для взаимодействия С++ с python, который передает управление памятью python после того, как С++ выходит за рамки. Это должна быть «утечка», потому что в противном случае ОС может просто перезаписать выделенную память.

jxz12 14.05.2019 15:47

Я не думаю, что Python может правильно управлять памятью, выделенной во время выполнения C++. Возможно, вам следует получить память от Python и скопировать в нее векторные данные.

CAF 14.05.2019 18:33

Другие вопросы по теме