Почему распределители C++ используют reinterpret_cast и как этого избежать?

Я пытался реализовать свой собственный небольшой распределитель для целей тестирования, и при его разработке я думал, что не знаю, как реализовать его, не нарушив строгое правило псевдонимов.

В большинстве проектов с открытым исходным кодом на GitHub метод распределителя C++ allocate<T> представляет собой адаптер памяти: он обращается к памяти, запрашивает N последовательные std::byte или unsigned char, а затем reinterpret_cast передает эту память T, а после этого отдает память. обратно к вызывающему абоненту.

Однако как это не нарушит строгое правило псевдонимов (хотя вызываемый объект должен сам вызывать конструкторы, мы приводим std::byte* к T*). Как можно обойти эту проблему при реализации простого распределителя буфера, подходящего для большинства контейнеров STL?

Реализация(и) не обязательно должна следовать правилам C++!

— 30.04.2024 16:10

Связанное/обман: Реализация контейнера типа std::vector без неопределенного поведения

— 30.04.2024 16:12

Строгое псевдонимирование заключается не в переосмыслении указателей, а в их разыменовании. Простой возврат указателя на необработанную память не нарушает строгий псевдоним.

— 30.04.2024 16:14

Программисты на C часто говорят, что невозможно написать эквивалент malloc на совместимом C. По той же причине: в какой-то момент вы должны найти немного памяти и решить, что 1/ она изначально не имеет типа и 2/ вы можете ее благословить в один тип. Но по соображениям безопасности программам пользовательского уровня это не разрешено.

— 30.04.2024 16:16

Это нормально, потому что после allocate вы construct помещаете объект в выделенную память.

— 30.04.2024 16:19

Еще одно связанное/обман: Как malloc работает со строгим псевдонимом - может ли он быть нарушен только в пределах одной единицы компиляции? , который задает по сути тот же вопрос: «Как распределитель памяти может работать, не нарушая строгих правил псевдонимов». Также Распределитель памяти C и строгое псевдонимирование

— 30.04.2024 16:19

Реализация может связать ту или иную форму неопределенного поведения с каким-либо надежным результатом, а затем использовать тот факт, что она это сделала. Таким образом, обходной путь не требуется. Другими словами, компилятор и (внутренние части) реализации стандартной библиотеки могут свободно использовать конструкции с неопределенным поведением, если они обеспечивают требуемое поведение (например, в данном случае std::allocate<T> ведет себя так, как требуется программисту, использующему компилятор). и стандартная библиотека).

— 30.04.2024 16:30

c++ stl c++20 allocator reinterpret-cast

30.04.2024 16:08

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

155

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

std::allocator<T>::allocate не создает объекты типа T¹, std::construct_at создает. Это нормально, чтобы reinterpret_cast от void * до T *, если затем вы продолжаете начинать жизнь T в указанной памяти.

allocate начинает жизнь массива T, но не T подобъектов этого массива.

30.04.2024 16:18

Ответ принят как подходящий

Строгий псевдоним нарушается, когда вы делаете вид, что в определенном месте памяти есть объект, но на самом деле его нет. (Вы делаете это, reinterpret_cast указывая указатель/ссылку, а затем разыменовывая его, где только само разыменование является UB.)

Это не мешает вам использовать Placement-new, чтобы изменить тип объекта, хранящегося в некоторой памяти, а затем получить к нему доступ.

Например:

#include <string>

int main()
{
    alignas(std::string) char buf[sizeof(std::string)];

    *reinterpret_cast<std::string*>(buf) = "foo"; // UB

    std::string *ptr = new(buf) std::string;
    *ptr = "foo"; // Legal.
}

Мне кажется, упоминание std::launder здесь также может быть уместным.

— 30.04.2024 19:19

@JesperJuhl Пожимаю плечами. Это в некоторой степени связано, но вы можете использовать распределители и без него.

— 30.04.2024 20:15

30.04.2024 16:30