Почему приведение указателя члена объединения к указателю объединения не является UB, поскольку они могут иметь разный размер?

В следующем фрагменте кода происходит переполнение буфера, а именно при выполнении u->b = *b;.

class A {
public:
  int x;
  A() {
    x = 5;
  }
};

class B {
public:
  int x;
  float y;
  B() {
    x = 10;
    y = 3.14;
  }
};

union U {
  A a;
  B b;
};

U* foo(U* u) {
  B* b = new B();
  u->b = *b;
  return u;
}

int main() {
  A* a  = new A();
  U* u = (U*) a;
  u = foo(u);
  return u->b.y;
}

Судя по тому, что я прочитал здесь, актерский состав (U*) a должен быть четко определен. Насколько я понимаю, так не должно быть sizeof(U) != sizeof(A).

Кажется, что U и A являются взаимоконвертируемыми указателями, но я не уверен, означает ли это, что приведение четко определено.

В этом случае у меня возникли проблемы с соблюдением стандарта, буду рад любой помощи!

*** РЕДАКТИРОВАТЬ *** Я не планирую использовать этот код, но видел, как люди таким образом активировали объединение. Например здесь

afaik, приведение в порядке, а то, что вы делаете с указателем в вашем коде, - нет.

— 03.04.2024 12:13

«Из того, что я здесь прочитал, состав (U*) a должен быть четко определен». Взаимоконвертируемость указателя означает, что если там уже есть два объекта, допустимо приведение и использование указателя, как если бы он был указателем на другой.

— 03.04.2024 12:13

Почему люди не могут просто смириться с тем, что использование (без тегов) объединений в C++ — это просто плохая идея. isocpp.github.io/CppCoreGuidelines/…

— 03.04.2024 12:29

U* u = (U*) a;, но a на самом деле не указывает на объект U, так как же это может быть нормально? Кроме того, вопрос должен быть ясен без перехода по внешним ссылкам, поэтому, возможно, отредактируйте его более подробно.

— 03.04.2024 12:31

Также обратите внимание, что здесь вы эффективно используете reinterpret_cast<U*>(a). Расскажите, пожалуйста, чего вы ожидаете здесь?

— 03.04.2024 12:44

Это явно не указывает на члена союза, поэтому я не понимаю, как опубликованный код имеет какое-либо отношение к «приведению указателя члена союза к указателю объединения».

— 03.04.2024 12:48

на самом деле в ответе уже говорится: «Это означает, что вы можете преобразовать их друг в друга с помощью reinterpret_cast. Однако вы не можете получить доступ к памяти неправильного типа». Приведение в порядке, притворяться, что оно укажет на то, на что оно не указывает, не нормально

— 03.04.2024 12:48

@PepijnKramer не беспокойся, я не буду его где-либо использовать. Это скорее теоретический вопрос, поскольку я видел, как этот тип приведения использовался где-то еще, и задавался вопросом, правильный ли сам приведение или нет.

— 03.04.2024 12:53

@ 463035818_is_not_an_ai Я не обращаюсь к памяти как к неправильному типу, поскольку активирую объединение с типом B. Вы подразумеваете, что это уже путаница типов, иначе говоря, приведение небезопасно?

— 03.04.2024 12:53

a указывает на A. A не является союзом. Затем вы приводите этот указатель к другому типу, на который указатель не указывает.

— 03.04.2024 12:54

единственный объект, который вы создаете в этом коде, имеет тип A. Не существует союза, к любому члену которого вы могли бы получить доступ.

— 03.04.2024 12:55

Ни одно из условий в ответе, который вы связали, не соответствует вашей ситуации, поэтому ваш вывод озадачивает.

— 03.04.2024 12:56

сам по себе указатель не является действительным указателем. В ответе объясняется, что если вы создадите объект правильного типа, вы также сможете получить к нему доступ, но только тогда.

— 03.04.2024 12:56

Я думаю, вы неверно истолковали правила конвертируемости, применимые к типам, но они говорят: «Два объекта a и b взаимно конвертируются по указателям, если [...]» (выделено мной). Кроме того, размеры не имеют никакого отношения к конвертируемости.

— 03.04.2024 13:06

@ 463035818_is_not_an_ai Мне больше всего интересно, в какой момент эта программа нарушает гарантии безопасности: во время каста, во время доступа? На мой взгляд это похоже на путаницу типов. Подразумевает ли взаимопреобразование указателей типобезопасное преобразование? Думаю, нет?

— 03.04.2024 13:16

Это четко определено, потому что sizeof(U*) == sizeof(A*). Использование разыменования указателя на неправильный тип недопустимо, но, похоже, это не имеет отношения к вопросу. (Вот почему этот код дает сбой на моей машине.)

— 03.04.2024 13:28

@vwvw В основном меня не так беспокоит, когда люди используют тег «language-laywer» (правильно). Но другие люди тоже читают комментарии, и... ну вы знаете ;)

— 03.04.2024 16:09

c++ casting language-lawyer union undefined-behavior

03.04.2024 12:08

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

126

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Объекты типа U конвертируются указателями в свой подобъект U::a. Это можно проверить с помощью std::is_pointer_interconvertible_with_class(&U::a).

(U*) a это reinterpret_cast<U*>(a). Это static_cast<U*>(static_cast<void*>(a)), где [expr.static.cast]p14 говорит:

В противном случае, если исходное значение указателя указывает на объект a, и существует объект b типа, аналогичный T, который является взаимоконвертируемым указателем с a, результатом будет указатель на b.

По этому адресу может отсутствовать объект типа U, то есть вы не получите указатель на U, а только указатель типа U, указывающий на *a.

Последующий доступ к нему как к U является неопределённым поведением (по очевидным причинам, указанным в [basic.lval]p11). Итак, u->b = *b; — это неопределенное поведение.

Однако не исключено, что это могло бы избежать УБ. Вызов operator new может вернуть больше байтов, чем запрошено ([basic.stc.dynamic.allocation]p2 , [new.delete.single]p3 ), и operator new неявно создает объект ( [intro.object] стр14) и std::is_implicit_lifetime_v<U>. Этот вызов operator new может выделить достаточно байтов для хранения объекта U, и в этом случае он неявно создаст U, что сделает его правильно сформированным.

Более стандартный способ сделать это:

A* a = static_cast<A*>(operator new(sizeof(U)));
U* u = reinterpret_cast<U*>(a);
u = foo(u);
return u->b.y;

Что явно позволяет избежать проблемы с размером, о которой вы беспокоились.

Спасибо за подробный ответ. Можем ли мы также заключить, что такое приведение является путаницей типов, поскольку оно нарушает безопасность типов? Если я понял правильно, типобезопасная программа всегда должна иметь объекты с допустимыми типами для базовой памяти. Можете ли вы сделать что-нибудь еще с u, кроме как вернуть его обратно в A, поскольку доступ к нему небезопасен?

— 03.04.2024 13:13

Это предполагает, что на моей машине работает более стандартный способ, как я и ожидал. Стоит понять, как работает эта языковая функция, а затем избегать ее использования, кроме случаев, когда это необходимо, и вместо этого рассмотреть std::variant.

— 03.04.2024 13:39

Re: «Вполне возможно, что это позволит избежать UB» — поведение не определено, поскольку стандарт C++ не говорит вам, что оно делает. Это не изменится, если operator new выделит достаточно байтов, чтобы код мог сделать то, что кто-то от него ожидает.

— 03.04.2024 14:32

@PeteBecker, потому что может быть несколько неявно созданных объектов, если вы получаете достаточно памяти от new, стандарт сообщает вам, что происходит: *a является подобъектом AU и взаимоконвертируется указателем с неявно созданным U объектом

— 03.04.2024 14:37

@Калет - цитируй, пожалуйста? «может выделить» не является техническим термином в стандарте C++. Код создает объект типа A, а затем говорит: «Представьте, что это на самом деле B». «Pointer-interconvertible» говорит, что у них одинаковый адрес; это не делает это преобразование действительным.

— 03.04.2024 14:44

@PeteBecker reinterpret_cast разрешено выполнять преобразование между указателями, которые указывают на объекты, конвертируемые между указателями. Эти приведения действительны и являются целью взаимоконвертируемости указателей.

— 03.04.2024 14:58

@Caleth - приведение допустимо; это не делает топтание памяти действительным. Посмотрите все комментарии к вопросу.

— 03.04.2024 15:05

@PeteBecker приведение допустимо, если там есть U, т. е. если выделение было не менее sizeof(U) байтов

— 03.04.2024 15:21

@PeteBecker На самом деле у нас было именно это обсуждение: возникает ли путаница типов, когда объект приводится к неправильному типу, или только в том случае, если осуществляется доступ к некоторым элементам этого незаконного приведения.

— 03.04.2024 16:16

@PeteBecker: приведение типа-члена объединения к типу объединения, а затем доступ к этому же члену либо через объединение, либо через memcpy (с тем же размером, что и член), может завершиться неудачей, если объединение содержит какие-либо типы, выравнивание которых более грубое, чем у члена. . Подобный сбой легко продемонстрировать с помощью лязга, нацеленного на Cortex-M0.

— 22.04.2024 23:28

03.04.2024 12:54

Другие вопросы по теме

Неожиданное исключение приведения при использовании F# Seq.cast

Угловой тип ограждения не сужающегося типа

Приведение Rc<Self> признака T к Rc<T> в ржавчине

Проверьте, произошел ли объект базового класса из подкласса

Правильный способ приведения клиента базы данных к pg.Client или pg.Pool

Внесите объект в список в Polars

Преобразование записи в строку с настраиваемым разделителем

Является ли результат static_cast неопределенным поведением, если результат не соответствует типу назначения?

Преобразование метки времени в дату в Oracle 19c без времени

Почему приведение указателя члена объединения к указателю объединения не является UB, поскольку они могут иметь разный размер?

Ответы 1

Другие вопросы по теме

Похожие вопросы