У меня есть момент, который я не понял, изучая механизм удаления BST. Не могли бы вы объяснить мне, почему существует назначение (p->rchild =, p->lchild =) каждый раз, когда вызывается Delete(Node* p, int key)? На самом деле я думал, что метод Delete(Node* p, int key) просто продолжает возвращаться без каких-либо мутаций, поэтому дерево не меняется.
И пока я искал объяснение, я наткнулся на это предложение:
Мы должны выполнять назначения после удаления, иначе мы получим дублирующие узлы.
Если вы согласны с этим утверждением, не могли бы вы объяснить его мне?
Node* BST::Delete(Node *p, int key) {
Node* q;
if (p == nullptr){
return nullptr;
}
if (p->lchild == nullptr && p->rchild == nullptr){
if (p == root){
root = nullptr;
}
delete p;
return nullptr;
}
if (key < p->data){
p->lchild = Delete(p->lchild, key);
} else if (key > p->data){
p->rchild = Delete(p->rchild, key);
} else {
if (Height(p->lchild) > Height(p->rchild)){
q = InPre(p->lchild);
p->data = q->data;
p->lchild = Delete(p->lchild, q->data);
} else {
q = InSucc(p->rchild);
p->data = q->data;
p->rchild = Delete(p->rchild, q->data);
}
}
return p;
}
Он удаляет узлы, поэтому он должен назначить подчиненный удаленному узлу и поместить его в текущую позицию дочернего узла (будь то левый или правый), чтобы заменить удаленный узел и сохранить дерево.
Также вы должны поддерживать сбалансированную часть BST.
@Manuel Насколько я понимаю, он не удаляет узлы, а обновляет некоторые из них при переходе сверху вниз. Как только он достигает последнего узла, у которого нет ни левого, ни правого дочерних элементов, он удаляет этот узел. Мне все равно непонятно!
@Surt Я не вставил весь код, но метод Height () продолжает каждый раз сравнивать левую и правую высоту узла и на основе этого вызывает методы предшественника или преемника для замены узла соответствующим узлом.
@ user4581301 спасибо за внимание. Вы определенно правы!
@ Мануэль, после переосмысления, думаю, я понял твою точку зрения. Таким образом, вы в основном имеете в виду, что узлы будут возвращены как дочерние узлы своим родителям, но в какой-то момент узел (который соответствует ключу) будет удален, и это (nullptr) должен быть новым дочерним элементом родителя, чей дочерний узел был удален. Большое спасибо! :)
Удаление и вращение — два примера операций, которые могут изменить корень поддерева. В рекурсивном алгоритме, который включает эти операции, вам необходимо обновить указатель родительского узла на его дочерние элементы после возврата из дочерней функции.
@turtle изменение корня поддерева происходит только с точки зрения обновления значения, не так ли? Это означает, что адрес узла не меняется, а только значение. Поэтому я подумал, что это не будет иметь никакого значения для этой части дерева.
@turtle С другой стороны, если правильный узел встречается для удаления и у него есть много других поддеревьев ниже, то мы заменим только значение нашего целевого узла, который будет удален, и после некоторых таких замен посредством рекурсий адресное пространство листового узла будет освобожден. И родитель этого листового узла не должен указывать на освобожденное пространство памяти, поэтому он (дочерний узел) должен вернуться (после удаления и присвоения значения nullptr). Итак, не могли бы вы сказать мне, есть ли другие случаи, когда, как вы упомянули, «нужно обновить указатель родительского узла на его дочерние элементы?
Этот код неверен. Я согласен с ошибкой, отмеченной в первом комментарии выше. Поэтому я не вижу, как ответ на вопрос поможет. В конце концов, код все еще неверен.
@trincot, код мне тоже не принадлежит. Из курса udemy я учусь чему-то. Нет причин быть одержимым этим, он был прав, и я согласился с ним. Кроме того, это не имеет отношения к моему вопросу!
Справедливо. Я разместил ответ.
почему присваивание (
p->rchild =
,p->lchild =
) происходит каждый раз, когда вызываетсяDelete(Node* p, int key)
?
Если данные найдены, то цель состоит в том, чтобы иметь дерево, в котором на один узел меньше. Алгоритм будет использовать механизм замены значений, чтобы гарантировать, что фактически удаляемый узел всегда будет конечным узлом. Удаление листового узла состоит из двух действий:
Поскольку алгоритм рекурсивно обращается прямо к этому листовому узлу, он не может установить нулевой указатель на своего родителя, поскольку на данном этапе нет доступной ссылки на родительский узел. Для этого вызывающая сторона должна что-то сделать, поскольку у вызывающей стороны есть ссылка на родителя.
Поэтому, когда рекурсивный обход достигает конечного узла, он должен сообщить вызывающей стороне, что этот узел должен быть отсоединен. Он делает это, возвращая нулевой указатель, и соглашение заключается в том, что вызывающая сторона (чей текущий узел p
является родителем) должна назначить возвращенный указатель соответствующему дочернему указателю. Таким образом, удаленный узел действительно отделяется от остальной части дерева.
На самом деле, я думал, что метод
Delete(Node* p, int key)
просто продолжает возвращаться без каких-либо мутаций, поэтому дерево не меняется.
Конечно, дерево должно как-то измениться, чтобы из него был удален узел. Изменение происходит в назначении на p->lchild
или p->rchild
Я наткнулся на эту фразу:
Мы должны выполнять назначения после удаления, иначе у нас будут дубликаты узлов.
Это верно. Возьмем пример дерева:
7
/ \
3 8
/ \ \
1 5 9
/ / \
0 4 6
Теперь давайте посмотрим, что произойдет, если мы позвоним Delete(root, 3)
. p
указывает на узел со значением 7. Идем влево рекурсивным вызовом:
p->lchild = Delete(p->lchild, key);
В контексте рекурсивного выполнения мы получаем новый p
, который указывает на узел со значением 3. Это значение, которое мы ищем, поэтому мы попадаем во внешний блок else
. Поскольку высоты поддеревьев ниже этого узла равны, мы попадаем во внутренний блок else
. Там мы назначаем:
q = InSucc(p->rchild);
Этот q
будет ссылаться на узел со значением 4. И теперь происходит дублирование. Копируем данные из q
в p
. Это сводится к удалению значения 3 из дерева:
p->data = q->data;
Но теперь у нас есть в два раза больше значения 4 в дереве.
7
/ \
4* 8
/ \ \
1 5 9
/ / \
0 4* 6
Таким образом, алгоритм спускается к (правому) дочернему элементу и теперь пытается удалить узел со значением 4 в этом поддереве:
p->rchild = Delete(p->rchild, q->data);
В этом новом рекурсивном вызове мы снова получаем новый p
, который теперь относится к узлу со значением 5. Мы двигаемся влево — это присваивание будет играть важную роль позже:
p->lchild = Delete(p->lchild, key);
Этот последний рекурсивный вызов имеет новый p
, который ссылается на узел со значением 4 — тот, который мы искали.
На этот раз мы оказываемся в блоке if
, в котором есть delete
, потому что этот узел является листовым узлом. Узел освобождается, и вызывающему объекту возвращается нулевой указатель. Отсюда мы начинаем возвращаться вверх по дереву.
Таким образом, на один уровень выше, в узле со значением 5, мы получаем возвращаемое значение из рекурсивного вызова (который является нулевым указателем) и присваиваем его:
p->lchild = Delete(p->lchild, key);
Это важное назначение отделит повторяющийся узел (со значением 4) от дерева. Вы можете видеть, что если бы это присваивание не было выполнено, то все равно была бы ссылка на этот узел с повторяющимся значением, даже если оно указывает на освобожденную память.
Дерево теперь в своей окончательной форме:
7
/ \
4 8
/ \ \
1 5 9
/ \
0 6
Откат все еще будет продолжаться, возвращаясь к корню. Также выполняются присваивания некоторым дочерним указателям, но они не изменят дерево, так как во всех этих случаях мы возвращали return p;
, которое было исходным значением дочернего указателя вызывающего объекта.
Как упоминалось в комментариях, в коде есть ошибка. При удалении листового узла не проверяется, действительно ли этот узел имеет удаляемое значение. И поэтому, если вы вызовете этот метод со значением, которого нет в дереве, вы в конечном итоге удалите конечный узел с другим значением. В приведенном выше примере дерева: если вы вызовете Delete(root, 10)
, узел со значением 9 будет удален.
Чтобы исправить эту ошибку, переместите следующий блок if
:
if (p->lchild == nullptr && p->rchild == nullptr){
... внутри внешнего блока else
в качестве первого оператора.
Хотя я уже понял логику того, как это работает, благодаря предыдущим комментариям, я ценю ваше прекрасное подробное объяснение. Надеюсь, это также поможет людям, которые запутались в этой теме, как я. Спасибо!
Несвязанный:
if (p->lchild == nullptr && p->rchild == nullptr)
похоже, что если вы нажмете на конец строки, вы уничтожите последний узел, независимо от того, соответствует ли он ключу или нет. Не уверен, что это то поведение, которое вы хотите, или нет, но я считаю, что это стоит указать.