У меня есть кластер cassandra (версия 2.2.8) из 6 узлов, где 3 узла являются начальными узлами. Один из семенных узлов недавно вышел из строя. Мне нужно заменить мертвый семенной узел. Мой кластер настроен таким образом, что он не может пережить потерю более 1 узла. Я прочитал эту документацию, чтобы заменить мертвый семенной узел. https://docs.datastax.com/en/cassandra/2.1/cassandra/operations/opsReplaceNode.html
Согласно документации, я боюсь удалить мертвый начальный узел из начального списка и выполнить скользящий перезапуск. Если по какой-либо причине какой-либо узел не t start, I
потеряет данные.
Как подойти к этому сценарию? Можно ли не удалять мертвый начальный узел из начального списка до тех пор, пока новый узел не будет полностью запущен и работает? Поскольку у меня уже есть два рабочих начальных узла, уже присутствующих в начальном списке. Пожалуйста посоветуй.
Вкратце: да, с удалением начального узла можно подождать.
Объяснение: Конфигурация исходного узла выполняет две функции:
Потеря начального узла в вашем случае повлияет только на 2. Поскольку у вас есть еще два начальных узла, я не вижу в этом большой проблемы. Я бы все равно выполнил скользящий перезапуск на всех узлах, как только вы обновите свою исходную конфигурацию.
Один дополнительный вопрос: когда я настраиваю новый узел, следует ли мне добавить адрес мертвого исходного узла в список начальных значений, чтобы он соответствовал конфигурации на других узлах.
Нет, новый узел должен иметь новую начальную конфигурацию. Просто убедитесь, что вы не добавляете собственный IP-адрес в его собственную исходную конфигурацию, поскольку исходные узлы не загружаются.
Мне удалось заменить узел с помощью предоставленных вами указаний. После замены я обновил начальную конфигурацию и выполнил скользящий перезапуск для каждого узла.
Это потрясающе. Спасибо, что дал мне знать.
Спасибо за разъяснения. Мой план - сначала заменить мертвый узел. Как только новый узел присоединится к кластеру. Я обновлю начальную конфигурацию, чтобы удалить адрес мертвого узла и добавить адрес нового узла в начальный список. Обновит это на всех узлах и выполнит непрерывный перезапуск.