У меня есть кластер Apache Hadoop. Один из узлов столкнулся с искаженным распределением данных. В машине 3 диска. Диск 1 занимал около 86%, Диск 2 - 30% и Диск 3 - 60% соответственно. Что делать, если данные неравномерно распределены между дисками в DataNode? P.S: Я хотел бы сообщить вам, что тип хранилища НЕ тот же, поэтому я не могу следовать HDFS-1312. Кроме того, моя версия Hadoop - 2.5.0. любая помощь?
Балансировщик внутри узла был представлен в Hadoop3.
Я не уверен, что есть альтернатива без самостоятельного перемещения файлов, что может быть рискованно, даже если он думает, что namenode отслеживает только узел данных, а не объемы данных.