FileChannel и ByteBuffer записывают дополнительные данные

Я создаю метод, который будет принимать файл, разбивать его на части и генерировать файл четности.

Когда я запускаю этот метод, кажется, что я записываю дополнительные данные в свой файл четности. Я впервые использую FileChannel и ByteBuffers, поэтому я не уверен, что полностью понимаю, как их использовать, несмотря на то, что просматривал документацию около 8 часов.

Этот код представляет собой упрощенную версию раздела четности.

public static void splitAndGenerateParityFile(File file, int shardCount, String fileID) throws IOException {
    RandomAccessFile rin = new RandomAccessFile(file, "r");
    FileChannel fcin = rin.getChannel();

    //Create parity files
    File parity = new File(fileID + "_parity");
    if (parity.exists()) throw new FileAlreadyExistsException("Could not create parity file! File already exists!");
    RandomAccessFile parityRAF = new RandomAccessFile(parity, "rw");
    FileChannel parityOut = parityRAF.getChannel();

    long bytesPerFile = (long) Math.ceil(rin.length() / shardCount);

    //Make buffers for each section of the file we will be reading from
    for (int i = 0; i < shardCount; i++) {
        ByteBuffer bb = ByteBuffer.allocate(1024);
        shardBuffers.add(bb);
    }

    ByteBuffer parityBuffer = ByteBuffer.allocate(1024);

    //Generate parity
    boolean isParityBufferEmpty = true;
    for (long i = 0; i < bytesPerFile; i++) {
        isParityBufferEmpty = false;
        int pos = (int) (i % 1024);
        byte p = 0;

        if (pos == 0) {
            //Read chunk of file into each buffer
            for (int j = 0; j < shardCount; j++) {
                ByteBuffer bb = shardBuffers.get(j);
                bb.clear();
                fcin.read(bb, bytesPerFile * j + i);
                bb.rewind();
            }
            //Dump parity buffer
            if (i > 0) {
                parityBuffer.rewind();
                parityOut.write(parityBuffer);
                parityBuffer.clear();
                isParityBufferEmpty = true;
            }
        }

        //Get parity
        for (ByteBuffer bb : shardBuffers) {
            if (pos >= bb.limit()) break;
            p ^= bb.get(pos);
        }

        //Put parity in buffer
        parityBuffer.put(pos, p);
    }

    if (!isParityBufferEmpty) {
        parityBuffer.rewind();
        parityOut.write(parityBuffer);
        parityBuffer.clear();
    }

    fcin.close();
    rin.close();
    parityOut.close();
    parityRAF.close();
}

Пожалуйста, дайте мне знать, если что-то не так с алгоритмом четности или файловым вводом-выводом, или если я могу что-то сделать, чтобы оптимизировать это. Я рад услышать о других (лучших) способах выполнения файлового ввода-вывода.

Помните, что FileChannel.read(ByteBuffer) не гарантирует заполнения буфера. Кроме того, при подготовке к чтению ByteBuffer, который только что был заполнен данными, вы должны использовать кувырок(), а не rewind().

— 13.07.2019 18:28

Итак, должен ли я использовать относительные get и puts, чтобы лимит корректно обновлялся? Может ли это быть основной проблемой?

— 13.07.2019 18:31

Я не уверен, но я бы определенно начал с замены каждого rewind на flip, и я бы поместил ваше чтение в цикл, чтобы заполнить буфер: fcin.position(bytesPerFile * j + i); while (bb.hasRemaining()) { fcin.read(bb); } Из документация: «Операция чтения может не заполнить буфер, и на самом деле он может вообще не считывать ни одного байта».

— 13.07.2019 18:42

java io bytebuffer filechannel parity

13.07.2019 17:44

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

476

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вот решение, которое я нашел (хотя может потребоваться дополнительная настройка):

public static void splitAndGenerateParityFile(File file, int shardCount, String fileID) throws IOException {
    int BUFFER_SIZE = 4 * 1024 * 1024;
    RandomAccessFile rin = new RandomAccessFile(file, "r");
    FileChannel fcin = rin.getChannel();

    //Create parity files
    File parity = new File(fileID + "_parity");
    if (parity.exists()) throw new FileAlreadyExistsException("Could not create parity file! File already exists!");
    RandomAccessFile parityRAF = new RandomAccessFile(parity, "rw");
    FileChannel parityOut = parityRAF.getChannel();

    //Create shard files
    ArrayList<File> shards = new ArrayList<>(shardCount);
    for (int i = 0; i < shardCount; i++) {
        File f = new File(fileID + "_part_" + i);
        if (f.exists()) throw new FileAlreadyExistsException("Could not create shard file! File already exists!");
        shards.add(f);
    }

    long bytesPerFile = (long) Math.ceil(rin.length() / shardCount);

    ArrayList<ByteBuffer> shardBuffers = new ArrayList<>(shardCount);

    //Make buffers for each section of the file we will be reading from
    for (int i = 0; i < shardCount; i++) {
        ByteBuffer bb = ByteBuffer.allocate(BUFFER_SIZE);
           shardBuffers.add(bb);
    }

    ByteBuffer parityBuffer = ByteBuffer.allocate(BUFFER_SIZE);

    //Generate parity
    boolean isParityBufferEmpty = true;
    for (long i = 0; i < bytesPerFile; i++) {
        isParityBufferEmpty = false;
        int pos = (int) (i % BUFFER_SIZE);
        byte p = 0;

        if (pos == 0) {
            //Read chunk of file into each buffer
            for (int j = 0; j < shardCount; j++) {
                ByteBuffer bb = shardBuffers.get(j);
                bb.clear();
                fcin.position(bytesPerFile * j + i);
                fcin.read(bb);
                bb.flip();
            }

            //Dump parity buffer
            if (i > 0) {
                parityBuffer.flip();
                while (parityBuffer.hasRemaining()) {
                    parityOut.write(parityBuffer);
                }
                parityBuffer.clear();
                isParityBufferEmpty = true;
            }
        }

        //Get parity
        for (ByteBuffer bb : shardBuffers) {
            if (!bb.hasRemaining()) break;
            p ^= bb.get();
        }

        //Put parity in buffer
        parityBuffer.put(p);
    }

    if (!isParityBufferEmpty) {
        parityBuffer.flip();
        parityOut.write(parityBuffer);
        parityBuffer.clear();
    }

    fcin.close();
    rin.close();
    parityOut.close();
    parityRAF.close();
}

Как предложил VGR, я заменил rewind() на flip(). Я также переключился на относительные операции вместо абсолютных. Я не думаю, что абсолютные методы регулируют положение курсора или предел, так что это, вероятно, было причиной ошибки. Я также изменил размер буфера на 4 МБ, так как меня интересует четность для больших файлов.

14.07.2019 06:40

Другие вопросы по теме

Как ограничить ввод-вывод жесткого диска при чтении/записи файла на диск?

Печать 2 o/p одновременно на консоли в Haskell

Преобразование строки в массив байтов

Можно ли просто заменить определенную строку в файле, не перезаписывая весь файл

Перебор строк в файле и сравнение с предыдущей строкой

BinaryWriter пишет забавных персонажей

Не удается прочитать все это в память при чтении короткого счета

Проверьте, был ли большой файл полностью загружен в каталог перед обработкой

IOException: нарушение общего доступа по пути

Fstream быстрее, чем fopen? и становится быстрее по мере увеличения буферов?

FileChannel и ByteBuffer записывают дополнительные данные

Ответы 1

Другие вопросы по теме

Похожие вопросы