Как я могу ускорить почтовые запросы HTTP?

Я создаю REST API для расписаний занятий в колледже, и вставка данных в базу данных занимает целую вечность. Моя программа работает, загружая расписание в формате PDF с веб-сайта моего университета, удаляя его текст и распечатывая его в текстовый файл, а затем анализируя текстовый файл на предмет подробностей курса. Все полностью функционально, но неэффективно.

После того как сведения о курсе найдены, объект Course создается из класса модели rest и сохраняется в списке.

public class Parser {
    private static List<Course> courses;

    public static void parse(File file) {
        [collecting data...]

        Course course = new Course(crn, subject, number, title, department, hours, instructor, size, seats, semester, term);
        courses.add(course);
    }

    public static List<Course> getCourses() {
        return courses;
    }
}

Как только все курсы найдены, вызывается этот метод для помещения их в базу данных. Загрузка 15 000 курсов занимает ~3 минуты.

/** Constructs a JSON request body and posts course data to the server. */
public static void saveCourses(List<Course> courses) throws URISyntaxException, IOException, InterruptedException {
    for (int i = 0; i < courses.size(); i++) {
        Gson gson = new Gson();
        String json = gson.toJson(courses.get(i));
        HttpClient httpClient = HttpClient.newHttpClient();
        HttpRequest httpRequest = HttpRequest.newBuilder()
            .uri(new URI("http://localhost:8080/course/save"))
            .header("Content-Type", "application/json")
            .POST(BodyPublishers.ofString(json))
            .build();
        httpClient.send(httpRequest, BodyHandlers.ofString());
    }
}

Я не уверен, что так долго занимает звонок toJson() или сам запрос, но что я могу сделать, чтобы моя программа работала быстрее?

Начните с профилировщика, чтобы найти узкое место. Это может быть что угодно: от базы данных до медленного подключения к Интернету. Но первое, что нужно сделать, это вывести gson из цикла: в настоящее время вы создаете и собираете мусор 15 000 экземпляров gson, хотя вам следует использовать только 1.

— 08.07.2024 07:59

3 минуты на 15 000 запросов, это около 12 мс на запрос. Это не так уж плохо.

— 08.07.2024 09:05

Нет необходимости создавать HttpClient внутри цикла.

— 08.07.2024 09:20

Почему 3 минуты — это проблема? Разве это не случается один раз?

— 08.07.2024 09:21

Вы ограничены звонками 1:1? Можете ли вы добавить массовый API, получающий список объектов JSON? Можете ли вы отправлять дем-запросы одновременно?

— 08.07.2024 09:41

java http

08.07.2024 07:45

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Да. Подводя итог, проблема не столько в том, что обработка на сервере неэффективна, сколько в том, что вы делаете много запросов. Я вижу два подхода к решению этой проблемы:

Первое, что не потребует каких-либо изменений на стороне сервера, — это использование асинхронных запросов. Если ваш сервер не может поддерживать 15 000 одновременных запросов, используйте пакеты по 100 или 1000 запросов.
Другой подход заключается в добавлении на ваш сервер метода публикации списка Course вместо одного и отправки всего списка одним запросом или, опять же, пакетами. В последнем случае можно попробовать оптимизировать дальше, используя асинхронные запросы.

08.07.2024 12:39

Другие вопросы по теме

Фраза_from_stream/2 без завершения (поток из http_open/3)

401 несанкционированный ответ при отправке запроса на получение во флаттере с помощью пакетов Dio или http

Java-клиент + HTTP-сервер Apache + сжатие/распаковка GZIP

Файловый сервер Go не обслуживает папку

GET время запроса для apartment.com, но сайт не работает

Удалить куки при обновлении страницы

Запрос API Trefle с использованием Elm

Можно ли использовать ТОЛЬКО токены (CSRF) для аутентификации?

Как избежать проблем XSS при нажатии ссылки HTML, чтобы получить файл из базы данных и отобразить его на новой вкладке?

Base64 неправильно кодирует/декодирует

Как я могу ускорить почтовые запросы HTTP?

Ответы 1

Другие вопросы по теме

Похожие вопросы