Загрузка контента с веб-URL

Я пытаюсь получить данные с URL-адреса, используя WinInet.h. Вот мой упрощенный код:

LPCTSTR url = (LPCTSTR) "https://example.com"; // 2.9.1
HINTERNET connection = InternetOpenA(NULL, INTERNET_OPEN_TYPE_PRECONFIG, NULL, NULL, 0);
HINTERNET request = InternetOpenUrlA(connection, url, NULL, 0, INTERNET_FLAG_RELOAD, 0);

char status_code[10];
DWORD info_size = 10000;
HttpQueryInfoA(request, HTTP_QUERY_STATUS_CODE, status_code, &info_size, NULL);

DWORD size;
DWORD dwRead = 0;
InternetQueryDataAvailable(request, &size, 0, 0); // size = 5

char * buffer = new char[size]; // size = 5
InternetReadFile(request, buffer, size, &dwRead);
OutputDebugString(buffer); // 1.2.3ýýýý

InternetCloseHandle(connection);
InternetCloseHandle(request);

Работает хорошо, но данные по URL адресу 2.9.1 но буфер возвращает 2.9.1ýýýý.

Если я попытаюсь напечатать char после char, это результат:

for (int i = 0; i < size; i++)
    OutputDebugString(&buffer[i]);

char[0] = 2.9.1ýýýý
char[1] = .9.1ýýýý
char[2] = 9.1ýýýý
char[3] = .1ýýýý
char[4] = 1ýýýý

Может ли кто-нибудь объяснить мне, почему это происходит?

Не забывайте, что строки char в C++ на самом деле называются байтовыми строками завершающийся нулем. нуль-терминатор также требует места (и если функция InternetReadFile не добавит его за вас, то вам нужно сделать это явно самостоятельно). Лучшим решением, конечно, является использование стандартного строкового класса для ваших строк, например, например. std::string.

Some programmer dude 22.05.2019 15:11

Не имеет отношения к вашей проблеме, но актерский состав LPCTSTR url = (LPCTSTR) "https://example.com"; неправильный на всегда. Пожалуйста, просто удалите его: LPCTSTR url = "https://example.com"; На самом деле, поскольку вы явно используете версию API «А», просто сделайте ее LPCSTR url = https://example.com"; или даже const char* url = "https://example.com";

Mike Vine 22.05.2019 15:11

@MikeVine Да, вы правы, я изменю это, спасибо за предупреждение.

user4256388 22.05.2019 15:30

@Someprogrammerdude Спасибо, это было решение.

user4256388 22.05.2019 15:30
3 метода стилизации элементов HTML
3 метода стилизации элементов HTML
Когда дело доходит до применения какого-либо стиля к нашему HTML, существует три подхода: встроенный, внутренний и внешний. Предпочтительным обычно...
Формы c голосовым вводом в React с помощью Speechly
Формы c голосовым вводом в React с помощью Speechly
Пытались ли вы когда-нибудь заполнить веб-форму в области электронной коммерции, которая требует много кликов и выбора? Вас попросят заполнить дату,...
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Будучи разработчиком веб-приложений, легко впасть в заблуждение, считая, что приложение без JavaScript не имеет права на жизнь. Нам становится удобно...
Flatpickr: простой модуль календаря для вашего приложения на React
Flatpickr: простой модуль календаря для вашего приложения на React
Если вы ищете пакет для быстрой интеграции календаря с выбором даты в ваше приложения, то библиотека Flatpickr отлично справится с этой задачей....
В чем разница между Promise и Observable?
В чем разница между Promise и Observable?
Разберитесь в этом вопросе, и вы значительно повысите уровень своей компетенции.
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Клиент для URL-адресов, cURL, позволяет взаимодействовать с множеством различных серверов по множеству различных протоколов с синтаксисом URL.
2
4
111
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Данные, которые вы получаете, представляют собой строку в стиле C, то есть массив символов, заканчивающийся нулевым символом. Важной частью здесь является то, что для строки из 5 символов фактически требуется массив размера 6, например:

"hello"

состоит из массива из 6 символов, 'h', 'e', 'l', 'l', 'o', '\0'.

OutputDebugString будет проходить через массив, печатая символы, пока не достигнет '\0'.

В этом случае вы никуда не выделяете завершающий '\0', поэтому OutputDebugString будет продолжать работать до тех пор, пока в памяти не окажется '\0' (или пока он не достигнет памяти, к которой ему не разрешен доступ).

Измените этот бит:

char * buffer = new char[size]; // size = 5
InternetReadFile(request, buffer, size, &dwRead);

быть

char * buffer = new char[size + 1]; // size = 5, allocate 6 chars
InternetReadFile(request, buffer, size, &dwRead);
buffer [size] = '\0';

Да, теперь я понял, большое спасибо за объяснение! знак равно

user4256388 22.05.2019 15:27

Другие вопросы по теме