HtmlUnit получает строку с неправильной кодировкой

Я использую HtmlUnit для выполнения некоторого Javascript в файле HTML. Дело в том, что Javascript может быть любым, например document.querySelector().

При запуске document.querySelector() через executeJavaScript() для получения строковых данных из HTML, он возится с кодировкой.

Например: Interés становится Interés.

Есть ли умный способ преобразовать его, настраивая объекты HtmlUnit?

Некоторый код:

webClient = new WebClient(BrowserVersion.CHROME);
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setCssEnabled(false);
webClient.getOptions().setAppletEnabled(false);
webClient.getOptions().setDownloadImages(false);

htmlPage = this.webClient.getPage("file:/" + htmlFile.getAbsolutePath());

ScriptResult scriptResult = htmlPage.executeJavaScript(someJavascriptFunction);

//This scriptResult.getJavaScriptResult() already has encoding issues

Я попытался установить webClient.addRequestHeader("Accept-Encoding", "utf-8");, но это не сработало.

Не могли бы вы открыть проблему HtmlUnit (github.com/HtmlUnit/htmlunit) и предоставить образец файла.

RBRi 13.12.2018 17:12
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Безумие обратных вызовов в javascript [JS]
Безумие обратных вызовов в javascript [JS]
Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
JavaScript Вопросы с множественным выбором и ответы
JavaScript Вопросы с множественным выбором и ответы
Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...
0
1
248
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Проблема здесь в источнике файла. Есть информация об используемой кодировке при чтении простого файла с диска. HtmlUnit обрабатывает этот случай так же, как если бы веб-сервер не предоставляет никакой информации о кодировке как часть ответа. В этих случаях HtmlUnit (как и настоящие браузеры) читает байты файла, используя кодировку StandardCharsets.ISO_8859_1.

В качестве простого решения напишите ваш файл в кодировке ISO_8859_1.

Другие вопросы по теме