Я пытаюсь создать веб-скребок, который получает легкий текст с веб-сайта и создает PDF-файл, используя html на сайте. Для этого я получаю HTML-текст и конвертирую его в объект DOM, а затем в строку HTML-кода, из которой я делаю PDF-файл. Моя проблема в том, что после преобразования в pdf кодировка html приводит к тому, что кавычки и другие символы становятся â. Как мне сделать файл pdf без появления странных символов? Спасибо за помощь в продвижении!
const request = require('request');
const jsdom = require("jsdom");
const { JSDOM } = jsdom;
var htmlToPdf = require('html-to-pdf');
var BaseURL = 'https://www.wuxiaworld.com/novel/overgeared/og-chapter-';
for(let chapNum = 1; chapNum < 2; chapNum++) {//made to loop through many chapters
url = BaseURL;
url += chapNum;
request(url , (error, response, html) => {
if (!error & response.statusCode == 200) {
const dom = new JSDOM(html);
const chapterContent = dom.window.document.getElementsByClassName('fr-view')[1];//gets div I want
const filename = 'Overgeared_Chapter_' + chapNum + '.pdf';
htmlToPdf.convertHTMLString(chapterContent.outerHTML, filename,//takes the html string and makes pdf file
function (error, success) {
if (error) {
console.info('Worked...Not!');
console.info(error);
} else {
console.info('Actually Worked!');
console.info(success);
}
}
);
}
})
url = BaseURL;//resets url to be changed again
}
Я вроде как любитель, когда дело доходит до этого, как мне убедиться, что они используют utf8, сайт, с которого я получаю hmtl, - это utf8



![Безумие обратных вызовов в javascript [JS]](https://i.imgur.com/WsjO6zJb.png)


Убедитесь, что вы используете правильную кодировку, например, если запрашиваемая страница -
utf8, убедитесь, что синтаксические анализаторы и конвертеры также используютutf8.