Web Scraping Loop с Puppeteer: «ожидание допустимо только в асинхронной функции»

Я пытаюсь проверить, какой текущий элемент находится в эфире на qvc.com в повторяющемся цикле, используя следующий код, однако я получаю «ожидание допустимо только в асинхронной функции» в строке «const results = await…».

Вот мой код:

(async () => {
    // Init
    const browser = await puppeteer.launch();
    const page = await browser.newPage();
    await page.goto('https://www.qvc.com/content/iroa.qvc.eastern.html');

    // Selectors
    const current_item_selector = '.galleryItem:first-of-type a';

    // Functions
    setInterval(function() { // Repeat every 5s
        const results = await page.$(current_item_selector);
        const item = await results.evaluate(element => element.title);
        console.info(item);
    }, 5000);
})();

ОБНОВЛЯТЬ: setTimeout должен был быть setInterval, что было моей ошибкой, ошибкой копирования/вставки. Я обновил это в кодовом блоке, спасибо тем, кто указал на это.

Ошибка именно такая, как написано - ваша setTimeout функция не async

Adam Jenkins 15.12.2020 23:19

setTimeout запускается только один раз, вы имели в виду setInterval?

Alexander Staroselsky 15.12.2020 23:20

Просто будьте готовы, даже с этим изменением у вас, вероятно, будут проблемы с попыткой await операций в setInterval. См. stackoverflow.com/questions/51830200/… и stackoverflow.com/questions/33289726/…

Alexander Staroselsky 15.12.2020 23:30

Ваш браузер закроется до первого интервала. Вам, вероятно, лучше использовать waitForTimeout в цикле while.

pguardiario 16.12.2020 03:49
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Безумие обратных вызовов в javascript [JS]
Безумие обратных вызовов в javascript [JS]
Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
JavaScript Вопросы с множественным выбором и ответы
JavaScript Вопросы с множественным выбором и ответы
Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...
0
4
328
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Функция внутри setInterval также должна быть асинхронной:

// Functions
    setInterval(async function() { // Repeat every 5s
        const results = await page.$(current_item_selector);
        const item = await results.evaluate(element => element.title);
        console.info(item);
    }, 5000);

Не уверен, но в комментариях к вопросу говорится, что им нужно повторять каждые x секунд. setTimeout не будет правильной функцией для этого. В вопросе также упоминается «повторяющийся цикл», это решает только часть проблемы.

Alexander Staroselsky 15.12.2020 23:21

@AlexanderStaroselsky - вы правы, но ответ касается ошибки, о которой спрашивает OP, не упоминалось (пока) о том, что желаемая функциональность не была достигнута.

Adam Jenkins 15.12.2020 23:22

Это отдельная проблема, но я отредактирую ответ, чтобы учесть это.

domenikk 15.12.2020 23:23

Спасибо, что указали на setInterval vs setTimeout, что было ошибкой копирования/вставки с моей стороны при составлении поста. Добавление асинхронности к функции было ответом, однако желаемый эффект еще не достигнут. Я предполагал, что кукольник должен имитировать браузер в узле, но, похоже, это просто повторение одного и того же результата, как если бы это была просто статическая загрузка страницы. Есть ли лучший способ/пакет для этого?

Hunter 15.12.2020 23:41

@Hunter, вы можете попробовать перезагружать страницу каждые 5 секунд: github.com/puppeteer/puppeteer/blob/main/docs/…

domenikk 15.12.2020 23:45

@domenikk Я поставил функцию перезагрузки вверху интервала, спасибо :)

Hunter 23.12.2020 10:49

Другие вопросы по теме