Невозможно очистить веб-сайт с помощью javascript со стилизованным компонентом

Моя цель

Получите основную информацию на этой странице с использованием фреймворка Scrapy, но вопрос не относится к этому фреймворку. Возьмем, к примеру, элемент p внутри узла h1.

Проблема

Все выборки, которые я делаю с ответом, который я получаю от своих запросов Scrapy, не возвращают то, что находится внутри узла h1.

scrapy shell 'url'
response
>>> 200
response.xpath('//h1/p')
>>> []
Fetching the response:

При получении ответа я вижу структуру, которую я не могу понять, со всей основной html-разметкой, сжатой и размещенной сразу после набора компонентов в стиле javascript. файл находится здесь (ligne 1725).

Мой процесс

Testing the selector from dev-tool:

После отключения Javascript из инструментов разработчика и тестирования моего селектора я получаю желаемый результат. Например, я получаю элемент <p> внутри <h1> с помощью простого запроса //h1/p из консоли.

testing the selector with scrapy shell:

Не работает, см. Проблема

testing the selector with splash:

Я получаю точно такой же результат, как показано в проблеме.

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Безумие обратных вызовов в javascript [JS]
Безумие обратных вызовов в javascript [JS]
Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
JavaScript Вопросы с множественным выбором и ответы
JavaScript Вопросы с множественным выбором и ответы
Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...
0
0
174
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Я не могу объяснить ошибку, но я надеюсь дать ответ на вашу проблему

response.xpath('//*[@class = "summary__StyledAddress-e4c4ok-6 zWwUF textIntent-title1"]/text()').get()

возвращает: '12-14 31st Avenue, Unit 2'

Что, надеюсь, вам нужно?

Доктор П.

Я перепробовал множество методов, включая Selenium и Splash, и ни один из них не смог вернуть структурированную HTML-разметку. Работает только ваше решение по уточнению селекторов xpath без ссылки на родительские узлы.

Al_P 29.12.2020 18:20

Другие вопросы по теме