Получение значения в теге <b> через XPATH

Как при парсинге веб-сайтов получить доступ к значениям элементов внутри тегов <b>? Ниже приведен пример HTML-кода, из которого я пытаюсь извлечь число в теге.

<h1 name = "apple" class = "banana">
    <b>700</b>
    "orange"
    <span> "fruits" </span>
</h1>

Этот клип показывает структуру HTML, из которой я пытаюсь извлечь значение 700.

Чтобы попытаться получить значение 700, я использую XPATH для доступа к элементу <h1>, но при захвате элемента, независимо от числового значения внутри тега <b>, я получаю 0.

Я захожу на сайт с помощью request.get (url), получаю текст и передаю его в объект html.fromstring. На этом этапе я попытался использовать XPATH для доступа к элементам, охватывающим этот заголовок, и перейти прямо к элементу b, но я не могу получить значение внутри элемента.

Любые советы будут оценены!

Очень непонятно, что вы пытаетесь сделать. Не могли бы вы редактировать задать вопрос, чтобы показать, где вам нужно «получить доступ к значению элементов внутри тегов <b>»? Ясно, что вы не хотите получать элемент, используя XPath "h1 / b" и тогда, получая текст другими методами (поскольку вы запрашиваете XPath) ...

Alexei Levenkov 01.04.2021 09:06

Алексей, я редактировал пост, просто хотел бы получить номер внутри тега b, но использование XPATH, похоже, не работает. Я попытался использовать XPATH, чтобы добраться до элемента, а затем добавить //text(), чтобы попытаться получить значение, но это возвращает 0, как я упоминал в сообщении.

rye_bread 01.04.2021 09:13

используйте css soup.select_one ('. banana b'). text с bs4

QHarr 01.04.2021 09:15

Могу ли я не получить доступ к элементу, просто используя запросы и lxml?

rye_bread 01.04.2021 09:16

Это ответ на ваш вопрос: stackoverflow.com/questions/36101772/…following-sibling::text()

QHarr 01.04.2021 09:19

@QHarr, я видел этот пост, он дает тот же результат, что и использование xpath. Я получаю значение 0, а не истинное значение.

rye_bread 01.04.2021 09:27

Есть ли URL-адрес, которым можно поделиться, и реальный элемент, который нужно захватить?

QHarr 01.04.2021 09:42

Позвольте нам продолжить обсуждение в чате.

rye_bread 01.04.2021 19:15
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Введение в CSS
Введение в CSS
CSS является неотъемлемой частью трех основных составляющих front-end веб-разработки.
Как выровнять Div по центру?
Как выровнять Div по центру?
Чтобы выровнять элемент <div>по горизонтали и вертикали с помощью CSS, можно использовать комбинацию свойств и значений CSS. Вот несколько методов,...
Навигация по приложениям React: Исчерпывающее руководство по React Router
Навигация по приложениям React: Исчерпывающее руководство по React Router
React Router стала незаменимой библиотекой для создания одностраничных приложений с навигацией в React. В этой статье блога мы подробно рассмотрим...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
Toor - Ангулярный шаблон для бронирования путешествий
Toor - Ангулярный шаблон для бронирования путешествий
Toor - Travel Booking Angular Template один из лучших Travel & Tour booking template in the world. 30+ валидированных HTML5 страниц, которые помогут...
0
8
40
0

Другие вопросы по теме