Я хочу сканировать данные с веб-сайта. На этом сайте:
HTML:
<div>
<ul>
<li><a href = "http://.../place1">Place1</a></li>
<li><a href = "http://.../place2">Place2</a></li>
</ul>
</div>
Внутри «http: //.../place1»:
<div>
<p>Place 1</p>
<img src = "...">
<div>
Как я могу сканировать данные внутри href с помощью гема «Nokogiri»? (Данные на другой странице, когда мы нажимаем)
Когда я исследую, я нахожу только способ сканировать данные на странице. Не нашел, как сканировать данные внутри href-страницы. Спасибо





Чтобы сканировать данные внутри href, вы иметь создаете новый запрос для сканирования данных внутри него.
...
# require 'open-uri'
href = 'http://.../place1'
doc = Nokogiri::HTML(open(href))
...
Все ссылки можно получить методом .css. Тогда вы можете проползти вот так
# require 'open-uri'
links = doc.css('a').map { |link| link['href'] }
links.each do |link|
doc = Nokogiri::HTML(open(link))
end
Спасибо большое :))