У меня возникла проблема с извлечением изображения с веб-сайта «Манга» с использованием python. Ниже приведен пример элемента на веб-сайте:
Я могу разобрать ссылку «src» и соотношение сторон изображения, которое должно быть следующим, если использовать обычный браузер для просмотра:
Тем не менее, изображение, которое я загрузил, стало «160 x 160 пикселей», а размер файла меньше. Я пробовал использовать Beautifulsoup, Selenium и т. д., но все равно получаю тот же результат.
Но если я использую:
Я смог сохранить «Визуализированный размер» как метод выше 2, используя обычные браузеры. Почему, используя python для очистки, я не могу получить правильное соотношение сторон ??
Надеюсь, что кто-то может помочь мне в этом или где я ошибся, спасибо.





Проблема решена: Selenium не может сделать снимок экрана с полным размером рендеринга, но с помощью Playwright я могу сделать снимок экрана с правильным соотношением сторон, отображаемым после загрузки браузера.
''' Вот мой код драматурга:
from playwright.sync_api import sync_playwright
manga_url = ("the url that u going to scrape")
dwn_path = your_directory
os.chdir(dwn_path)
with sync_playwright() as p:
browser = p.chromium.launch(headless=False, slow_mo=500)
page = browser.new_page()
page.goto(manga_url)
page.locator("#comic").screenshot(path = "screenshot.png")
print(page.title())
browser.close()