Я пытаюсь изменить Destination
с Microsoft Print to PDF
на Save as PDF
в опции предварительного просмотра печати с помощью Python Selenium и нажать кнопку сохранения.
Я не могу щелкнуть этот раскрывающийся список и выбрать save as PDF
. Может ли кто-нибудь мне помочь с этим?
Код:
import time, os
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
from bs4 import BeautifulSoup
import pyautogui
import autoit
def main(PDF_URL):
options = webdriver.ChromeOptions()
path = str(os.path.dirname(os.path.abspath(__file__))) + "\download"
options.add_argument("--disable-popup-blocking")
options.add_argument("--disable-notifications")
options.add_argument("--disable-notifications")
# Bypass OS security model
options.add_argument("--no-sandbox")
# Run in headless mode (optional)
# options.add_argument("--headless")
options.add_argument("--disable-dev-shm-usage")
prefs = {'download.default_directory' : path,
"download.prompt_for_download": False,
"download.directory_upgrade": True,
"safebrowsing.enabled": True
}
options.add_experimental_option("prefs", prefs)
options.add_experimental_option('excludeSwitches', ['enable-logging'])
browser = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
browser.maximize_window()
browser.get(PDF_URL)
browser.implicitly_wait(180)
print("browser open successfully..")
browser.execute_script('window.print();')
time.sleep(5)
if __name__ == "__main__":
PDF_URL = "10.1055-s-2001-17364.pdf"
main(PDF_URL)
@JeffC, спасибо за то, что поделились мнениями, не могли бы вы предложить какую-нибудь библиотеку для этого, или с ней все в порядке pyautogui
?
Я не использую эти библиотеки, поэтому не могу их порекомендовать. Я бы просто попробовал и посмотрел, что работает.
Если вы хотите программно загрузить PDF-файл с URL-адреса, я думаю, вам даже не нужно использовать селен. Вы можете легко загрузить и сохранить PDF-файл с URL-адреса с помощью этого кода ниже:
import urllib.request
response = urllib.request.urlopen(URL)
file = open("FILENAME.pdf", 'wb')
file.write(response.read())
file.close()
Если ваша страница динамическая или Virtual-DOM, этот способ не работает, и вы следует использовать селен.
Если ваш URL-адрес не относится к PDF-файлу, вы можете поискать некоторые методы диалога для преобразования содержимого этой страницы в PDF.
Вы не можете использовать Selenium. Это диалоговое окно браузера, и Selenium не может с ним взаимодействовать, поэтому вам придется найти другую библиотеку, которая сделает это за вас.