Есть ли способ отобразить PDF-файл (только одну страницу, если это имеет значение) на Python без использования библиотеки PyMuPDF?
Я хочу экспортировать свой проект через PyInstaller, и включение PyMuPDF увеличивает размер файла с ~ 40 до ~ 105 МБ. Поскольку я хочу только отобразить свой PDF-файл и не нуждаюсь в каких-либо расширенных функциях PyMuPDF (или вообще в каком-либо редактировании/манипулировании), мне было интересно, есть ли способ сделать это без особых накладных расходов.
PDF-файл создается во время выполнения ReportLab.
Я заставил его работать с пакетом pypdfium2, который добавляет всего ~3 МБ к экспортированному .exe вместо ~60 МБ из mupdf.
import pypdfium2 as pdfium
image_buffer = io.BytesIO()
doc2 = pdfium.PdfDocument(input=pdf_buffer, autoclose=True)
doc2[0].render().to_pil().save(image_buffer, format='PNG')
image_bytes = image_buffer.getvalue()
Здесь оба pdf_buffer
и image_buffer
означают io.Bytes()
для ввода файла PDF и вывода файла изображения соответственно.
Однако настройка для PyInstaller заняла немного времени:
В файл .spec
скрипта PyInstaller вам нужно вручную добавить 3 файла, чтобы pypdfium2 корректно работал. В вызове a=Analysis(...)
вам нужно добавить эти 3 строки к аргументу datas
:
datas=[
(f'{site_packages_location}/pypdfium2_raw/pdfium.dll', 'pypdfium2_raw'),
(f'{site_packages_location}/pypdfium2_raw/version.json', 'pypdfium2_raw'),
(f'{site_packages_location}/pypdfium2/version.json', 'pypdfium2')
]
где
site_packages_location = f"{os.getenv('LOCALAPPDATA')}/Programs/Python/Python312/Lib/site-packages/"
В этом ответе есть дополнительная информация об этом.
Да, я хотел поскорее с ними поработать, т.к. уже последние 2 года...
Примечание: виртуальные среды полезны для управления пакетами Python для каждого проекта; если вы сейчас устанавливаете все глобально, я бы рекомендовал изучить их.