Я пытаюсь восстановить заметки, сделанные на iPad, поверх PDF-файла, которые я сохранил как новый PDF-файл до сбоя приложения. Этот новый PDF-файл поврежден, но я могу его восстановить, чтобы он содержал все мои заметки (выделенные моменты и заметки на полях), но не исходный PDF-файл.
Я пытаюсь использовать библиотеку fitz
(также известную как PyMuPDF), чтобы восстановить полные заметки, накладывая исходный PDF-файл на свои заметки (используя альфа-маску 50%, чтобы я мог видеть сквозь светлые участки).
К сожалению, мне не удалось наложить прозрачность на две страницы! Страница заметок всегда маскирует исходный PDF-файл, поэтому я вижу только выделенные фрагменты и заметки в сценарии на ПУСТОЙ странице.
Пример 1 страницы:
Я безуспешно попробовал следующий код и несколько вариантов (обратите внимание, что в следующем коде я пытаюсь создать только одну страницу — страницу 276 — всего документа, чтобы ускорить тест):
import fitz # PyMuPDF
journal_document = fitz.open(journal_path) # type: ignore
notes_document = fitz.open(notes_path) # type: ignore
combined_document = fitz.open() # type: ignore
for page_num in range(len(journal_document)):
if page_num<276:
continue
# load pages to overlay
journal_page = journal_document.load_page(page_num)
notes_page = notes_document.load_page(page_num)
# extract bottom image
journal_pix = journal_page.get_pixmap()
journal_image = fitz.Pixmap(journal_pix, 0)
# create a new page in output doc
combined_page = combined_document.new_page(width=journal_page.rect.width,
height=journal_page.rect.height)
combined_page.show_pdf_page(journal_page.rect, journal_document, page_num)
# extract notes to be overlayed
notes_pix = notes_page.get_displaylist().get_pixmap()
notes_image = fitz.Pixmap(notes_pix)
notes_image.set_alpha(bytearray(int(128)) * 595 * 842)
# Insérer l'image du journal sur la nouvelle page
combined_page.insert_image(notes_page.rect, stream=notes_image.tobytes(),
alpha = int(128))
print(f"page {page_num} saved...")
break
combined_document.save(output_path)
Спасибо @furas — Подушка сделала свое дело. Тем не менее, я очарован сложностью загадок PDF-файлов и мечтаю найти решение с использованием PyMuPDF: приведенный выше код был настолько близок к поиску того, как соединить два изображения с некоторой альфа-маской и прозрачностью...
Для справки, вот сработавший фрагмент кода подушки, где image1 и image2 — это растровое изображение, извлеченное, как указано выше, а #page_num — это итератор номера страницы:
from PIL import Image
image1 = Image.open(buf_img1)
image2 = Image.open(buf_img2)
mask = Image.new('L', image1.size, 128) # 128 corresponds to 50% transparency
result = Image.composite(image1, image2, mask)
result.save(f'images/p{page_num}.jpg')
если у вас есть изображения, возможно, используйте модуль
pillow
илиwand
, который работает с изображениями.