Я пытаюсь изменить файл Excel, в котором есть несколько действий VBA (не созданных мной). У меня была нежная попытка изменить один элемент поля со списком.
from openpyxl import load_workbook
# Load the workbook
workbook = load_workbook('input.xlsx')
# Select the worksheet
worksheet = workbook['Monthly']
# Change the value of the cell C5
worksheet['C5'] = 9
# Save the workbook with a new name
workbook.save('output.xlsx')
Вот какие предупреждения я получил:
Предупреждение пользователя: расширение проверки данных не поддерживается и будет удалено предупреждение (сообщение)
Предупреждение пользователя: расширение условного форматирования не поддерживается и будет удалено. alert(msg)
Размер выходного файла стал намного меньше, и некоторые функции исчезли, хотя значение поля со списком было изменено. Мой вопрос: существует ли библиотека, которая сохранит функциональность расширения проверки/условного форматирования, позволяя мне изменять значения ячеек?
Как вы заметили, при изменении файлов Excel, содержащих действия VBA, проверку данных или условное форматирование, использование openpyxl может привести к потере некоторых из этих функций. openpyxl не полностью поддерживает эти расширения.
В качестве альтернативы вы можете использовать библиотеку xlwings, которая позволяет вам взаимодействовать с Excel с помощью Python и более эффективно обрабатывать VBA и другие функции Excel. Например, в вашем случае вы можете использовать следующее:
import xlwings as xw
# Open the workbook
workbook = xw.Book('input.xlsx')
# Select the worksheet
sheet = workbook.sheets['Monthly']
# Change the value of the cell C5
sheet.range('C5').value = 9
# Save the workbook with a new name
workbook.save('output.xlsx')
При попытке создать библиотеки, которые предоставляют интерфейс прикладного программирования (API) для файлов Microsoft Office с использованием формата файлов Office Open XML без необходимости установки приложений Microsoft Office, существует в основном два подхода.
Первый состоит в том, чтобы взять ZIP-архив файла Office Open XML, извлечь из него части XML и манипулировать ими с помощью методов XML. После манипуляций повторно вставьте обработанный XML в исходный ZIP-архив Office Open XML. При таком подходе исходный файл Office Open XML остается полностью нетронутым, даже если запрограммированный API в настоящее время не предоставляет методов для управления всеми возможными частями формата файла Office Open XML. Но этот подход требует ресурсов, так как необходимо хранить исходный ZIP-архив Office Open XML в памяти и программировать все методы с использованием объектов XML напрямую, без возможности сначала десериализовать объекты в двоичные объекты, затем манипулировать этими двоичными объектами и только снова сериализуйте их в XML, сохраняя файл. Напротив, в дополнение к объектам XML необходимо создавать двоичные объекты.
Другой подход заключается в том, чтобы взять ZIP-архив файла Office Open XML, получить из него десериализованные двоичные объекты только для тех частей XML, для которых API в настоящее время предоставляет методы, и работать с этими двоичными объектами дальше. В конце концов, при сохранении файла двоичные объекты сериализуются в XML и помещаются в новую версию ZIP-архива Office Open XML. Этот метод требует меньше ресурсов, поскольку нет необходимости хранить исходный ZIP-архив Office Open XML в памяти, а манипуляции выполняются с использованием двоичных объектов, экономящих память. Но, конечно, этот метод не сохраняет исходный файл Office Open XML.
OpenPyXL использует второй подход. Таким образом, полученный Excel-файл Office Open XML содержит только части, для которых API OpenPyXL предоставляет методы. Вот почему предупреждения. И именно поэтому OpenPyXL полностью сохранит исходный Excel-файл Office Open XML только тогда, когда в будущем он будет полностью обеспечивать управление всеми его частями. Это пока не так.
Например, API-интерфейсы python-docx и python-pptx следуют первому подходу. Вот почему использование этих API для управления Word-файлами Office Open XML и/или PowerPoint-файлами полностью сохраняет исходные файлы. Но эти API требуют больше ресурсов.
Короче говоря, я сомневаюсь, что вы сможете полностью сохранить исходный Excel-файл Office Open XML после манипуляций с ним с помощью OpenPyXL.