У меня постоянно увеличивается список путей к файлам (сейчас у меня около 5000 записей) в Excel. В частности, у меня есть определенный уникальный идентификатор в столбце A и в столбце B, у меня есть путь к файлу, который ведет к изображению для этого уникального идентификатора.
Процесс добавления путей к файлам очень ручной, и иногда возникают ошибки. Итак, я хотел создать код, который проходит через каждый из этих путей к файлу, и если путь к файлу не открывается / не возвращает ошибку, сохранить эти значения в списке, чтобы я мог перейти непосредственно к ним и исправить путь к файлу. .
Я думал о написании кода Python, который проверяет путь к файлу в URL-адресе Google Chrome (я обнаружил, что он работает лучше, чем прямой щелчок по гиперссылке в Excel), но прошло некоторое время с тех пор, как я использовал Python и не знаю, где начать.
Любые рекомендации / идеи о том, как этого добиться?
Спасибо, Рикардо Г.
Для чтения файлов Excel я предпочитаю использовать библиотеку pandas, в частности функцию read_excel. Вы также можете проверить, является ли путь к файлу действительным существующим файлом в вашей файловой системе, используя модуль os.path. os.path.isfile
возвращает True, если предоставленный путь указывает на фактический файл, поэтому вы хотите использовать понимание списка с фильтром, чтобы иметь только пути к файлам, где это не так.
import pandas as pd
import os
df = pd.read_excel('path/to/excel')
bad_files = [fp for fp in df['filepath_column'] if !os.path.isfile(path)]
Я не уверен, что вы имеете в виду, говоря о проверке с помощью google chrome, но если вы говорите о локальных файлах, это должно сработать для вас.