Есть ли способ найти имена файлов с номерами, которые не являются последовательными? В частности, я хочу перечислить имена файлов с этими номерами:
path +'*.s201701*.nc'
path +'*.s201801*.nc'
path +'*.s201901*.nc'
path +'*.s201702*.nc'
path +'*.s201802*.nc'
path +'*.s201902*.nc'
path +'*.s201712*.nc'
path +'*.s201812*.nc'
path +'*.s201912*.nc'
Я могу получить изменения с «2017» на «2019», так как числа идут подряд, но не «01», «02», «12», потому что это не так. Это не работает:
glob.glob(path +'*.s201[7-9][01,02,12]*.nc'
И это работает,
glob.glob(path +'*.s201[7-9][0-1][1-2]*.nc'
но также дает мне файлы в s201*11*.nc
, которые мне не нужны. Какие-нибудь советы?
Вы можете просто проверить повторяющиеся номера, используя регулярное выражение в форме результатов os.listdir. Я сделал образец файла в том же каталоге, что и скрипт, и он имеет повторяющиеся номера. Использование первого метода возвращает пустой список. Удаление «не» в понимании списка возвращает неправильное имя файла.
import os
import re
files = [f for f in os.listdir(path) if not re.search(r'(\d)\1+\b', f)]
print(files)
[]
Удаление «не», чтобы найти повторяющиеся номера:
files = [f for f in os.listdir(path) if re.search(r'(\d)\1+\b', f)]
print(files)
['s201911.txt']
Вы не можете сделать это с одним глобусом — язык просто недостаточно сложен — но вы можете сделать это с двумя:
glob.glob(path +'*.s201[7-9]0[1-2]*.nc') + glob.glob(path +'*.s201[7-9]12*.nc')