Как я могу изменить существующее регулярное выражение, чтобы удалить все начальные символы, которые являются либо цифрой, либо знаком подчеркивания.
re.sub('^(\d+|_).*', '', n, flags=re.IGNORECASE)
# test strings
0001_Smoke_B_B
0002_Smoke_B_B
0012_Smoke_B_B
MA103
MA104
00_00MA105
Конечная цель должна выводить эти
Smoke_B_B
Smoke_B_B
Smoke_B_B
MA103
MA104
MA105
вы можете форматировать данные в код, который мы можем просто скопировать и запустить. Вы можете создать список с примерами и циклом for, который проверяет каждую строку с помощью регулярного выражения.
Используйте класс символов вместо чередования, это более эффективно: re.sub('^[\d_]+', '', n, flags=re.IGNORECASE)
Здесь нет необходимости в регулярном выражении. str.lstrip работает нормально.






^[\d_]+
^ Ищет начало строки
[\d_] Массив символов с цифрой или символом подчеркивания
+ 1 и более раз
Если вы удалите ., он будет использовать * для поиска всех цифр и _
'^(\d+|_)*'
Тестовый код.
Я также добавил '^[\d+_]+' из других ответов/комментариев
import re
# test strings
examples = [
'0001_Smoke_B_B',
'0002_Smoke_B_B',
'0012_Smoke_B_B',
'MA103',
'MA104',
'00_00MA105'
]
for text in examples:
result = re.sub('^(\d+|_)*', '', text, flags=re.IGNORECASE)
print(text, '->', result)
# example from other answers and comments
for text in examples:
result = re.sub('^[\d+_]+', '', text, flags=re.IGNORECASE)
print(text, '->', result)
может быть, вам следует использовать
*без.?