Я хочу проанализировать переменную output и распечатать последний тег (по времени), в настоящее время я печатаю самый старый тег, есть ли способ использовать reverse с разделенными линиями?
import re
output = """Fri Apr 27 18:43:20 2018 username3 <[email protected]> submitted CoreCapture-274.1 to release1
Fri Apr 27 18:43:20 2018 username3 <[email protected]> forwarded CoreCapture-274.1 to release2, release2E, release1E, release3, and release3E
Fri May 18 20:09:22 2018 username2 <[email protected]> submitted CoreCapture-274.2 to release1
Fri May 18 20:09:22 2018 username2 <[email protected]> forwarded CoreCapture-274.2 to release2, release2E, release1E, release3, and release3E
Fri Jun 8 13:35:44 2018 username1 <[email protected]> submitted CoreCapture-274.3 to release1
Fri Jun 8 13:35:44 2018 username1 <[email protected]> forwarded CoreCapture-274.3 to release2, release2E, release1E, release3, and release3E"""
train = "release2"
for line in output.splitlines():
#print "line"
#print line
if re.match(r'.*(submitted|forwarded)(.*) to .*%s.*'%train,line):
print line
break
ВЫХОД:-
CoreCapture-274.1
ОЖИДАЕМЫЙ ВЫХОД: -
CoreCapture-274.3






Вы можете попробовать использовать:
for line in reversed(output.splitlines()) :
@ user3508811 может лучше задать другой вопрос?
Оберните вызов splitlines в reversed, и он выполнит итерацию результирующих строк в обратном порядке (без дополнительных временных list):
for line in reversed(output.splitlines()):
В качестве альтернативы, если вам нужен сам list в обратном порядке, вы можете сделать его двумя строками:
lines = output.splitlines()
lines.reverse() # Reverses in place
или однострочно с реверсивным срезом (за счет дополнительного временного list):
lines = output.splitlines()[::-1] # Returns reversed list
Есть ли способ упростить этот re.match(r'.*(submitted|forwarded)(.*) to .*%s.*'%train,line):?
@ user3508811: Это совершенно отдельный вопрос, и его действительно стоит задать на сайте Code Review StackExchange. На первый взгляд, вы должны использовать re.escape на train, чтобы защитить себя, если train когда-либо содержит специальные символы регулярных выражений.
import re
output = """Fri Apr 27 18:43:20 2018 username3 <[email protected]> submitted CoreCapture-274.1 to release1
Fri Apr 27 18:43:20 2018 username3 <[email protected]> forwarded CoreCapture-274.1 to release2, release2E, release1E, release3, and release3E
Fri May 18 20:09:22 2018 username2 <[email protected]> submitted CoreCapture-274.2 to release1
Fri May 18 20:09:22 2018 username2 <[email protected]> forwarded CoreCapture-274.2 to release2, release2E, release1E, release3, and release3E
Fri Jun 8 13:35:44 2018 username1 <[email protected]> submitted CoreCapture-274.3 to release1
Fri Jun 8 13:35:44 2018 username1 <[email protected]> forwarded CoreCapture-274.3 to release2, release2E, release1E, release3, and release3E"""
train = "release2"
l=output.splitlines()
l.reverse()
for line in l:
#print "line"
#print line
if re.match(r.*(submitted|forwarded)(.*) to .*%s.*'%train,line):
print line
break
Есть ли способ упростить этот re.match(r'.*(submitted|forwarded)(.*) to .*%s.*'%train,line):?
Упрощенная версия регулярного выражения заключается в использовании
if train in line:
match = re.search(r'(submitted|forwarded)\s+(\S+)'
if match:
print match.group(2)
break
Ваша версия печатает всю строку, когда вы запрашиваете «слово» после отправки |
это не сработает, идея состоит в том, чтобы не получить слово после отправки | переадресовано, я хочу сопоставить строку, в которой есть соответствующий поезд, а затем получить слово
это именно то, что он делает: 1) соответствует строке, которая имеет соответствующий поезд if train in line: и 2) затем получает слово if match:
import re
m=re.fullmatch(r"(?ms).*(?:submitted|forwarded)\s+(.*?)\s+to(?!.*CoreCapture).*",output)
print(m.group(1))
Output:
CoreCapture-274.3
#------------------
(?ms) m:multiline,s: . matches \n, too
(?!.*CoreCapture) negative lookahead to sure no more 'CoreCapture' string in the rest, so the group must match the last "CoreCapture".
Но это не касается случая "release2". Расширенная версия:
m=re.fullmatch(r"(?ms).*(?:submitted|forwarded)\s+(.*?)\s+to.*release2(?!.*CoreCapture.*release2).*",output)
Есть ли способ упростить этот
re.match(r'.*(submitted|forwarded)(.*) to .*%s.*'%train,line):?