Как объединить строку | РЕГЭКС

import re

def tst():
  text = '''
  <script>
  '''
  if proxi := re.findall(r"(?:<td\s[^>]*?><font\sclass\=spy14>(.*?)<script.*?\"\+(.*?)\)</script)", text):
    for proxy, port in proxi:
      yield f"{proxy}:{''.join(port)}"
    
    if dtt := re.findall(r"<td colspan=1><font class\=spy1><font class\=spy14>(.*?)</font> (\d+[:]\d+) <font class\=spy5>([(]\d+ \w+ \w+[)])", text):
      for date, time, taken in dtt:
        yield f"{date} {' '.join([time, taken])}"
   
    return None
  return None

for proxy in tst():
  print(proxy)

вывод, который я получаю

51.155.10.0:8000
178.128.96.80:7497
98.162.96.41:4145
27-oct-2022 11:05 (49 mins ago)
27-oct-2022 11:04 (50 mins ago)
27-oct-2022 11:03 (51 mins ago)

поэтому я использую это регулярное выражение ниже, чтобы захватить группу из вывода

(\w+[.]\w+[.]\w+[.]\w+[:]\w+)|(\w+.*)

я хочу такой результат, как его объединить с выходом?

157.245.247.84:7497 - 27-oct-2022 11:05 (49 mins ago)
184.190.137.213:8111 - 27-oct-2022 11:04 (50 mins ago)
202.149.89.67:7999 - 27-oct-2022 11:03 (51 mins ago)

Что динамичного в вашем вводе? Количество строк? Приказ? Каков общий шаблон для всех возможных входных данных?

— 29.10.2022 09:59

Хотя на самом деле это не отвечает на мои вопросы.

— 29.10.2022 12:59

Извините за мой плохой английский. Я не знаю, как это объяснить по-английски. Но если вы можете взглянуть на полный код, возможно, он сможет ответить на ваш вопрос.

— 29.10.2022 13:12

В вопросе должна содержаться вся необходимая информация для понимания вопроса, а не ссылка.

— 29.10.2022 13:24

python regex

29.10.2022 09:44

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

101

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

Этот подход считывает все строки в список, а затем итерирует строки IP и строки даты в тандеме для создания выходных данных.

text = '''157.245.247.84:7497
184.190.137.213:8111
202.149.89.67:7999
27-oct-2022 11:05 (49 mins ago)
27-oct-2022 11:04 (50 mins ago)
27-oct-2022 11:03 (51 mins ago)'''
lines = text.split('\n')
output = []
for i in range(0, len(lines) / 2):
    val = lines[i] + ' - ' + lines[i + len(lines)/2]
    output.append(val)

print('\n'.join(output))

Это печатает:

157.245.247.84:7497 - 27-oct-2022 11:05 (49 mins ago)
184.190.137.213:8111 - 27-oct-2022 11:04 (50 mins ago)
202.149.89.67:7999 - 27-oct-2022 11:03 (51 mins ago)

Обратите внимание, что этот ответ предполагает, что каждая строка IP всегда будет иметь ровно одну совпадающую строку даты. Также предполагается, что строки упорядочены и что все строки IP предшествуют строкам даты.

Я просто редактирую сообщение. Вот вопрос.

— 29.10.2022 10:18

@xnoob Предисловие о том, как вы заканчиваете строки, не влияет на достоверность моего ответа.

— 29.10.2022 10:19

29.10.2022 09:55

Предоставление текста гарантированно содержит N строк IP-адресов, за которыми следуют N строк «временных меток», тогда вы можете сделать это:

text = '''157.245.247.84:7497
184.190.137.213:8111
202.149.89.67:7999
27-oct-2022 11:05 (49 mins ago)
27-oct-2022 11:04 (50 mins ago)
27-oct-2022 11:03 (51 mins ago)'''

lines = text.splitlines()

for ip, t in zip(lines, lines[len(lines)//2:]):
    print(f'{ip} - {t}')

Вывод:

157.245.247.84:7497 - 27-oct-2022 11:05 (49 mins ago)
184.190.137.213:8111 - 27-oct-2022 11:04 (50 mins ago)
202.149.89.67:7999 - 27-oct-2022 11:03 (51 mins ago)

я просто редактирую сообщение. Вот вопрос.

— 29.10.2022 10:19

29.10.2022 10:05

используя регулярное выражение

import re

text = '''
157.245.247.84:7497
184.190.137.213:8111
202.149.89.67:7999
27-oct-2022 11:05 (49 mins ago)
27-oct-2022 11:04 (50 mins ago)
27-oct-2022 11:03 (51 mins ago)
'''
ip_regex = r"(?:\d{1,3}\.){3}\d{1,3}\:\d{4}"
time_regex = r'\d{2}\-\w+\-\d{4}\s\d{2}\:\d{2}\s\(.+\)'

ip_list = re.findall(ip_regex, text)
time_list = re.findall(time_regex, text)

for i in range(len(ip_list)):
    print(f'{ip_list[i]} - {time_list[i]}')


>>> 157.245.247.84:7497 - 27-oct-2022 11:05 (49 mins ago)
>>> 184.190.137.213:8111 - 27-oct-2022 11:04 (50 mins ago)
>>> 202.149.89.67:7999 - 27-oct-2022 11:03 (51 mins ago)

29.10.2022 10:21

Ответ принят как подходящий

Предполагая, что код в верхней части вашего (отредактированного) вопроса имеет регулярные выражения, которые работают отлично, и они выполняют одинаковое количество совпадений, вы можете использовать zip:

import re

def tst():
    text = '''
    <script>
    '''
    proxi = re.findall(r"(?:<td\s[^>]*?><font\sclass\=spy14>(.*?)<script.*?\"\+(.*?)\)</script)", text)
    dtt = re.findall(r"<td colspan=1><font class\=spy1><font class\=spy14>(.*?)</font> (\d+[:]\d+) <font class\=spy5>([(]\d+ \w+ \w+[)])", text)
    if proxi and dtt:
        for (proxy, port), (date, time, taken) in zip(proxi, dtt):
            yield f"{proxy}:{''.join(port)} {date} {' '.join([time, taken])}"
   
for proxy in tst():
    print(proxy)

29.10.2022 13:30

Другие вопросы по теме

Как удалить «g» с регулярным выражением из этого списка в python с регулярным выражением?

Как использовать сопоставление шаблонов регулярных выражений Python с re.findall (шаблон, строка)?

Как создать функцию Regex, которая соответствует замещающему тексту изображения для двух клавиш

Регулярное выражение с именованной группой захвата

Получить весь текст между каждым заголовком уценки

Как включить первый символ в соответствие RegEx из шаблона RegEx?

Замените пробелы запятыми, используя Regex в python

Запрос Regex не работает в EleasticSearch, но работает в Java

Как удалить определенную комбинацию букв из конца каждого слова в столбце фрейма данных?

Замените текст данных компонентами в Vue 3

Как объединить строку | РЕГЭКС

Ответы 4

Другие вопросы по теме

Похожие вопросы