Как объединить два текстовых файла с помощью Python и регулярного выражения

Вот что я получил: (Отредактировано после ответа.)

import re
File1 = open('text.txt', 'r')
regex = re.compile(r'\b(?:[12]?\d{1,4}|30{4})#[^#]+#')
string = File1.read()
itemdesc = regex.findall(string)
for word in itemdesc:
    print (word)

Используя: \ b (?: [12]? \ D {1,4} | 30 {4}) # [^ #] + # я смог найти:

5173#bunch of text here
of, bunch here, text
text here, bunch of
#

Найдя этот текст, я хотел бы заменить его в другом файле, где есть похожий. На текущем этапе мне еще нужно реализовать что-то вроде:

\b(?:number)#[^#]+#

Чтобы найти текст, переместите и замените его в другом файле, где находится текст с таким же номером, также перед выполнением этого проверьте, есть ли несколько вхождений.

После этого у меня возникнет другая проблема, заключающаяся в сохранении нескольких вхождений и сохранении их в другом тексте, чтобы вручную сделать все остальное.

Надеюсь, вы, ребята, можете помочь, любая помощь приветствуется, это не должно быть решением. :)

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
0
107
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Проблема здесь в том, что вы читаете файл и сопоставляете регулярное выражение строка за строкой, когда вы действительно хотите сопоставить регулярное выражение по нескольким строкам. Поэтому вы должны прочитать весь файл в одной строке, прежде чем сопоставить ее с регулярным выражением:

import re
File1 = open('text.txt', 'r')
regex = re.compile(r'\b(?:[12]?\d{1,4}|30{4})#[^#]+#')
string = File1.read()
itemdesc = regex.findall(string)
for word in itemdesc:
    print (word)

Спасибо, я явно не знаком с python, ваш ответ очень помог.

Andrew Carrazzone 10.09.2018 07:32

Другие вопросы по теме