Я ищу несколько советов для небольших, но запутанных данных:
P2 Chain 161771 642 ID=0000025456
P2 Chain 161771 642 ID=0000438090
P2 Chain 161771 642 ID=0000438071
P2 Chain 161771 642 ID=00438072
P2 Chain 161771 642 ID=011423689
P2 Chain 161771 642 ID=002655525
В этих данных в последнем столбце присутствуют только неповторяющиеся значения. Я хочу упростить эти данные с помощью сценария / функции, чтобы объединить эти значения в одной строке, как показано ниже:
P2 Chain 161771 642 ID=0000025456, 0000438071,0000438090, 002655525, 011423689, 00438072






text = ''' P2 Chain 161771 642 ID=0000025456
P2 Chain 161771 642 ID=0000438090
P2 Chain 161771 642 ID=0000438071
P2 Chain 161771 642 ID=00438072
P2 Chain 161771 642 ID=011423689
P2 Chain 161771 642 ID=002655525'''
ids = [] # We will store the ids here
for line in text.splitlines(): # break the text block into lines and iterate over them
split_line = line.split('=') # break the line into two pieces, before and after the '='
id = split_line[1] # set id to be the part after '=', ie: the ID
ids.append(id)
print ('P2 Chain 161771 642 ID=' + str(ids))
Выход:
P2 Chain 161771 642 ID=['0000025456', '0000438090', '0000438071', '00438072', '011423689', '002655525']
Попробуйте прочитать данные построчно и разделить их на '='. Затем добавьте желаемый номер в список. Наконец, прочтите список и сделайте свою строку.