





inputString.splitlines()
Даст вам список с каждым элементом, метод splitlines() предназначен для разделения каждой строки на элемент списка.
@lpapp, полностью согласен. splitlines () семантически (и функционально, поскольку он использует универсальные символы новой строки и пропускает завершающую пустую строку) лучше, чем split ('\ n'). Тогда (2008) я был просто новичком в Python и grepping, хотя мои скрипты теперь показывают, что я тоже использую splitlines () почти исключительно. Поэтому я удаляю свой ответ из 104 пунктов (* всхлип ... *) и вместо этого буду поддерживать этот.
Это также делает ''.splitlines() == [], а не [''], как с ''.split('\n').
Как говорили другие:
inputString.split('\n') # --> ['Line 1', 'Line 2', 'Line 3']
Это идентично приведенному выше, но функции строкового модуля устарели, и их следует избегать:
import string
string.split(inputString, '\n') # --> ['Line 1', 'Line 2', 'Line 3']
В качестве альтернативы, если вы хотите, чтобы каждая строка включала последовательность разрыва (CR, LF, CRLF), используйте метод splitlines с аргументом True:
inputString.splitlines(True) # --> ['Line 1\n', 'Line 2\n', 'Line 3']
Это будет работать только в системах, которые используют символ конца строки '\ n'.
@Jeremy: строковые литералы в тройных кавычках всегда используют EOL '\ n', независимо от платформы. Так и файлы читаются в текстовом режиме.
ссылка на метод: docs.python.org/2/library/stdtypes.html#str.splitlines
inputString.split(os.linesep) будет использовать терминатор линии, зависящий от платформы.
Странно, что за этот ответ так проголосовали. Жесткое кодирование '\ n' - плохая идея, но даже если вы используете вместо этого os.linesep, у вас будут проблемы с окончанием строки Windows в Linux и наоборот, и т. д. Более того, он продвигает splitlines с аргументом True, который вероятно, менее распространенный способ его использования ...
Комбинация неоптимального метода, устаревшего метода и избыточного варианта оптимального метода.
Лучше всего, наверное, с splitlines. os.linesep - старая добрая ошибка, намного хуже, чем '\n'. Если вы работаете в Windows, вы все равно можете получать текст Unix. Тогда ваши строки не будут разделены. Если вы используете '\n' в тексте Windows, то худшее, что может случиться, это получить ложные символы \r, которые можно очистить с помощью .strip(), который вы обычно хотите вызвать в любом случае.
В этом конкретном случае может быть излишним, но другой вариант предполагает использование StringIO для создания файлового объекта.
for line in StringIO.StringIO(inputString):
doStuff()
Да, это наиболее идиоматичный, наиболее подходящий для Python подход.
Преимущество этого метода по сравнению с str.split - не нужно выделять память (он считывает строку на месте). Минус в том, что это намного медленнее, если вы используете StringIO (около 50x). Если вы используете cStringIO, однако, примерно в 2 раза быстрее
В 2 раза быстрее чем что?
@IrinaRapoport, cStringIO в 2 раза быстрее, чем StringIO
Используйте str.splitlines().
splitlines() правильно обрабатывает символы новой строки, в отличие от split("\n").
Он также имеет преимущество, упомянутое @efotinis, в том, что при вызове с аргументом True в результат разделения можно включить символ новой строки.
Почему не стоит использовать split("\n"):
\n в Python представляет собой разрыв строки Unix (десятичный код ASCII 10) независимо от платформы, на которой вы его запускаете. Однако представление разрыва строки зависит от платформы. В Windows \n - это два символа, CR и LF (десятичные коды ASCII 13 и 10, AKA \r и \n), тогда как в любой современной Unix (включая OS X) это один символ LF.
print, например, работает правильно, даже если у вас есть строка с окончаниями строк, которые не соответствуют вашей платформе:
>>> print " a \n b \r\n c "
a
b
c
Однако явное разбиение на "\ n" приведет к зависящему от платформы поведению:
>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']
Даже если вы используете os.linesep, он будет разделен только в соответствии с разделителем новой строки на вашей платформе и завершится ошибкой, если вы обрабатываете текст, созданный на других платформах, или с голым \n:
>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']
splitlines решает все эти проблемы:
>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']
Чтение файлов в текстовом режиме частично смягчает проблему представления новой строки, поскольку он преобразует \n Python в представление новой строки платформы.
Однако текстовый режим существует только в Windows. В системах Unix все файлы открываются в двоичном режиме, поэтому использование split('\n') в системе UNIX с файлом Windows приведет к нежелательному поведению. Кроме того, нет ничего необычного в обработке строк с потенциально разными символами новой строки из других источников, например из сокета.
Сравнение нечестно, потому что вы также можете использовать split (os.linesep), чтобы избежать бит, специфичный для платформы.
@lpapp обратите внимание, что splitlines разделится на конце строки Любые. split(os.linesep) завершится ошибкой при чтении файла Windows в unix, например
Еще одна причина для использования сплитлайнов в моем случае, спасибо. Я поставил +1. Я бы лично даже включил информацию в комментарии к вашему ответу.
Я бы хотел, чтобы у комментариев было правильное форматирование текста кода, потому что я думаю, что ответ @ 1_CR требует больше ударов, и я хотел бы дополнить его ответ. Во всяком случае, Он привел меня к следующей технике; он будет использовать cStringIO, если он доступен (НО ПРИМЕЧАНИЕ: cStringIO и StringIO - это не то же самое, потому что вы не можете создать подкласс cStringIO ... это встроенный ... но для основных операций синтаксис будет идентичным, поэтому вы можете это сделать):
try:
import cStringIO
StringIO = cStringIO
except ImportError:
import StringIO
for line in StringIO.StringIO(variable_with_multiline_string):
pass
print line.strip()
Исходное сообщение запрошено для кода, который печатает несколько строк (если они верны для некоторого условия) плюс следующую строку. Моя реализация была бы такой:
text = """1 sfasdf
asdfasdf
2 sfasdf
asdfgadfg
1 asfasdf
sdfasdgf
"""
text = text.splitlines()
rows_to_print = {}
for line in range(len(text)):
if text[line][0] == '1':
rows_to_print = rows_to_print | {line, line + 1}
rows_to_print = sorted(list(rows_to_print))
for i in rows_to_print:
print(text[i])
+1. Я думаю, что это лучше, чем принятое решение, потому что оно явно не влияет на разделитель строк. Все это просто работает с помощью специального метода API!