Я хочу токенизировать свой CSV в одном списке, а не в отдельном списке?
with open ('train.csv') as file_object:
for trainline in file_object:
tokens_train = sent_tokenize(trainline)
print(tokens_train)
Вот как я получаю вывод:
['2.1 Separated of trains']
['Principle: The method to make the signal is different.']
['2.2 Context']
Я хочу, чтобы все они были в одном списке
['2.1 Separated of trains','Principle: The method to make the signal is different.','2.2 Context']






Поскольку sent_tokenize() возвращает список, вы можете каждый раз просто расширять начальный список.
alltokens = []
with open ('train.csv') as file_object:
for trainline in file_object:
tokens_train = sent_tokenize(trainline)
alltokens.extend(tokens_train)
print(alltokens)
Или с пониманием списка:
with open ('train.csv') as file_object:
alltokens = [token for trainline in file_object for token in sent_tokenize(trainline)]
print(alltokens)
Оба решения будут работать, даже если sent_tokenize() возвращает список длиннее 1.
Вот что я получаю от вашего метода.
Как мы можем объединить их все в один список?
Пожалуйста. Если ответ был полезен, пожалуйста, примите его. stackoverflow.com/help/someone-answers
Инициализировать пустой список
out = []
И внутри цикла добавьте к нему элементы.
out.append(tokens_train)
Возможно, вам также нужно изменить свой токенизатор.
[['2.1 Отдельно от поездов'], ['Принцип: метод подачи сигнала другой.'],['2.2 Контекст']]