Привет, я пытаюсь передать все строки с индексом 7 = "Danmark" в другой файл. Из файла CSV я получаю сообщение об ошибке «IndexError: индекс списка вне допустимого диапазона». Надеюсь, вы, ребята, можете мне помочь.
import csv #import the module csv
with open('akassedatareduced.csv', encoding = "ISO-8859-1") as csvfile, open('nydata.csv', 'w') as output:
rowreader = csv.reader(csvfile)
fieldnames = ['CHURN/LOYAL', 'Medlemstype', 'Alder', 'Kon', 'Kommune', 'Uddannelsesnavn', 'Uddannelsessted', 'Land', 'Ledighed Historik', 'Telefon', 'Mobil', 'SamtaleType', 'Samtalested', 'Samtale maned', 'Churn maned', 'Dagpengeret maned', 'indmeldeses maned', 'fodselsdags maned']
writer = csv.DictWriter(output,delimiter= ',',fieldnames=fieldnames)
#writer= csv.DictWriter.writeheader(fieldnames)
for row in rowreader:
print(row[7])
if row[7] == "Danmark":
writer.writerow(row)
Это связано с тем, что в некоторых строках нет 8-го столбца (помните, что нумерация массивов начинается с 0). Убедитесь, что во всех строках есть 8-й столбец. Лучшим подходом было бы использовать DictReader (docs.python.org/2/library/csv.html#csv.DictReader), а затем получить доступ к столбцу, как row['ColumnName'] == 'Danmark'.






Похоже, у вас неправильно сформированная строка. Чтобы отладить это самостоятельно, используйте предложение try / except, чтобы поймать IndexError:
for row in rowreader:
try:
if row[7] == "Danmark":
writer.writerow(row)
except IndexError:
print(row)
Затем либо позвольте ошибкам пройти незаметно, либо исправьте базовые данные и повторите попытку.
Я бы предпочел использовать csv.DictReader. DictReader преобразует каждую строку в словарь. Это очень помогает, поскольку сценарий все равно будет работать, даже если порядок столбцов будет изменен или любой столбец будет вставлен / удален между ними.
Ваш код будет выглядеть так, когда вы используете DictReader.
import csv #import the module csv
with open('akassedatareduced.csv', encoding = "ISO-8859-1") as csvfile, open('nydata.csv', 'w') as output:
rowreader = csv.DictReader(csvfile)
fieldnames = ['CHURN/LOYAL', 'Medlemstype', 'Alder', 'Kon', 'Kommune', 'Uddannelsesnavn', 'Uddannelsessted', 'Land', 'Ledighed Historik', 'Telefon', 'Mobil', 'SamtaleType', 'Samtalested', 'Samtale maned', 'Churn maned', 'Dagpengeret maned', 'indmeldeses maned', 'fodselsdags maned']
writer = csv.DictWriter(output,delimiter= ',',fieldnames=fieldnames)
#writer= csv.DictWriter.writeheader(fieldnames)
for row in rowreader:
print(row["Land"]) # Access using column name
if row["Land"] == "Danmark": # Access using column name
writer.writerow(row)
Спасибо помогает мне немного дальше, я не получаю ошибок, и он просматривает правый столбец по строкам. Однако напечатанный вывод говорит "none" и проходит по всем строкам с "Danmark". For row in rowreader: try: print (row ["Land"]) # Доступ с использованием имени столбца if row ["Land"] == "Danmark": writer.writerow (row) except IndexError: print (row) `
Попробуйте распечатать row с помощью print row и опубликуйте результат.
Это результат при выводе на печать значений печать (строка): none OrderedDict ([('CHURN / LOYAL', 'CHURN, Betalende, 63, M, Gladsaxe Kommune, cand.polyt, Ikke pa liste, Danmark, Ingen Ledighedshistorik, Udfyldt, Ikke udfyldt ,,,, «Декабрь 1989 г.», «Сентябрь 1950 г.», «Март 1977 г.», «Январь 1926 г.» '), (' Medlemstype ', Нет), (' Ольха ', Нет), (' Кон ' , None), ('Kommune', None), ('Uddannelsesnavn', None), ('Uddannelsessted', None), ('Land', None), ('Ledighed Historik', None), ('Telefon udfyldt status ', Нет), (' Mobil udfyldt status ', Нет), (' Samtaletype ', Нет), (' Samtalested ', Нет), (' Samtale Maned ', Нет)
вы можете распечатать rowreader?