Не каждую n-ю строку, но если набор данных огромен, вы можете попытаться прочитать и обработать его такими фрагментами:
df_chunks = pd.read_csv("train/train.csv", chunksize=5000)
В этом случае он вернет не весь фрейм данных, а итератор, каждый из которых содержит некоторую часть CSV-файла с 5000 строками.
Попробуйте игнорировать строки по их индексам:
n = 5
skip_func = lambda x: x%n != 0
df = pd.read_csv("data.csv", skiprows = skip_func)
Когда skiprows
является вызываемым, pandas.read_csv
игнорируются те строки, индексы которых возвращают True
при их оценке в функции.