У меня есть фрейм данных, который выглядит так:
dict = {'475':['NaN', 0.6, 'NaN', 'NaN', 'NaN', 'NaN'],
'575':['NaN', 'NaN', 0.11, 'NaN', 'NaN', 'NaN'],
'675':[0.223, 'NaN', 'NaN', 0.913, 'NaN', 'NaN'],
'1775':['NaN', 'NaN', 'NaN', 'NaN', 3.46, 'NaN'],
'1875':['NaN', 'NaN', 'NaN', 'NaN', 'NaN', 3.46]
}
df=pd.DataFrame(dict,index=['33', '35', '36', '13', '41', '1222'])
Я хочу напечатать заявление для каждой строки, в котором говорится:
Местоположение index_value
находится в пределах column value
станции column name
, то есть для первой строки кадра данных это будет:
Пункт 33 находится в пределах 0,223 км от станции 675.
Я пытался:
for index, column in df.iterrows():
print('Farm number ' + str(index) + ' is within 5km of ' + str(column))
но это каждый раз печатает все значения индекса, и я не вижу, куда идти дальше.
Я был бы очень признателен за некоторые рекомендации.
Вы можете заменить NaN
строки на NaN
отсутствующие значения и изменить форму с помощью DataFrame.stack, поэтому отсутствующие значения удаляются, и вы можете выполнить цикл с MultiIndex Series
:
for (i, c), v in df.replace('NaN',np.nan).stack().items():
print(f"Location {i} is within {v}km of station {c}")
Location 33 is within 0.223km of station 675
Location 35 is within 0.6km of station 475
Location 36 is within 0.11km of station 575
Location 13 is within 0.913km of station 675
Location 41 is within 3.46km of station 1775
Location 1222 is within 3.46km of station 1875
Вы также можете создать DataFrame
:
df1 = df.replace('NaN',np.nan).stack().rename_axis(['i','c']).reset_index(name='v')
print (df1)
i c v
0 33 675 0.223
1 35 475 0.600
2 36 575 0.110
3 13 675 0.913
4 41 1775 3.460
5 1222 1875 3.460