У меня есть фрейм данных, который является результатом конкатенации фрейма данных. Я использую опцию «keys=» для заголовка каждого блока при экспорте в Excel.
И теперь я хочу определить ID2 как индекс с идентификатором. (Для мультииндекса)
Я пытался использовать .resetindex, но это не сработало так, как я хочу.
Вы можете извлечь свои индексы в списки и создать объект MultiIndex
, а затем просто определить индекс вашего DataFrame с помощью этого MultiIndex
. Это работает на моей стороне (pandas
импортировано как pd
):
Предположим, что ваш первоначальный DataFrame - это (просто уменьшенная версия того, что у вас есть):
df = pd.DataFrame({'ID2': ['b','c','b'], 'name' : ['tomato', 'pizza', 'kebap']}, index = [1,2,4])
Затем мы извлекаем окончательные индексы из индекса и из столбца фрейма данных, чтобы построить список кортежей, с помощью которых вы создаете мультииндекс с помощью метода pandas.MuliIndex
:
ID2 = df.ID2.to_list()
ID1 = df.index.to_list()
indexes = [(id1, id2) for id1,id2 in zip(ID1,ID2)]
final_indices = pd.MultiIndex.from_tuples(indexes, names=["Id1", "Id2"])
Наконец, вы переопределяете свой индекс и можете удалить столбец «ID2»:
df.index = final_indices
df = df.drop('ID2', axis = 1)
Это дает следующий DataFrame:
Примечание. Я также пытался использовать метод df.reindex
, но значения DataFrame стали NaN
, не знаю почему.