import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
df = pd.read_excel("Baltimore Towing Division.xlsx",sheet_name = "TowingData")
df['Month'] = pd.DatetimeIndex(df['TowedDate']).strftime("%b")
df['Week day'] = pd.DatetimeIndex(df['TowedDate']).strftime("%a")
monthOrder = ['Jan', 'Feb', 'Mar', 'Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec']
dayOrder = ['Mon','Tue','Wed','Thu','Fri','Sat','Sun']
Pivotdf = pd.pivot_table(df, index=['Month'],
values=['TowedDate'],
columns=['Week day'],
fill_value=0,
aggfunc='count').reindex(monthOrder,axis=0).reindex(dayOrder,axis=1)
print(df)
Я использую функцию .reindex в конце сводной таблицы для переиндексации месяцев и столбцов «День недели», она возвращает NaN в результатах.
Использование .reindex в оси = 1
Не выполняя .reindex в столбце дней, сводная таблица приносит мне результаты, но с дезорганизованными днями недели. Мне нужно, чтобы они отображались в таблице в следующем порядке: пн, вт, ср, чт, пт, сб, вс
Без использования .reindex в оси = 1
Да, я пробовал, но он не возвращает результат
Возможно, используя loc
:
# with values=['TowedDate'] -> MultiIndex
Pivotdf = pd.pivot_table(df, index=['Month'],
values=['TowedDate'],
columns=['Week day'],
fill_value=0,
aggfunc='count').loc[monthOrder, (slice(None), dayOrder)]
# OR
# with values='TowedDate' -> Index
Pivotdf = pd.pivot_table(df, index=['Month'],
values='TowedDate',
columns=['Week day'],
fill_value=0,
aggfunc='count').loc[monthOrder, dayOrder)]
Выход:
>>> Pivotdf
TowedDate
Week day Mon Tue Wed Thu Fri Sat Sun
Month
Jan 1 0 1 0 1 0 0
Feb 2 0 1 0 1 0 0
Mar 1 0 0 0 0 0 0
Apr 0 0 0 1 0 1 0
May 0 1 1 3 1 1 2
Jun 1 0 0 0 0 1 2
Jul 0 1 0 0 2 0 0
Aug 3 0 0 0 1 2 1
Sep 0 0 1 1 0 1 0
Oct 3 0 0 0 1 0 1
Nov 1 0 0 0 1 2 3
Dec 0 1 1 0 0 0 0
Спасибо, этот метод работал хорошо: # with values=['TowedDate'] -> MultiIndex. Эта строка решила проблему: .loc[monthOrder, (slice(None), dayOrder)]
Метод Корральена решил проблему.
# with values=['TowedDate'] -> MultiIndex
Pivotdf = pd.pivot_table(df, index=['Month'],
values=['TowedDate'],
columns=['Week day'],
fill_value=0,
aggfunc='count').loc[monthOrder, (slice(None), dayOrder)]
Миллионы благодарностей всем участникам, которые ответили и помогли мне в этом вопросе
Вы пробовали использовать df=df.reset_index(drop=True)?