Предположим, что у вас есть данные:
import pandas as pd
df = pd.DataFrame(
{
"val": np.random.normal(0, 1, size=100),
"cat": np.random.choice(["a", "b"], size=100),
}
)
Затем визуализируйте блочную диаграмму:
from plotly import graph_objects as go
fig = go.Figure()
fig.add_trace(go.Box(y=df["val"], x=df["cat"], boxmean = "sd",))
Я использую go.Box
, так как хочу визуализировать STD. Это дает:
Как я могу установить разные цвета для левых и правых диаграмм в зависимости от категории?
Вы можете изменить цвет, перебирая каждую переменную категории.
for c in df['cat'].unique():
dff = df[df['cat'] == c]
fig.add_trace(go.Box(y=dff["val"], x=dff["cat"], boxmean = "sd", name=c))
Это сработало хорошо! Для меня немного нелогично, что двойной вызов fig.add_trace
ведет себя таким образом. Я ожидал какой-то перезаписи. Но на самом деле это добавление (добавление, как следует из названия) к фигуре. Кажется, что порядок a
, b
сохраняется независимо от их порядка в цикле. Интересный. Теперь у меня остался это.
FWIW, вот еще один вопрос, который у меня был, связанный с той же более серьезной проблемой, которая у меня есть: stackoverflow.com/q/72110370/671013