У меня есть датафрейм автомобилей 5 разных марок со всеми моделями и их техническими данными. Упрощенно это выглядит так:
Как создать многолинейный график, показывающий распределение HP по каждому бренду? (каждая марка - это линия в сюжете)
Я попробовал функцию groupby или просто задал столбцы данных в конструктор линейного графика, но это не сработало.
Вместо того, чтобы писать «это не сработало», не могли бы вы показать свой код (в виде текста), его результат (в виде изображения сюжета) и подробное объяснение того, что вам нужно, чтобы отличаться?
@D.L Колонка HP не является категориальной, поэтому я думаю, что там будет работать линия (в итоге 4 строки из-за 4 брендов)
@JohanC, ты совершенно прав, в следующий раз я так и сделаю. Спасибо за совет
@JohanC У меня больше нет кода.
Вы можете сделать это в Seaborn.
import seaborn as sns
import pandas as pd
# Load data into a pandas DataFrame
data = {'Brand': ['VW', 'Audi', 'Audi', 'VW', 'VW', 'Ford', 'KIA', 'Audi', 'Audi', 'VW', 'VW'],
'Model': ['Golf 7', 'A4', 'A5', 'Passat', 'Polo', 'A4', 'A4', 'Q3', 'S6', 'Golf 6', 'Golf 5'],
'Power in HP': [150, 190, 190, 240, 80, 190, 190, 150, 400, 140, 116]}
df = pd.DataFrame(data)
# Use seaborn's "FacetGrid" to create a grid of plots
g = sns.FacetGrid(df, col = "Brand", col_wrap=2)
# Map the histogram on the grid
g.map(sns.histplot, "Power in HP", kde=True, bins=10)
plt.xlabel('Power in HP')
plt.ylabel('Frequency')
plt.show()
который будет отображать это:
но вы должны отметить, что, поскольку данные для ford
и kia
являются спарами (только по одному баллу для каждого), ничего не покажет...
набор данных больше, это всего лишь пример набора данных с несколькими строками... Можно ли удалить столбцы и нарисовать все линии на одной (линейной) диаграмме?
да, и на самом деле графики данных будут намного лучше (более связными) в большем наборе данных.
Вы имеете в виду 4 линии на одном графике или 4 отдельные линии (оба варианта определенно возможны). возможно, стоит задать новый вопрос...
Я использовал ваше решение, но без kde. Я думаю, это даже понятнее, чем несколько строк в одном сюжете.
кроме того, это категориальные данные, поэтому линейный график не имеет значения. вы имеете в виду столбчатую диаграмму?