Я пытаюсь решить следующие задачи:
1) Создайте гистограмму, показывающую среднее количество говорящих, сгруппированных по степени опасности (используя логарифмическую шкалу для числовой оси).
2) Сгруппируйте данные по степени опасности и рассчитайте и распечатайте описательную статистику количества говорящих для каждой категории степени опасности.
По сути, у меня есть фреймворк, над которым я работаю, а количество выступающих, степень опасности и количество выступающих - это столбцы в моем фреймворке. У меня есть следующий код, чтобы сделать столбец «Степень опасности» категориальным.
df.Categorical(['Degree of endangerment'], categories = ("Vulnerable", "Definitely endangered", "Severely endangered", "Critically endangered", "Extinct")
Во-первых, как создать гистограмму, которая берет средние (avg) данные столбца и ссылается на объект категориального столбца? В моих данных нет типов NAN.
Во-вторых, как мне точно изменить мой фрейм данных, чтобы он был сгруппирован на основе категориальной переменной / столбца?
Маловероятно, что вы получите ответ, если не включите выдержку из фрейма данных (3-5 строк).
Для построения я бы взглянул на пакет seaborn. Он ожидает, что данные будут организованы таким образом. Что касается второго пункта, вероятно, вам понадобится метод
groupby
, хотя я не совсем уверен, что вам нужно.