Вопрос о drop=True в pd.dataframe.reset_index()

В кадре данных Pandas можно сбросить индекс с помощью метода reset_index(). Одним из необязательных аргументов является drop=True, который согласно документации:

drop : bool, default False
    Do not try to insert index into dataframe columns. 
    This resets the index to the default integer index.

У меня вопрос, что означает первое предложение? Будет ли он пытаться преобразовать целочисленный индекс в новый столбец в моем df, если я уйду, если False?

Кроме того, будет ли сохранен мой порядок строк или мне также следует сортировать, чтобы обеспечить правильный порядок?

Это означает, что текущий index будет вставлен в DataFrame как столбец по умолчанию, и да, порядок строк будет сохранен.

— 18.04.2019 15:29

python pandas

18.04.2019 15:21

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

2 314

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Как вы можете видеть ниже, df.reset_index() переместит индекс в фрейм данных в виде столбца. Если индекс был просто общим числовым индексом, вы, вероятно, не заботитесь об этом и можете просто отбросить его. Ниже приведен простой фрейм данных, но я удалил первую строку только для того, чтобы в индексе были разные значения.

df = pd.DataFrame([['a', 10], ['b', 20], ['c', 30], ['d', 40]], columns=['letter','number'])
df = df[df.number > 10]
print(df)
#   letter  number
# 1      b      20
# 2      c      30
# 3      d      40

Поведение по умолчанию теперь показывает столбец с именем index, который был предыдущим индексом. Вы можете видеть, что df['index'] соответствует индексу выше, но индекс был перенумерован, начиная с 0.

print(df.reset_index())
#    index letter  number
# 0      1      b      20
# 1      2      c      30
# 2      3      d      40

drop=True не делает вид, что индекс был важен, а просто дает вам новый индекс.

print(df.reset_index(drop=True))
#   letter  number
# 0      b      20
# 1      c      30
# 2      d      40

Что касается порядка строк, я подозреваю, что он будет поддерживаться, но в целом не следует полагаться на порядок, в котором хранятся вещи. Если вы выполняете агрегатную функцию, вы, вероятно, захотите убедиться, что данные правильно упорядочены для агрегирования.

18.04.2019 15:33

Другие вопросы по теме

Объединение двух разных фреймов данных на отметке времени

Кадр данных pandas получает значения отставания от того же месяца предыдущего года

Создайте несколько столбцов со значениями по умолчанию в Salesforce

Почему глубокая копия Pandas DataFrame не влияет на использование памяти?

Как использовать функцию diff() для определения изменений заработной платы в Pandas для HR-аналитики?

Как выбрать поле из фрейма данных, если выполняется определенное условие?

Панды - заменить значения столбца на основе отдельного индекса массива

Как проверить, присутствуют ли все элементы в списке в столбце pandas

Как исключить значение индекса столбцов и строк в фрейме данных python?

Как исправить concat pandas при добавлении двух файлов csv

Вопрос о drop=True в pd.dataframe.reset_index()

Ответы 1

Другие вопросы по теме

Похожие вопросы