Консультационный питон в csv .20 основных движений по отделам

Мне нужно получить 20 самых больших «MOV12» для «DPTO», используя python и pandas.

У меня есть csv (.del) со следующими полями

"CODCLI" "DPTO" "SEG" "TIPPER"  "MOV12" 

11 20 "SEG1" "NAT" 6480.00  
19 20 "SEG1" "NAT" 0.00 
28 20 "SEG1" "NAT" 900.00 
29 24 "SEG4" "NAT" 1800.00 
31 20 "SEG1" "NAT" 3050.00 
38 20 "SEG1" "NAT" 0.00 
39 20 "SEG1" "NAT" 0.00 

У меня есть csv со следующими полями, учитывая, что «DPTO» всего 12, и у меня есть тысячи данных

на данный момент и удалось получить moyor 'MOV12'

import pandas as pd

df = pd.read_csv("c.del", sep = ' ') 
result=df.loc[df[['MOV12']].idxmax().unique()].groupby('DPTO')
print(result)

Я надеюсь, что вы дадите мне предложения, чтобы найти решение, спасибо

использовать series.nlargest

iamchoosinganame 29.05.2019 19:06
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
1
35
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Используйте groupby и apply с nlargest

import pandas as pd
df = pd.read_csv("c.del", sep = ' ')
result=df.groupby('DPTO').apply(
    lambda x: x.nlargest(20,'MOV12')
)

Это найдет строки, соответствующие 20 самым большим значениям «MOV12» для каждого значения «DPTO».

Сделайте это перед вызовом groupby. Я отредактировал сообщение.

iamchoosinganame 29.05.2019 19:25

еще раз спасибо, просто скиньте мне результаты 4 DPTO а всего их 24 что и будет происходить

Danna Luciana Carrillo Perez 29.05.2019 19:29

Если вы мне выдаете результат, а в консоли они суммировались, я понял

Danna Luciana Carrillo Perez 29.05.2019 19:42
result.to_csv('new_csv_file.csv')
iamchoosinganame 29.05.2019 20:25

Другие вопросы по теме