Вычислить интервалы в столбце

У меня есть два столбца в фрейме данных (a и b). Примечание. Здесь я показываю только серии, но делаю вид, что извлекаю эти серии из фрейма данных с индексом строки, который мне известен (iloc).

Я пытаюсь извлечь некоторые числа из столбца B и вычислить интервалы в новую серию, а затем использовать его для выполнения некоторых операций со столбцом a.

Интервалы следующие:

b[2]-b[1] 
b[3]-b[2] 
b[4]-b[3]

У меня есть код, который работает, но он вроде, ну не уродливый, но немного тяжелый. У меня есть ощущение, что есть функция, которая могла бы это сделать.

По сути, я создаю пустой массив, а затем выполняю итерацию в требуемом диапазоне для вычисления интервала. Есть ли лучший способ продолжить?

a = pd.Series(data=[10, 11, 12, 13, 14, 15], name='a')
b = pd.Series(data=[2,3,5,8,12,17], name='b')

ar = np.array([])

for i in range(1,4): 
    temp = b[i+1] - b[i]
    ar = np.append(ar, temp)

Result = a.iloc[2:5] * ar

Я использовал здесь числа, но моя настоящая цель - сделать это с данными отметок времени. Мне нужна временная разница между строкой [i + 1] и строкой [i], а затем мне нужно выполнить некоторые операции. Вот почему я пытаюсь рассчитать эти интервалы. Я просто пренебрегал отметками времени, чтобы их было легче читать и понимать.

python pandas numpy intervals

16.08.2018 01:05

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

393

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

IIUC, используйте diff() и нарежьте любой диапазон, который хотите

b.diff()[2:5] * a[2:5]

Как @sacul предложил в комментариях, также можно разрезать только один раз и отбросить позже b.diff()[2:5].mul(a).dropna(), даже если это будет означать создание большого количества NaN, что для больших df может быть невыгодным

отлично! +1, и, конечно, более действенный, чем мой ответ (удален). Вы также можете использовать b.diff()[2:5].mul(a).dropna(), не разрезая a. Не то чтобы это обязательно лучше, но немного другой подход

— 16.08.2018 01:37

Вот и все ? Одна строчка кода? И это работает. Я могу использовать рассчитанный ранее индекс. Большое спасибо. Это сделает мою жизнь намного проще.

— 16.08.2018 02:18

16.08.2018 01:17