Как работает torch.Tensor.backward()?

Недавно я изучаю Pytorch и обратную функцию пакета. Я понял, как его использовать, но когда я пытаюсь

x = Variable(2*torch.ones(2, 2), requires_grad=True)
x.backward(x)
print(x.grad)

Я жду

tensor([[1., 1.],
        [1., 1.]])

потому что это функция тождества. Однако он возвращается

tensor([[2., 2.],
        [2., 2.]]).

Почему это происходит?

pytorch gradient torch

28.06.2019 02:04

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

3 676

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Собственно, это то, что вы ищете:

Случай 1: когда z = 2*x**3 + x

import torch
from torch.autograd import Variable
x = Variable(2*torch.ones(2, 2), requires_grad=True)
z = x*x*x*2+x
z.backward(torch.ones_like(z))
print(x.grad)

выход:

tensor([[25., 25.],
        [25., 25.]])

Случай 2: когда z = x*x

x = Variable(2*torch.ones(2, 2), requires_grad=True)
z = x*x
z.backward(torch.ones_like(z))
print(x.grad)

выход:

tensor([[4., 4.],
        [4., 4.]])

Случай 3: когда z = x (ваш случай)

x = Variable(2*torch.ones(2, 2), requires_grad=True)
z = x
z.backward(torch.ones_like(z))
print(x.grad)

выход:

tensor([[1., 1.],
        [1., 1.]])

Чтобы узнать больше о том, как рассчитать градиент в pytorch, проверьте это.

Итак, я предполагаю, что форма тензора внутри reverse() определяет форму выходных данных. Какова роль размера? Просто умножение?

— 28.06.2019 15:32

Это эквивалентно dy_dx = grad(outputs=y, inputs=x, grad_outputs=torch.ones_like(y))

— 28.06.2019 15:33

То, что вы передаете выше, - это x, который является тензором ([[2., 2.], [2., 2.]])

— 28.06.2019 15:35

28.06.2019 14:28

Я думаю, вы неправильно понимаете, как использовать tensor.backward(). Параметр внутри backward() не является x dy/dx.

Например, если y получено из x какой-либо операцией, то y.backward(w), сначала pytorch получит l = dot(y,w), а затем рассчитает dl/dx. Итак, для вашего кода l = 2x сначала вычисляется pytorch, а затем dl/dx — это то, что возвращает ваш код.

Когда вы делаете y.backward(w), просто сделайте параметр backward() полным 1, если y не является скаляром; в противном случае просто нет параметра.

Что такое dot? torch.dot поддерживает только 1d tesnor

— 20.10.2021 17:07

01.12.2020 07:47