Интересно, как оптимизируются потери MAE с помощью оптимизатора SGD? Я имею в виду, как вычисляется производная суммы абсолютных значений. Используется ли какое-либо численное решение или что-то еще?
Добро пожаловать в СО. Прочтите stackoverflow.com/help/минимально-воспроизводимый-пример и задайте свой вопрос
Я обнаружил, что в sklearn.linear_model.SGDRegressor потеря MAE является частным случаем потери 'эпсилон_нечувствительный' с эпсилон, равным 0. И в соответствии с исходный код этой потери мы просто применяем функцию знак (х) к разнице истинного и предсказанного значений, чтобы вычислить производную.
Прочтите описание тега ML.