Слияние тензора 3x10 с 1x10, какие методы использовать?

Я сделал некоторую модель, которая в итоге выведет тензор 3 x 10. Причина, по которой это 3 x 10, заключается в том, что размер словаря равен 10, а в последовательности 3 элемента (это проблема классификации последовательности с несколькими метками) . Этот тензор нужно будет как-то софтмаксировать до тензора 1x10. Может ли кто-нибудь объяснить мне доступные методы и, возможно, какой-нибудь пример в Керасе?

Я видел некоторые методы слияния в Keras, такие как усреднение или добавление. Они могут быть полезны в этом случае, но для них, похоже, требуются два или более тензора в качестве входных данных. Поэтому мне, вероятно, нужно разделить тензор 3 x 10 на 3 тензора 1 x 10 каждый и усреднить их. Может быть, есть лучшие способы добиться этого?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
0
53
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Простой способ добиться того, чего вы хотите, — использовать последний слой свертки 1x1.
Слой с ядром свертки 1 × 1 позволяет объединить ваш тензор 3x10 в 1x10 и одновременно изучает вес сплава во время тренировки.

Добавьте этот слой:

   output = Conv2D(1, (1, 1), activation='your_activation')(your_3x10_tensor)

Надеюсь, это решение, которое вы искали!

Есть ли какое-либо преимущество в использовании «динамического» слияния с таким весом по сравнению со «статическим» слиянием, например, простое добавление/усреднение тензора по элементам?

gregory112 27.05.2019 10:33

Динамический полезен, когда каждый из тензоров, которые вы объединяете, может по-разному влиять на результаты, но если все эти тензоры всегда имеют одинаковое влияние, вы можете сделать это статически.

Thibault Bacqueyrisses 27.05.2019 11:04

Другие вопросы по теме