ValueError: Форма должна иметь ранг 2, но ранг 1 для 'MatMul' (op: 'MatMul') с входными формами: [2], [2,3]

Я новость для Tensorflow. Я уже ищу те же вопросы, но не могу понять. есть код. Надеюсь, вы можете мне помочь.

Код:

import tensorflow as tf

w1 = tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
w2 = tf.Variable(tf.random_normal([3,3],stddev=1,seed=1))

x = tf.constant([0.7,0.9])

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

sess = tf.Session()

sess.run(w1.initializer)
sess.run(w2.initializer)

print(sess.run(y))
sess.close()
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
8
0
11 209
3

Ответы 3

Форма константы x - это (2,), то есть одномерный массив, и вы пытаетесь умножить его на двумерный массив w1 формы (2, 3), что невозможно для матричного умножения, так как количество столбцов первого параметра должно быть равно количеству строк во втором параметре. Кроме того, я думаю, что tf.matmul работает только в том случае, если оба массива двумерны.

Один из многих способов изменить декларацию x как

x = tf.constant([[0.7], [0.9]])

Это создаст двумерный постоянный тензор формы (2, 1). И затем умножьте это на,

a = tf.matmul(tf.transpose(x), w1)

tf.transpose() используется для создания транспонирования массива x с формой (2, 1) в форму (1, 2).

Надеюсь это поможет.

Кроме того, я думаю, что tf.matmul работает только в том случае, если оба массива двумерны. - Спасибо, это была моя проблема
nj2237 09.10.2019 19:07

В вашем случае ранг переменной x равен 1. Отсюда проблема.

Ниже приводится причина, по которой у вас возникла эта проблема.

Обратитесь к API тензорного потока https://www.tensorflow.org/api_docs/python/tf/matmul

tf.matmul (а, б, transpose_a = False, transpose_b = False, adjoint_a = False, adjoint_b = False, a_is_sparse = Ложь, b_is_sparse = Ложь, name = Нет)

Аргументы:

a: Тензор типа float16, float32, float64, int32, complex64, complex128 и ранг> 1.

b: Тензор с того же типа и ранга в качестве.

Форма x(2,) не соответствует форме (2,3)w1.

Вы должны изменить

x = tf.constant([0.7,0.9])

к

x = tf.constant([[0.7,0.9]])

теперь форма x - это (1,2) и работает нормально.

Другие вопросы по теме