Декодер FCN-8 в TensorFlow (полностью сверточная сеть)

Я реализую декодер FCN-8 (задание для передовых методов глубокого обучения deeplearning.ai с Tensorflow, курс Computer Vision, неделя 3, семантическая сегментация)

Я реализовал приведенный ниже код, я подозреваю некоторые проблемы с размерностью: при выполнении теста он попадает в строку:

o = tf.keras.layers.Add()([o, o2])

с ошибкой ValueError: Operands could not be broadcast together with shapes (8, 12, 11) (4, 6, 11), так что я думаю, что пытаюсь объединить объекты с разными формами.

Я также копирую ниже труп теста, FCN8() метод безопасен имхо.

У вас есть подсказка?

def fcn8_decoder(convs, n_classes):
  # features from the encoder stage
  f3, f4, f5 = convs

  # number of filters
  n = 512

  # add convolutional layers on top of the CNN extractor.
  o = tf.keras.layers.Conv2D(n , (7 , 7) , activation='relu' , padding='same', name = "conv6", data_format=IMAGE_ORDERING)(f5)
  o = tf.keras.layers.Dropout(0.5)(o)
  o = tf.keras.layers.Conv2D(n , (1 , 1) , activation='relu' , padding='same', name = "conv7", data_format=IMAGE_ORDERING)(o)
  o = tf.keras.layers.Dropout(0.5)(o)
  o = tf.keras.layers.Conv2D(n_classes,  (1, 1), activation='relu' , padding='same', data_format=IMAGE_ORDERING)(o)

  # Upsample `o` above and crop any extra pixels introduced
  o = tf.keras.layers.Conv2DTranspose(n_classes , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False )(f5)
  o = tf.keras.layers.Cropping2D(cropping=(1,1))(o)

  # load the pool 4 prediction and do a 1x1 convolution to reshape it to the same shape of `o` above
  o2 = f4
  o2 = tf.keras.layers.Conv2D(n_classes , ( 1 , 1 ) , activation='relu' , padding='same')(o2)

  # add the results of the upsampling and pool 4 prediction
  o = tf.keras.layers.Add()([o, o2])

  # upsample the resulting tensor of the operation you just did
  o = tf.keras.layers.Conv2DTranspose( n_classes , kernel_size=(4,4) ,  strides=(2,2) , use_bias=False)(o)
  o = tf.keras.layers.Cropping2D(cropping=(1, 1))(o)

  # load the pool 3 prediction and do a 1x1 convolution to reshape it to the same shape of `o` above
  o2 = tf.keras.layers.Conv2D(n_classes , ( 1 , 1 ) , activation='relu' , padding='same')(o2)

  # add the results of the upsampling and pool 3 prediction
  o = tf.keras.layers.Add()([o, o2])

  # upsample up to the size of the original image
  o = tf.keras.layers.Conv2DTranspose(n_classes , kernel_size=(8,8) ,  strides=(8,8) , use_bias=False )(o)
  o = tf.keras.layers.Cropping2D(((0, 0), (0, 96-84)))(o)

  # append a sigmoid activation
  o = (tf.keras.layers.Activation('sigmoid'))(o)


  return o

ПРОВЕРОЧНЫЙ КОД

# TEST CODE

test_convs, test_img_input = FCN8()
test_fcn8_decoder = fcn8_decoder(test_convs, 11)

print(test_fcn8_decoder.shape)

del test_convs, test_img_input, test_fcn8_decoder

Каковы формы вашего test_convs? Также вы дважды манипулируете f5 и сохраняете в том же o, возможно, вы пропустили какой-то поток.

Alex K. 25.12.2020 17:52
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
1
588
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

вы должны сначала загрузить прогноз пула 3, а затем применить 1 * 1 конв.

def fcn8_decoder (convs, n_classes):

функции со стадии кодировщика

f3, f4, f5 = усл.

количество фильтров

п = 512

добавьте сверточные слои поверх экстрактора CNN.

o = tf.keras.layers.Conv2D(n, (7, 7), активация = 'relu', заполнение = 'то же', имя = "conv6", data_format = IMAGE_ORDERING) (f5) о = tf.keras.layers.Dropout (0,5) (о) o = tf.keras.layers.Conv2D(n, (1, 1) , активация = 'relu', заполнение = 'то же', name = "conv7", data_format = IMAGE_ORDERING) (o) о = tf.keras.layers.Dropout (0,5) (о) о = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же', data_format = IMAGE_ORDERING) (o)

Повысьте разрешение o выше и обрежьте все лишние пиксели.

o = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(4,4), strides=(2,2), use_bias=False)(f5) о = tf.keras.layers.Cropping2D (обрезка = (1,1)) (о)

загрузите прогноз пула 4 и выполните свертку 1x1, чтобы изменить его форму до той же формы, что и o выше

о2 = f4 o2 = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же') (o2)

добавить результаты апсемплинга и предсказания пула 4

о = tf.keras.layers.Add()([o, o2])

повысить дискретизацию полученного тензора операции, которую вы только что сделали

о = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(4,4), strides=(2,2), use_bias=False)(o) о = tf.keras.layers.Cropping2D (обрезка = (1, 1)) (о)

загрузите прогноз пула 3 и выполните свертку 1x1, чтобы изменить его форму до той же формы, что и o выше

о2=f3 o2 = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же') (o2)

добавить результаты повышения частоты дискретизации и предсказания пула 3

о = tf.keras.layers.Add()([o, o2])

повышать разрешение до размера исходного изображения

о = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(8,8), strides=(8,8), use_bias=False)(o) о = tf.keras.layers.Cropping2D(((0, 0), (0, 96-84)))(о)

добавить сигмовидную активацию

о = (tf.keras.layers.Activation('сигмоид'))(o)

вернуться о

Другие вопросы по теме