Я реализую декодер FCN-8 (задание для передовых методов глубокого обучения deeplearning.ai с Tensorflow, курс Computer Vision, неделя 3, семантическая сегментация)
Я реализовал приведенный ниже код, я подозреваю некоторые проблемы с размерностью: при выполнении теста он попадает в строку:
o = tf.keras.layers.Add()([o, o2])
с ошибкой ValueError: Operands could not be broadcast together with shapes (8, 12, 11) (4, 6, 11)
, так что я думаю, что пытаюсь объединить объекты с разными формами.
Я также копирую ниже труп теста, FCN8()
метод безопасен имхо.
У вас есть подсказка?
def fcn8_decoder(convs, n_classes):
# features from the encoder stage
f3, f4, f5 = convs
# number of filters
n = 512
# add convolutional layers on top of the CNN extractor.
o = tf.keras.layers.Conv2D(n , (7 , 7) , activation='relu' , padding='same', name = "conv6", data_format=IMAGE_ORDERING)(f5)
o = tf.keras.layers.Dropout(0.5)(o)
o = tf.keras.layers.Conv2D(n , (1 , 1) , activation='relu' , padding='same', name = "conv7", data_format=IMAGE_ORDERING)(o)
o = tf.keras.layers.Dropout(0.5)(o)
o = tf.keras.layers.Conv2D(n_classes, (1, 1), activation='relu' , padding='same', data_format=IMAGE_ORDERING)(o)
# Upsample `o` above and crop any extra pixels introduced
o = tf.keras.layers.Conv2DTranspose(n_classes , kernel_size=(4,4) , strides=(2,2) , use_bias=False )(f5)
o = tf.keras.layers.Cropping2D(cropping=(1,1))(o)
# load the pool 4 prediction and do a 1x1 convolution to reshape it to the same shape of `o` above
o2 = f4
o2 = tf.keras.layers.Conv2D(n_classes , ( 1 , 1 ) , activation='relu' , padding='same')(o2)
# add the results of the upsampling and pool 4 prediction
o = tf.keras.layers.Add()([o, o2])
# upsample the resulting tensor of the operation you just did
o = tf.keras.layers.Conv2DTranspose( n_classes , kernel_size=(4,4) , strides=(2,2) , use_bias=False)(o)
o = tf.keras.layers.Cropping2D(cropping=(1, 1))(o)
# load the pool 3 prediction and do a 1x1 convolution to reshape it to the same shape of `o` above
o2 = tf.keras.layers.Conv2D(n_classes , ( 1 , 1 ) , activation='relu' , padding='same')(o2)
# add the results of the upsampling and pool 3 prediction
o = tf.keras.layers.Add()([o, o2])
# upsample up to the size of the original image
o = tf.keras.layers.Conv2DTranspose(n_classes , kernel_size=(8,8) , strides=(8,8) , use_bias=False )(o)
o = tf.keras.layers.Cropping2D(((0, 0), (0, 96-84)))(o)
# append a sigmoid activation
o = (tf.keras.layers.Activation('sigmoid'))(o)
return o
ПРОВЕРОЧНЫЙ КОД
# TEST CODE
test_convs, test_img_input = FCN8()
test_fcn8_decoder = fcn8_decoder(test_convs, 11)
print(test_fcn8_decoder.shape)
del test_convs, test_img_input, test_fcn8_decoder
вы должны сначала загрузить прогноз пула 3, а затем применить 1 * 1 конв.
def fcn8_decoder (convs, n_classes):
f3, f4, f5 = усл.
п = 512
o = tf.keras.layers.Conv2D(n, (7, 7), активация = 'relu', заполнение = 'то же', имя = "conv6", data_format = IMAGE_ORDERING) (f5) о = tf.keras.layers.Dropout (0,5) (о) o = tf.keras.layers.Conv2D(n, (1, 1) , активация = 'relu', заполнение = 'то же', name = "conv7", data_format = IMAGE_ORDERING) (o) о = tf.keras.layers.Dropout (0,5) (о) о = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же', data_format = IMAGE_ORDERING) (o)
o
выше и обрежьте все лишние пиксели.o = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(4,4), strides=(2,2), use_bias=False)(f5) о = tf.keras.layers.Cropping2D (обрезка = (1,1)) (о)
o
вышео2 = f4 o2 = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же') (o2)
о = tf.keras.layers.Add()([o, o2])
о = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(4,4), strides=(2,2), use_bias=False)(o) о = tf.keras.layers.Cropping2D (обрезка = (1, 1)) (о)
o
вышео2=f3 o2 = tf.keras.layers.Conv2D (n_classes, (1, 1), активация = 'relu', заполнение = 'то же') (o2)
о = tf.keras.layers.Add()([o, o2])
о = tf.keras.layers.Conv2DTranspose(n_classes, kernel_size=(8,8), strides=(8,8), use_bias=False)(o) о = tf.keras.layers.Cropping2D(((0, 0), (0, 96-84)))(о)
о = (tf.keras.layers.Activation('сигмоид'))(o)
вернуться о
Каковы формы вашего
test_convs
? Также вы дважды манипулируетеf5
и сохраняете в том жеo
, возможно, вы пропустили какой-то поток.