Когда и почему kernel_size может быть 1 или 2 размера при использовании Conv2D?

При использовании Conv2D мы можем определить kernel_size как 1 диммер или 2 димса (или большее значение димса)

например:

Conv2D(filters=32, kernel_size=3, activation='relu')

или

Conv2D(filters=32, kernel_size=(3,3), activation='relu')
  1. Какие рекомендации при использовании Conv2D?
  2. Какие случаи мы выберем для использования 1D (kernel_size=7) и какие случаи мы предпочтем выбрать 2D (kernel_size=(3,3)) или другие диммеры?
  3. Влияет ли выбор размера kernel_size на выбор размера пула? (MaxPooling2D(pool_size=?))
Udacity Nanodegree Capstone Project: Классификатор пород собак
Udacity Nanodegree Capstone Project: Классификатор пород собак
Вы можете ознакомиться со скриптами проекта и данными на github .
1
0
1 115
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий
  1. (и 2)):

kernel_size: целое число или кортеж/список из 2 целых чисел, указывающий высота и ширина окна 2D свертки. Может быть одним целым числом чтобы указать одно и то же значение для всех пространственных измерений.

Керас док . Conv2D выполняет свертку с 2D-фильтром, он может быть квадратным (используйте одиночное целое число для определения) или неквадратным (используйте кортеж). Относительно размера фильтра (3, 7 и т.д.) выбор зависит от задачи и архитектуры. См. ответ для базовой интуиции, стоящей за конкретным примером.

  1. Kernel_size, а также шаг и отступы влияют на форму вывода Conv2D, и вы должны принять это во внимание, если хотите MaxPooling2D вывода определенной формы.

Размер ядра для Conv2D всегда двумерный.

здесь

kernel_size: целое число или кортеж/список из 2 целых чисел, указывающий высота и ширина окна 2D свертки. Может быть одним целым числом чтобы указать одно и то же значение для всех пространственных измерений.

У вас просто есть возможность написать размер ядра 3, но на самом деле это означает (3,3). Для Conv1D размер ядра также равен 1d.

Если вы используете Conv2D, вы должны выбрать MaxPooling2D, если вы используете Conv1D, вы должны выбрать MaxPooling1D.

Другие вопросы по теме