Использование более быстрого R-CNN с Resnet-101. Я обнаруживаю небольшой объект на довольно больших изображениях. Для каждого изображения будет обнаружено несколько моих объектов с высокой точностью (98-99%). Однако случайным образом другие почти идентичные объекты на изображении полностью отсутствуют.
Чтобы дополнительно проиллюстрировать проблему - если я переверну или поверну изображение, тогда будет классифицироваться другая группа объектов (с такой же высокой точностью), а объекты, классифицированные в предыдущей конфигурации, могут быть пропущены.
Это похоже на то, что только определенные области изображения проверяются на предмет наличия объекта - если объект находится в этой области, он будет легко обнаружен, если нет, то будет полностью пропущен.
Изменение first_stage_features_stride с 16 на 8 ОЧЕНЬ помогло (в четыре раза увеличило количество обнаруженных объектов в целом). В противном случае я использую по сути нестандартную конфигурацию. Любые идеи?

Возможно, вам потребуется изменить масштаб и соотношение сторон генератора привязки, вы также можете протестировать генератор привязки, чтобы убедиться, что он покрывает все изображение. См. Следующую ссылку: обнаружение объекта tensorflow
Спасибо. Моя текущая шкала - [0,25, 0,5, 1,0, 2,0]. Что бы вы посоветовали в качестве некоторых ценностей, чтобы начать пробовать? Стоит ли делать их все меньше - например, [0,05, 0,1, 0,25, 0,5]; или только первые два - например, [0,1, 0,25, 1,0, 2,0]?
Вы достигли своей цели. Если да, не могли бы вы поделиться своим проектом на github?