Я реализую капсульную сеть с помощью EM-Routing на основе статьи Сары Сабур и Хинтон. Она отлично работает с набором данных MNIST и некоторыми другими наборами данных в градациях серого, такими же, как MNIST, такими как Hoda (персидские/арабские цифры), но когда я попробовал CIFAR10, точность была невероятно низкий.
Да, это текущая проблема с Capsule Networks. Он хорошо работает с MNIST из-за простоты набора данных. Все, что вам нужно, это обнаружить несколько ребер и пятен, чтобы классифицировать все данные. Для более сложных наборов данных наивное сложение капсул в надежде на хорошую работу не работает. Однако в настоящее время ведутся работы по настройке текущей архитектуры CapsNet, чтобы она работала лучше, чем сейчас. Когда CNN был разработан в те дни, у него также была та же проблема. CNN потребовалось много лет, чтобы стать тем, чем он является сейчас.
Обратитесь к этой статье, если вы хотите узнать производительность CapsNet на разных наборах данных: https://arxiv.org/abs/1712.03480
Ранее я упоминал, что ведутся работы по улучшению CapsNet. Тем не менее, уже есть некоторые работы, которые были сделаны до сих пор. Вы можете обратиться к ним:
http://proceedings.mlr.press/v97/jeong19b/jeong19b.pdf
Имейте в виду, что время, необходимое для обучения CapsNet, намного больше, чем CNN. Поэтому протестировать эти архитектуры непросто.