Распространение сходства для кластеризации изображений

Ссылка здесь описывает метод классификации изображений с использованием распространения сходства. Я не понимаю, как они получили векторы признаков, то есть структуру данных изображений, например, массивы?

Кроме того, как мне это сделать, учитывая, что я не могу использовать Places365 в качестве пользовательских данных (аудиоспектрограммы)?

Наконец, как бы я построил изображения, как они сделали на диаграмме?

Оптимизация производительности модели: Руководство по настройке гиперпараметров в Python с Keras
Оптимизация производительности модели: Руководство по настройке гиперпараметров в Python с Keras
Настройка гиперпараметров - это процесс выбора наилучшего набора гиперпараметров для модели машинного обучения с целью оптимизации ее...
Развертывание модели машинного обучения с помощью Flask - Angular в Kubernetes
Развертывание модели машинного обучения с помощью Flask - Angular в Kubernetes
Kubernetes - это портативная, расширяемая платформа с открытым исходным кодом для управления контейнерными рабочими нагрузками и сервисами, которая...
Udacity Nanodegree Capstone Project: Классификатор пород собак
Udacity Nanodegree Capstone Project: Классификатор пород собак
Вы можете ознакомиться со скриптами проекта и данными на github .
Определение пород собак с помощью конволюционных нейронных сетей (CNN)
Определение пород собак с помощью конволюционных нейронных сетей (CNN)
В рамках финального проекта Udacity Data Scietist Nanodegree я разработал алгоритм с использованием конволюционных нейронных сетей (CNN) для...
Почему Python - идеальный выбор для проекта AI и ML
Почему Python - идеальный выбор для проекта AI и ML
Блог, которым поделился Harikrishna Kundariya в нашем сообществе Developer Nation Community.
0
0
196
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Изображения передаются через нейронную сеть. Активация слоя нейронной сети для изображения является вектором признаков. См. https://keras.io/applications/ для примеров.

Спектрограммы можно рассматривать как изображения.

Иногда, даже когда домен сильно отличается, функции нейронной сети могут извлекать полезную информацию, которая может помочь вам в задачах кластеризации/классификации.

Как они рисовали изображения и какую нейросеть выбрать? Я действительно новичок в неконтролируемом обучении.

user2793618 29.05.2019 20:31

Это диаграмма рассеяния с изображениями в качестве аннотаций. stackoverflow.com/questions/48180327/…

dgumo 29.05.2019 20:43

Вы можете использовать любую известную нейронную сеть. VGG16 или Inception, прошедшие обучение на Imagenet, могут подойти для вашего варианта использования.

dgumo 29.05.2019 20:44

есть ли причина, по которой они использовали 365-мерный вектор?

user2793618 29.05.2019 22:26

Потому что они используют последний слой сети, обученный набору данных Places 365. Последний слой имеет 365 выходных данных, ведущих к 365-мерному вектору.

dgumo 30.05.2019 00:19

Ах хорошо. Это действительно говорит само за себя. Итак, просто чтобы уточнить, вектор признаков создается с помощью нейронной сети для прогнозирования, то есть функции прогнозирования vgg16?

user2793618 30.05.2019 00:26

Есть ли способ получить соответствующее изображение в соответствующую точку или кластер для аннотаций изображения? До сих пор я только что обнаружил, что они просто использовали помеченное изображение в качестве представления точки, а не изображение, принадлежащее точке.

user2793618 30.05.2019 22:57

Другие вопросы по теме