Я ищу быстрый способ перебора пикселей и создания трехмерной гистограммы и возврата массива, отсортированного по наиболее часто используемым цветам.
Мой фактический код:
def hist_3dhist(im):
hist = {}
for h in range(im.shape[0]):
for w in range(im.shape[1]):
if im.shape[2] == 4 and im[h, w, 3] == 0: ## if transparent pixel, no need to count it
continue
key = tuple(im[h,w,:3])
if not key in hist:
hist[key] = 0
hist[key] += 1
return sorted(hist, key=hist.get, reverse=True)
Итак, чтобы быстро объяснить: я создаю словарь со всеми разными цветами, а значения - это количество раз, когда цвет появляется.
заранее спасибо
Спасибо за ваш комментарий, но эта функция предназначена для очень конкретных изображений, которые не являются изображениями реального мира, а предназначены для шаблонов, которые не содержат много цветов.
Не используйте словарь, используйте массив. Это будет на порядки быстрее. Вам нужно выбрать выборку для массива, потому что вы не хотите создавать массив 256x256x256. Он слишком большой, слишком медленный и будет иметь слишком много пустых лотков. Хорошими размерами могут быть ячейки 32x32x32 или 64x64x64, но это зависит от приложения. Если вам нужен исчерпывающий список всех используемых цветов, может быть применим ваш метод или вы можете отсортировать пиксели, а затем сохранить уникальные значения. Что быстрее, зависит от того, сколько у вас цветов.
Каков диапазон гистограммы (т.е. минимальное / максимальное значения в im[h,w,:3])? Находятся ли целые числа цветов пикселей в диапазоне [0;255]?






Выбор интервалов гистограммы с наибольшим количеством значений может быть разочаровывающим, потому что цвета на самом деле выглядят как градиенты, а не как идеально постоянные области из-за световых эффектов. По этой причине цвета могут быть распределены по многим ячейкам, и ячейки могут быть плохо заполнены. Доминирующий цвет может быть заменен второстепенным с меньшим разбросом. Чтобы с этим справиться, используйте бункеры большего размера.