Как использовать оценку OpenCVAffinePartial2D

Мне нужно выровнять два (на самом деле сотни) изображений, и я не знаю, как это сделать в Python с OpenCV (о котором я никогда раньше не слышал). Похоже, мне следует сначала оценить, какое преобразование применить следующим образом, а затем применить его к одному из изображений (промыть и повторить сотни раз). Однако даже самый простой

import cv2

img1 = cv2.imread("img1.jpg", cv2.IMREAD_COLOR)
img2 = cv2.imread("img2.jpg", cv2.IMREAD_COLOR)

cv2.estimateAffinePartial2D(img1, img2)

терпит неудачу с

cv2.error: OpenCV(4.9.0) /io/opencv/modules/calib3d/src/ptsetreg.cpp:1108: error: (-215:Assertion failed) count >= 0 && to.checkVector(2) == count in function 'estimateAffinePartial2D'

Переполнение стека, и на форуме OpenCV есть несколько вопросов по этой проблеме, но нет решения, кроме упомянутого в OpenCV AssessmentAffine3D завершается с ошибкой с загадочным сообщением об ошибке (которое еще более загадочно, чем само сообщение об ошибке).

Как сделать эту оценку в Python?

Обновлено:

$ python
Python 3.8.18 (default, Aug 25 2023, 13:20:30) 
[GCC 11.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import cv2
>>> cv2.__version__
'4.9.0'

Функция требует соответствия точек в качестве входных данных.

Micka 14.04.2024 09:26

работа с документацией. точка входа: docs.opencv.org/4.x — не «раскручивайте» это. узнайте о компьютерном зрении в целом, найдите примеры в официальной документации и репозитории GitHub.

Christoph Rackwitz 14.04.2024 14:28

Смотрите мой последний ответ на сайте stackoverflow.com/questions/59654471/…

fmw42 14.04.2024 19:34
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
3
420
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Исправить это в OpenCV — это больше работы, чем мне хотелось. Вероятно, после таких усилий это всегда могло работать хорошо, но это крутой поворот, и для моей цели мне нужно было что-то быстрое и грязное.

Более простое решение (которое может сработать, а может и не сработать в зависимости от изображений, которые нужно выровнять, у меня это сработало примерно в 60% случаев, что было достаточно хорошо) — использовать https://diplib.org/PyDIP.html или https://github.com/keflavic/image_registration следующим образом:

from image_registration import chi2_shift
from image_registration.fft_tools import shift
xoff, yoff, exoff, eyoff = chi2_shift(img1, img2)
moved_img = shift.shiftnd(img2, (-yoff, -xoff))

или

import diplib as dip
matrix = dip.FourierMellinMatch2D(img1, img2, out=out, correlationMethod = "don't normalize")
moved_img = dip.Image()
dip.AffineTransform(img2, out=moved_img, matrix=matrix)

Небольшая неприятность для обоих заключается в том, что изображения должны быть монохромными и похожими на nparray.

Другие вопросы по теме