OpenCV: подсчет ограничивающей рамки в видео

У меня есть несколько видео, которые можно считать достоверными для обнаружения людей: это пример.

У меня также есть основное видео (без каких-либо обнаружений), и я должен запустить на нем свой алгоритм обнаружения людей и сравнить свои результаты с реальным видео.

Проблема в том, что я хотел бы иметь не только сравнение качественный, но и количественный. Итак, насколько я могу посчитать количество обнаружений в своем личном алгоритме, я должен найти надежный способ подсчитайте количество ограничительных рамок, которые появляются в реальном видео для каждого кадра.

Я принял во внимание эта ссылка и этот либо, но они предназначены для поиска контуров фигуры, а не ограничивающей рамки. Я знаю, что определение количества обнаружений может показаться бессмысленным, но это единственный способ получить численное обоснование.

Вы уверены, что к видео не прикреплены данные с номером кадра и списком ограничивающих рамок (я ожидаю, что что-то подобное должно существовать)? Вы смотрели на bitbucket.org/amilan/motchallenge-devkit ?

— 15.03.2019 12:22

Проверочные видеоролики из наборов данных имеют свои наземные истины. Пожалуйста, найдите один такой файл. Обычно это .xml или .csv.

— 15.03.2019 14:46

@wdudzik да, вы правы: файлы наземной истины прилагаются здесь, и я также нашел как их использовать. Прошу прощения за вопрос, потому что я мог бы поискать раньше, но я несколько дней гуглил хорошие наборы данных, а потом нашел это, это выглядело идеально для моего кода, но я слепо заблудился в этой проблеме с правдой. В качестве оправдания я предоставлю свой репозиторий GitHub, содержащий обнаружение, как только у меня будет что-то конкретное.

— 16.03.2019 19:17

python c++ opencv detection bounding-box

15.03.2019 12:17

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

892

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Используйте набор данных о пешеходах, у которого есть исходное видео и наземная правда. Исходное видео будет видеофайлом (например, .avi), а основная правда — электронной таблицей (например, .csv). Координаты x,y, а также ширина и высота ограничивающих прямоугольников вокруг пешеходов сохраняются в электронной таблице.

Чтобы визуально проверить свои результаты, нарисуйте наземную правду и ваши результаты на одном и том же видео. my data vs ground truth

Используйте алгоритм для количественной проверки результатов. Функция точности, которую я использовал, была:

overlap / ((ground_truth_area + my_results_area)/2)

Перекрытие показано серым цветом на gif. Как я вычислил перекрытие.

gif showing how overlay is calculated

Я гуглил наборы данных пару дней; приведенный вами пример не соответствует моим потребностям (т.е. я не ищу ни одного пешехода на пешеходном переходе). Тем не менее, я проголосовал за ваш ответ, поскольку вы указали способ вычисления точности, что мне еще предстояло выяснить.

— 16.03.2019 18:08

Спасибо. Изначально я хотел создать набор данных с несколькими людьми, но мне не удалось убедить своих друзей принять участие. Надеюсь, вы найдете то, что ищете. Если нет, создать набор данных о пешеходах довольно просто. Я использовал несколько написанных мной сценариев отслеживания OpenCV, чтобы создать достоверные данные для набора данных, на который я ссылался в своем ответе.

— 16.03.2019 23:13

Не могли бы вы объяснить (или дать ссылку), как вы пришли к этой формуле? В частности, как вы вычислили overlap?

— 20.03.2019 15:18

@Lorenzo Я изменил .gif, чтобы было легче увидеть, что такое перекрытие. Я также отредактировал вопрос и связался с другим S.O. ответ, который поможет вам вычислить перекрытие двух прямоугольников.

— 20.03.2019 17:30

15.03.2019 19:33