У меня есть несколько видео, которые можно считать достоверными для обнаружения людей: это пример.
У меня также есть основное видео (без каких-либо обнаружений), и я должен запустить на нем свой алгоритм обнаружения людей и сравнить свои результаты с реальным видео.
Проблема в том, что я хотел бы иметь не только сравнение качественный, но и количественный. Итак, насколько я могу посчитать количество обнаружений в своем личном алгоритме, я должен найти надежный способ подсчитайте количество ограничительных рамок, которые появляются в реальном видео для каждого кадра.
Я принял во внимание эта ссылка и этот либо, но они предназначены для поиска контуров фигуры, а не ограничивающей рамки. Я знаю, что определение количества обнаружений может показаться бессмысленным, но это единственный способ получить численное обоснование.
Проверочные видеоролики из наборов данных имеют свои наземные истины. Пожалуйста, найдите один такой файл. Обычно это .xml или .csv.
@wdudzik да, вы правы: файлы наземной истины прилагаются здесь, и я также нашел как их использовать. Прошу прощения за вопрос, потому что я мог бы поискать раньше, но я несколько дней гуглил хорошие наборы данных, а потом нашел это, это выглядело идеально для моего кода, но я слепо заблудился в этой проблеме с правдой. В качестве оправдания я предоставлю свой репозиторий GitHub, содержащий обнаружение, как только у меня будет что-то конкретное.






Используйте набор данных о пешеходах, у которого есть исходное видео и наземная правда. Исходное видео будет видеофайлом (например, .avi), а основная правда — электронной таблицей (например, .csv). Координаты x,y, а также ширина и высота ограничивающих прямоугольников вокруг пешеходов сохраняются в электронной таблице.
Чтобы визуально проверить свои результаты, нарисуйте наземную правду и ваши результаты на одном и том же видео.

Используйте алгоритм для количественной проверки результатов. Функция точности, которую я использовал, была:
overlap / ((ground_truth_area + my_results_area)/2)
Перекрытие показано серым цветом на gif. Как я вычислил перекрытие.
Я гуглил наборы данных пару дней; приведенный вами пример не соответствует моим потребностям (т.е. я не ищу ни одного пешехода на пешеходном переходе). Тем не менее, я проголосовал за ваш ответ, поскольку вы указали способ вычисления точности, что мне еще предстояло выяснить.
Спасибо. Изначально я хотел создать набор данных с несколькими людьми, но мне не удалось убедить своих друзей принять участие. Надеюсь, вы найдете то, что ищете. Если нет, создать набор данных о пешеходах довольно просто. Я использовал несколько написанных мной сценариев отслеживания OpenCV, чтобы создать достоверные данные для набора данных, на который я ссылался в своем ответе.
Не могли бы вы объяснить (или дать ссылку), как вы пришли к этой формуле? В частности, как вы вычислили overlap?
@Lorenzo Я изменил .gif, чтобы было легче увидеть, что такое перекрытие. Я также отредактировал вопрос и связался с другим S.O. ответ, который поможет вам вычислить перекрытие двух прямоугольников.
Вы уверены, что к видео не прикреплены данные с номером кадра и списком ограничивающих рамок (я ожидаю, что что-то подобное должно существовать)? Вы смотрели на bitbucket.org/amilan/motchallenge-devkit ?