Как получить метки ограничительной рамки и ее формат в Yolo 3D

Я внедрил 3D-модель Yolo в свое рабочее пространство, и она работает нормально. На выходе я получаю изображение. Поэтому я хотел бы знать, где я могу получить метки для моих 3D-ограничивающих рамок. И мне бы даже хотелось узнать, в каком формате хранятся метки.

x,y,x,y... формат или x,y,z,x,y,z... формат.

(Редактировать) Я реализовал 3D-модель Yolo: https://github.com/ruhyadi/YOLO3D

Я загрузил предварительно обученные веса и выполнил вывод, используя:

python inference.py \
    --weights yolov5s.pt \
    --source eval/image_2 \
    --reg_weights weights/resnet18.pkl \
    --model_select resnet18 \
    --output_path runs/ \
    --show_result --save_result

Теперь в папке run я просто получаю изображение PNG в качестве вывода. Мой результат:

Теперь я хотел бы даже получить точки для ограничивающих трехмерных рамок на этом изображении, и я даже хотел бы знать, в каком формате хранятся эти точки, в формате x,y,x,y.. или в x, y,z,x,y,z.. формат?

попытайте счастья с этим скриптом преобразования github.com/ruhyadi/yolo3d-lightning/blob/main/scripts/… также есть несколько реализаций yolo3d, мы не сможем помочь, если вы не сообщите нам, какую из них вы используете

Bindestrich 21.07.2024 23:46

@Bindestrich, спасибо за ответ. Я отредактировал свой вопрос, чтобы сделать его более понятным. Большое спасибо!!.

Plutus 22.07.2024 01:19
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
2
52
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Привет всем, вот я и нашел решение своего вопроса. В папке библиотеки находится сценарий Math.py. В Math.py есть функция create_corners, мы можем использовать эту функцию в нашем скрипте inference.py, чтобы получать метки трехмерных ограничивающих рамок. А формат наших трехмерных ограничивающих рамок — x,y,z,x,y,z..., он упоминается только в скрипте Math.py.

Можете ли вы привести более ясный пример? Значения нормализованы, Майк с yolov5? Это x-min, y_min, z_min, а затем максимальные значения? Также, пожалуйста, примите свой ответ, чтобы люди знали, что проблема решена.

Bindestrich 23.07.2024 07:56

Другие вопросы по теме