Я новичок в Video Intelligence API, но в моем проекте я столкнулся с проблемой: взять видеопоток и запустить его через Video Intelligence API, а затем сделать снимок экрана при каждом изменении сцены и прочитать текст из этих снимков экрана через Vision API. Есть ли способ сделать это с помощью какой-нибудь прямой трансляции? Спасибо!
Согласно документации, обработка видео в реальном времени недоступна. Документация охватывает только поддержку видеофайлов .MOV, .MPEG4, .MP4 и .AVI, хранящихся локально или в GCS.
Позвольте мне предоставить некоторую информацию, которая может вам помочь.
Video Intelligence перечисляет набор функций доступен для анализа видео. Одним из них является обнаружение меток для идентификации сущностей, аналогично тому, что делает Vision API, просто имейте в виду, что Video Intelligence не имеет всех функций, которые есть в Vision. С другой стороны, я не думаю, что вы можете делать снимки экрана, чтобы читать текст (для этого нет функции), вместо этого вы можете только обнаруживать изменения кадра. Пример обнаружения метки:
curl -s -H 'Content-Type: application/json' \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
'https://videointelligence.googleapis.com/v1/videos:annotate' \
--data "{ \
'inputUri':'gs://bucket-video/myvideo.mp4', \
'features':['LABEL_DETECTION'] \
}"
Не забудьте установить GOOGLE_APPLICATION_CREDENTIALS = / JSON / CREDENTIALS / PATH
С 2020 года вы можете сделать это, используя бета-функции, представленные в API Google Video Intelligence: https://cloud.google.com/video-intelligence/docs/streaming/live-streaming-overview