Я ищу функцию в пакете SDK для речи и некоторые примеры, которые позволили бы мне перевести из речи Azure прямой поток, исходящий из другого источника, кроме микрофона. До сих пор я нашел два решения, которые не совсем соответствуют моим потребностям.
Этот переводит прямую трансляцию, но, кажется, использует микрофон по умолчанию.
Я также нашел это решение, используя speech_recognition_with_push_stream().
, ведьма близка, но, похоже, не переводит только речь в текст:
Azure Speech SDK Преобразование речи в текст из потока с помощью python
Спасибо за вашу помощь!
Пример функции:translation_continuous()
в этом официальном документе строка 113 может быть полезна для выполнения непрерывной работы по переводу.recognizer
откроет сеанс для обработки потоков из источников.
@ Максим, если мой ответ полезен, не могли бы вы нажать на галочку рядом с ответом, чтобы переключить его с серого на заполнение, чтобы принять его, чтобы это помогло другим и закрыть этот запрос :) Если у вас есть другие вопросы, просто задайте другой вопрос и дайте мне ссылку, я помогу вам как можно скорее
Спасибо @Stanley, как вы и предложили, я открыл новую тему со своим вопросом, любое предложение будет очень признательно! stackoverflow.com/questions/65586642/…
Это довольно мило, спасибо! единственная проблема заключается в том, что в примере translation_continuous() используется файл. Но кажется возможным заменить имя файла потоком. Вот так:
stream = speechsdk.audio.PushAudioInputStream()
audio_config = speechsdk.audio.AudioConfig(stream=stream)
У меня нет ни одной ошибки, но я пишу поток и не получаю ответа. Но это может быть другая проблема