Преобразование голоса в текст C#

Я пытаюсь преобразовать голос в текст с помощью API Google, есть тестовая страница https://cloud.google.com/speech-to-text/, где вы можете убедиться, что ваш звук преобразован в текст, я представляю свой звук и для этой страницы ЕСЛИ ОН СТАНОВИТСЯ ТЕКСТОМ, но я потребляю service из моей программы, и мне это не удается, отображается следующая ошибка: "Поврежденный файл отправляет аудио снова: Статус (StatusCode = InvalidArgument, Detail = \" Недопустимое распознавание \ 'config \': плохая частота дискретизации, герц. \ ")»

Мой код выглядит следующим образом:

        string pathAudio = CreateAudio(Base64Audio);
        var speech = SpeechClient.Create();

        var response = speech.Recognize(new RecognitionConfig()
        {                
            Encoding = RecognitionConfig.Types.AudioEncoding.Linear16,
            LanguageCode = "es-MX",
        }, RecognitionAudio.FromFile(pathAudio));

        foreach (var result in response.Results)
        {
            foreach (var alternative in result.Alternatives)
            {
                resultado = alternative.Transcript;
            }
        }
        return resultado;

У них есть некоторое представление о том, что это может происходить.

"Плохая частота дискретизации герц" вполне указывает на проблему. Возникла проблема с частотой дискретизации вашего микрофона. Проверьте конфигурацию вашего оборудования. См. это

— 19.07.2018 23:10

Ситуация заключается в том, что тот же звук, который я конвертирую в текст через страницу Google, и там, если он преобразован, но моя программа не

— 19.07.2018 23:12

c# google-speech-api

19.07.2018 23:06

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

831

Ответы 1

Документация упоминает:

sampleRateHertz - (required) specifies the sample rate (in Hertz) of the supplied audio. (For more information on sample rates, see Sample Rates below.) The sampleRateHertz field is optional for FLAC and WAV files where the sample rate is included in the file header.

Таким образом, проблема может заключаться в отсутствии свойства конфигурации SampleRateHertz, но если вы пытаетесь отправить файл WAV (или FLAC), может возникнуть проблема с Base64Audio или методом CreateAudio(), поскольку API явно не может определить частоту дискретизации.

19.07.2018 23:16

Другие вопросы по теме

Python, конвертировать канал файла flac

Как повысить точность распознавания речи Google для разделенных чисел

"Неуказанное" имя учетных данных Google Cloud Platform

Распознавание речи Python listen_in_background при нажатии кнопки?

Ошибка: 14 НЕДОСТУПНО: не удалось подключиться с помощью Google Speech API

Ошибка: экземпляр OAuth2Credentials не поддерживает обновление токена доступа. Как создать экземпляр AccessToken со строкой значения токена?

Ошибка преобразования речи в текст в облаке, герц

Распознавание речи Google не работает из-за конфликтующих потоков Qt C++

API Google Cloud Speech, JavaScript / angular

Захват звука из JavaScript и распознавание его с помощью Google Speech API

Преобразование голоса в текст C#

Ответы 1

Другие вопросы по теме

Похожие вопросы