Преобразование голоса в текст C#

Я пытаюсь преобразовать голос в текст с помощью API Google, есть тестовая страница https://cloud.google.com/speech-to-text/, где вы можете убедиться, что ваш звук преобразован в текст, я представляю свой звук и для этой страницы ЕСЛИ ОН СТАНОВИТСЯ ТЕКСТОМ, но я потребляю service из моей программы, и мне это не удается, отображается следующая ошибка: "Поврежденный файл отправляет аудио снова: Статус (StatusCode = InvalidArgument, Detail = \" Недопустимое распознавание \ 'config \': плохая частота дискретизации, герц. \ ")»

Мой код выглядит следующим образом:

        string pathAudio = CreateAudio(Base64Audio);
        var speech = SpeechClient.Create();

        var response = speech.Recognize(new RecognitionConfig()
        {                
            Encoding = RecognitionConfig.Types.AudioEncoding.Linear16,
            LanguageCode = "es-MX",
        }, RecognitionAudio.FromFile(pathAudio));

        foreach (var result in response.Results)
        {
            foreach (var alternative in result.Alternatives)
            {
                resultado = alternative.Transcript;
            }
        }
        return resultado;

У них есть некоторое представление о том, что это может происходить.

"Плохая частота дискретизации герц" вполне указывает на проблему. Возникла проблема с частотой дискретизации вашего микрофона. Проверьте конфигурацию вашего оборудования. См. это

Alex 19.07.2018 23:10

Ситуация заключается в том, что тот же звук, который я конвертирую в текст через страницу Google, и там, если он преобразован, но моя программа не

Alejandro Reyes 19.07.2018 23:12
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
2
2
831
1

Ответы 1

Документация упоминает:

sampleRateHertz - (required) specifies the sample rate (in Hertz) of the supplied audio. (For more information on sample rates, see Sample Rates below.) The sampleRateHertz field is optional for FLAC and WAV files where the sample rate is included in the file header.

Таким образом, проблема может заключаться в отсутствии свойства конфигурации SampleRateHertz, но если вы пытаетесь отправить файл WAV (или FLAC), может возникнуть проблема с Base64Audio или методом CreateAudio(), поскольку API явно не может определить частоту дискретизации.

Другие вопросы по теме