У меня есть 10 МБ, и я разделил его на 4 МБ (ограничение размера кадра) на 3 части, а затем отправил 3 вызова:
speechToText.recognizeUsingWebSocket(audio: chunkData, settings: settings, callback: callback)
но временные метки не совпадают, он сбрасывается до 0,0 для каждого вызова. Как правильно?
вы делаете три отдельных вызова службы STT, поэтому временные метки сбрасываются. Вам нужно отправить 10 МБ в рамках одного вызова.