Я сохраняю свой аудиофайл в хранилище Google в формате WAV, но когда я пытаюсь загрузить аудио с помощью Google Colab, мне не удается это сделать.
ниже пример, который я использовал для загрузки аудио из хранилища Google.
import numpy as np
import IPython.display as ipd
import librosa
import soundfile as sf
import io
from google.cloud import storage
import os
from google.colab import auth
auth.authenticate_user()
os.environ["GCLOUD_PROJECT"] = "fundpro" #project_id
BUCKET = 'parli-2020' #bucket_name
gcs = storage.Client()
bucket = gcs.get_bucket(BUCKET)
import speech_recognition as sr
for blob in bucket.list_blobs(prefix='speech/Transcribe'):
filename = 'gs://parli-2020/' + blob.name
X, sample_rate = librosa.core.load(filename)
но ошибка: имя файла не может быть найдено. [Errno 2] Нет такого файла или каталога
мой вопрос: как загрузить аудио из хранилища Google / как читать аудио из хранилища Google
У меня есть попытка с предложением, но ошибка gs не поддерживается ... есть ли где-нибудь, как сохранить звук в формате wav? потому что после прочтения аудио есть еще один процесс.






Librosa использует встроенную реализацию python io, которая не поддерживает файловую систему Google. Вы можете использовать реализацию GFile тензорного потока.
Что-то вроде этого,
import numpy as np
import IPython.display as ipd
import librosa
import soundfile as sf
import io
from google.cloud import storage
import os
import tensorflow.io.gfile as gf
from google.colab import auth
auth.authenticate_user()
os.environ["GCLOUD_PROJECT"] = "fundpro" #project_id
BUCKET = 'parli-2020' #bucket_name
gcs = storage.Client()
bucket = gcs.get_bucket(BUCKET)
import speech_recognition as sr
for blob in bucket.list_blobs(prefix='speech/Transcribe'):
filename = 'gs://parli-2020/' + blob.name
with gf.GFile(filename, 'rb') as fp:
X, sample_rate = librosa.core.load(fp)
спасибо за ваш ответ и помощь, однако я получаю эту ошибку ModuleNotFoundError: Нет модуля с именем 'tensorflow.gfile', который тензорный поток подходит для tensorflow.gfile
Запустите pip install tensorflow-io. Затем попробуйте еще раз с обновленным оператором импорта.
AttributeError: модуль 'tensorflow.io.gfile' не имеет атрибута 'Open', который уже можно импортировать, но сталкивается с другой проблемой, без атрибута 'Open' ...
Повторите попытку с указанным выше обновлением.
извините, что продолжаю просить о помощи, я получаю эту новую ошибку, связанную с форматом файла, моим аудио в формате wav. RuntimeError: Ошибка при открытии объекта <tensorflow.python.platform.gfile.GFile в 0x7f884c60eed0>: файл содержит данные в неизвестном формате. и почему при выполнении кода с gf.GFile (filename) как fp: X, sample_rate = librosa.core.load (fp) fp не возвращает имя файла, а возвращает это "tensorflow.python.platform.gfile.GFile объект по адресу 0x7f884c60eed0 "
Попробуйте открыть файл как двоичный.
Мне нужно поддерживать звук в формате wav, так как я хочу провести анализ звука ... в двоичном формате может загружаться, но не может обрабатывать звук.
можем ли мы преобразовать двоичный файл в формат wav?
Отвечает ли это на ваш вопрос? как загрузить аудио из хранилища Google / как прочитать аудио из хранилища Google