Я пытаюсь проанализировать миллионы поисковых запросов в интернет-магазине и агрегировать их в Google Data Studio. К сожалению, XLSX в моем облачном хранилище Google из-за ошибок:
Ошибка при чтении данных, сообщение об ошибке: в таблице CSV обнаружено слишком много ошибок, отказ. Ряды: 1; ошибки: 1. Пожалуйста, просмотрите коллекцию ошибок [] для получения более подробной информации.
Ошибка при чтении данных, сообщение об ошибке: Обнаружена ошибка при разборе строки, начиная с позиции: 0. Ошибка: Обнаружен неверный символ (ASCII 0).
Я загрузил файл XLSX со своего компьютера в облачное хранилище Google и попытался создать из него таблицу с помощью Google BigQuery, и при его импорте я получаю эти сообщения об ошибках.
Я хочу использовать BigQuery в качестве источника данных для моей студии данных Google и агрегировать строки поиска из файла XLSX таким образом, чтобы я мог видеть, какие запросы выполняются регулярно без каких-либо результатов и какие строки поиска ищутся чаще всего.
Я был бы очень признателен вам за то, что вы помогли мне исправить ошибку и найти эффективный способ агрегирования данных без необходимости долгой загрузки.
поддерживаемые форматы данных не включает XLSX.
Хорошим способом добиться этого было бы преобразовать XLSX в CSV, а затем загрузить его в BigQuery.
Здесь у вас есть пример того, как использовать Python с pandas для преобразования файла. После преобразования вы можете загрузить его в Google Cloud Storage, а затем загрузить в BigQuery.
Кроме того, вы можете загрузить его прямо с вашего компьютера без использования Google Cloud Storage.
Большое спасибо! В конце концов я мог изменить его на CSV-формат, поместить все поля в STRING NULLABLE и разрешить все ошибки. Это помогло мне получить его в Google Data Studio. :-)
Вы не можете загрузить файл Excel, как если бы это был CSV — это разные форматы. Посмотрите, поможет ли предложение в stackoverflow.com/a/46799866/6253347.