Как загрузить в BigQuery таблицу XLSX размером 52,4 МБ?

Я пытаюсь проанализировать миллионы поисковых запросов в интернет-магазине и агрегировать их в Google Data Studio. К сожалению, XLSX в моем облачном хранилище Google из-за ошибок:

Ошибка при чтении данных, сообщение об ошибке: в таблице CSV обнаружено слишком много ошибок, отказ. Ряды: 1; ошибки: 1. Пожалуйста, просмотрите коллекцию ошибок [] для получения более подробной информации.

Ошибка при чтении данных, сообщение об ошибке: Обнаружена ошибка при разборе строки, начиная с позиции: 0. Ошибка: Обнаружен неверный символ (ASCII 0).

Я загрузил файл XLSX со своего компьютера в облачное хранилище Google и попытался создать из него таблицу с помощью Google BigQuery, и при его импорте я получаю эти сообщения об ошибках.

Я хочу использовать BigQuery в качестве источника данных для моей студии данных Google и агрегировать строки поиска из файла XLSX таким образом, чтобы я мог видеть, какие запросы выполняются регулярно без каких-либо результатов и какие строки поиска ищутся чаще всего.

Я был бы очень признателен вам за то, что вы помогли мне исправить ошибку и найти эффективный способ агрегирования данных без необходимости долгой загрузки.

Вы не можете загрузить файл Excel, как если бы это был CSV — это разные форматы. Посмотрите, поможет ли предложение в stackoverflow.com/a/46799866/6253347.

Elliott Brossard 28.05.2019 01:45
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
1
1
2 709
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

поддерживаемые форматы данных не включает XLSX.

Хорошим способом добиться этого было бы преобразовать XLSX в CSV, а затем загрузить его в BigQuery.

Здесь у вас есть пример того, как использовать Python с pandas для преобразования файла. После преобразования вы можете загрузить его в Google Cloud Storage, а затем загрузить в BigQuery.

Кроме того, вы можете загрузить его прямо с вашего компьютера без использования Google Cloud Storage.

Большое спасибо! В конце концов я мог изменить его на CSV-формат, поместить все поля в STRING NULLABLE и разрешить все ошибки. Это помогло мне получить его в Google Data Studio. :-)

Nes Elm 10.07.2019 13:49

Другие вопросы по теме