Когда я получаю небольшой набор данных, скажем, 2000 наблюдений, в R с помощью googleAnalyticsR из Google Analytics, все работает хорошо.
df <- google_analytics(id=ga_id,
start = "2017-12-01",
end = "2017-12-31",
metrics = "ga:users",
dimensions = "ga:dimension1, ga:longitude, ga:latitude",
max=10000)
Но когда мне нужно было получить больший набор данных с 20000 наблюдениями, тот же код не удался и вернулась ошибка:
Batching data into [2] calls.
Request to profileId: ()
Error in f(content, ...) : Invalid dimension or metric:
Как я могу решить эту проблему? Спасибо.





Есть возможность запускать ваш код партиями. Я использую библиотеку 'rga' и загружаю большие объемы данных партиями, и обычно получаемый фрейм данных содержит все наблюдения. Вот небольшая модификация. Пожалуйста, дайте мне знать, если это не сработает.
df <- ga$getData(id, batch =TRUE,
start = "2017-01-01",
end = "2017-12-31",
metrics = "ga:users",
dimensions = "ga:dimension1, ga:longitude,ga:latitude",
max=10000)
Это из git версия библиотеки. Очень жаль, что я не упомянул об этом раньше. Я так часто этим пользуюсь, что забыл, что это не часть версии CRAN.
Я отредактировал свой ответ HW-Scientist. Пожалуйста, посмотри. Извините за мою забывчивость.
Наконец-то я смог получить набор данных с 20000 наблюдениями. Я сделал две корректировки: 1) Добавил оператор: rga.open (instance = "ga") перед определением фрейма данных. 2) Изменен формат даты на: start.date = "2017-01-01", end.date = "2017-12-31", что немного отличается от пакета googleAnalyticsR.
Вам нужно установить max в -1, тогда будут получены все результаты. Вам не нужно устанавливать пакеты или размеры страниц и т. д., Он сделает это за вас.
Вот несколько примеров из Веб-сайт:
# 1000 rows only
thousand <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date")
# 2000 rows
twothousand <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date",
max = 2000)
# All rows
alldata <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date",
max = -1)
Большое спасибо, Шри. Но когда я добавляю инструкцию «batch = TRUE» в библиотеку googleAnalyticsR, возникает ошибка «неиспользуемый аргумент (batch = TRUE)». Когда я использую оператор «batch = TRUE» в библиотеке rga «df <- ga $ getData (...), ошибка: объект 'ga' не найден. Если я изменю код на ... df <- df $ getData () ..., Ошибка: «Ошибка в df $ getData: объект типа« закрытие »не является подмножеством».