Как прочитать первые несколько записей файла json с помощью R?

У меня есть ОГРОМНЫЙ файл json.gz, и этот файл уже преобразован в файл .json. Я хотел бы спросить, как мы можем прочитать, скажем, первые 100 записей из файла .json с помощью R. Мы очень признательны за любую помощь. Ниже приведен пример кода:

library(jsonlite)
library(R.utils)
r=stream_in(file("yelp_academic_dataset_business.json"))

Файл "yelp_academic_dataset_business.json" можно найти по ссылке: https://www.dropbox.com/s/gd1k41y9gbpfwq3/yelp_academic_dataset_business.json

Попробуйте ?readLines. Он принимает аргумент n, который вы можете установить равным 100, т.е. прочитать максимум 100 строк.

Shree 29.05.2019 04:44

Спасибо за уделенное время. Но я не уверен, работает ли readLines для файла .json.

D. Nguyen 29.05.2019 04:52

Эта ссылка неверна, она ведет на веб-страницу, а ответ начинается с <!DOCTYPE html>. Вы действительно смотрели на то, что вы пытаетесь сделать здесь?

r2evans 29.05.2019 05:29

Благодарю. Я пересмотрел, чтобы было понятнее.

D. Nguyen 29.05.2019 05:32
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
4
437
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Используя данные из вашей исходной ссылки, предложение @Shree является точным. Во-первых, используйте readLines, чтобы загрузить столько строк, сколько вам нужно:

dat <- readLines("https://uc385e5985dd32823a7dc6ba9b5e.dl.dropboxusercontent.com/cd/0/get/AhyCjVEm8yKnLz4w0-hZaW-titb8fOhQdMcwhTMF1_3i_iJ7DOqOU_KQRTtcvaFBaSTpAznh_6eq-vKAEiDkeVygMnRjThrnz0V5fyC4AURAcg/file?_download_id=9916801659220323334123287637995650900165723151388885263767035946&_notify_domain=www.dropbox.com&dl=1", n =4 )
# dat <- readLines("yelp_academic_dataset_business.json", n = 4)

Теперь создайте «поддельное текстовое соединение» и передайте его синтаксическому анализатору json:

jsonlite::stream_in(textConnection(dat))
#  Imported 4 records. Simplifying...
#              business_id                                        full_address hours.Tuesday.close hours.Tuesday.open hours.Friday.close hours.Friday.open hours.Monday.close hours.Monday.open
# 1 vcNAWiLM4dR7D2nwwJ7nCA 4840 E Indian School Rd\nSte 101\nPhoenix, AZ 85018               17:00              08:00              17:00             08:00              17:00             08:00
# 2 UsFtqoBl7naz8AVUBZMjQQ                202 McClure St\nDravosburg, PA 15034                <NA>               <NA>               <NA>              <NA>               <NA>              <NA>
# 3 cE27W9VPgO88Qxe4ol6y_g             1530 Hamilton Rd\nBethel Park, PA 15234                <NA>               <NA>               <NA>              <NA>               <NA>              <NA>
# 4 HZdLhv6COCleJMo7nPl-RA               301 S Hills Vlg\nPittsburgh, PA 15241               21:00              10:00              21:00             10:00              21:00             10:00
#   hours.Wednesday.close hours.Wednesday.open hours.Thursday.close hours.Thursday.open hours.Sunday.close hours.Sunday.open hours.Saturday.close hours.Saturday.open  open
# 1                 17:00                08:00                17:00               08:00               <NA>              <NA>                 <NA>                <NA>  TRUE
# 2                  <NA>                 <NA>                 <NA>                <NA>               <NA>              <NA>                 <NA>                <NA>  TRUE
# 3                  <NA>                 <NA>                 <NA>                <NA>               <NA>              <NA>                 <NA>                <NA> FALSE
# 4                 21:00                10:00                21:00               10:00              18:00             11:00                21:00               10:00  TRUE
#                                                                                               categories        city review_count                     name neighborhoods  longitude state stars
# 1                                                                              Doctors, Health & Medical     Phoenix            9        Eric Goldberg, MD          NULL -111.98376    AZ   3.5
# 2                                                                                              Nightlife  Dravosburg            4             Clancy's Pub          NULL  -79.88693    PA   3.5
# 3                                                                           Active Life, Mini Golf, Golf Bethel Park            5 Cool Springs Golf Center          NULL  -80.01591    PA   2.5
# 4 Shopping, Home Services, Internet Service Providers, Mobile Phones, Professional Services, Electronics  Pittsburgh            3         Verizon Wireless          NULL  -80.05998    PA   3.5
#   latitude attributes.By Appointment Only attributes.Happy Hour attributes.Accepts Credit Cards attributes.Good For Groups attributes.Outdoor Seating attributes.Price Range
# 1 33.49931                           TRUE                    NA                              NA                         NA                         NA                     NA
# 2 40.35052                             NA                  TRUE                            TRUE                       TRUE                      FALSE                      1
# 3 40.35690                             NA                    NA                              NA                         NA                         NA                     NA
# 4 40.35762                             NA                    NA                              NA                         NA                         NA                     NA
#   attributes.Good for Kids     type
# 1                       NA business
# 2                       NA business
# 3                     TRUE business
# 4                       NA business

jsonlite::stream_in(textConnection(x)) вы имели в виду «dat», верно? Большое спасибо! Красиво работает!!!

D. Nguyen 29.05.2019 05:45

Другие вопросы по теме