Разбор вложенного JSON с помощью Pandas

Я знаю, что были вопросы, похожие на этот, но я еще не смог понять, как делать то, что мне нужно. Я пытаюсь взять JSON и переместить его в Pandas DataFrame.

    {
  "friends": [
    {
      "name": "Joe Jimmy",
      "timestamp": 1541547573
    },
    {
      "name": "Steven Peterson",
      "timestamp": 1541274647
    }
  ]
}

Я бы хотел, чтобы соответствующий DataFrame выглядел так:

     Name               Timestamp   
1 "Joe Jimmy"        "1541547573"
2 "Stephen Peterson" "1541274647"

Я думаю, что проблема в первых вложенных «друзьях», но я не уверен, так как я новичок в JSON (и на самом деле Pandas).

Я пробовал ввести его через

 with open('data.json') as f:
   friends = json.load(f)

А затем перемещаю его в фрейм данных через конструктор Panadas DataFrame, но я не получаю ничего, кроме этого:

{'name': 'Brian B.S. Sheehan', 'timestamp': 15...}

Привет и добро пожаловать в SO. Чтобы повысить ваши шансы на получение ответа, я предлагаю вам взглянуть на как задать хороший вопрос и как создать Минимальный, полный и проверяемый пример. Это поможет вам получить необходимую помощь намного быстрее.

Remy J 30.12.2018 00:08
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
1
3 354
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Попробуй это. http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.json.json_normalize.html Или просто используйте функцию read_json и используйте метод groupby

Попробуй это:

from pandas.io.json import json_normalize
from json import load

data_json = load(open("inp.json", "r"))
print(json_normalize(data_json,'friends'))

Я понял. Я просто внес его и использовал new_friends = pd.DataFrame (data ['friends']), чтобы получить второй уровень в DF. Это некрасиво, но сработало.

Joshua Hill 30.12.2018 00:23

Я понимаю. Замечательно.

Vasyl Kushnir 30.12.2018 00:25
Ответ принят как подходящий

Вот решение с пандами read_json:

df = pd.read_json(r'C:\path\data.json')
df.friends.apply(pd.Series)

    name            timestamp
0   Joe Jimmy       1541547573
1   Steven Peterson 1541274647

Другие вопросы по теме