Я новичок в Python. У меня есть файл JSON, в котором мне нужно провести некоторую аналитику.
Когда я загружаю файл, у меня появляется много трассировок.
Код простой
with open('Dataset.json') as f:
jsonData = json.load(f)
======= Traceback - это
File "/anaconda3/lib/python3.7/json/__init__.py", line 296, in load
parse_constant=parse_constant, object_pairs_hook=object_pairs_hook, **kw)
File "/anaconda3/lib/python3.7/json/__init__.py", line 348, in loads
return _default_decoder.decode(s)
File "/anaconda3/lib/python3.7/json/decoder.py", line 340, in decode
raise JSONDecodeError("Extra data", s, end)
json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 366)
Как я могу это расшифровать?
Спасибо
попробуйте это: с open ('Dataset.json') как f: jsonData = json.load (f)
пример кода {"category": "WELLNESS", "headline": "Tracey Heggins, Senna Of The Twilight Saga, Shares Her GPS Guide", "авторы": "", "link": "huffingtonpost.com/entry/…", "short_description" : "Стресс и напряжение нашей постоянно связанной жизни иногда сбивают нас с курса. GPS For The Soul может помочь вам найти", "date": "2012-09-22"}
Мне нужно агрегировать текстовые данные в разделах «short_description» и «заголовок» и использовать агрегированные текстовые данные для создания двух моделей N-граммов для N = {1, 2}; после того, как мне нужно записать две модели в один файл EXCEL на двух разных листах ;; какие-нибудь советы? Спасибо
Что вы не понимаете в сообщении об ошибке? Он явно сообщает вам, 1 / что содержимое вашего файла недействительно json, 2 / Зачем это недопустимый json (после объекта json есть дополнительные данные) и 3 / где эти дополнительные данные начинаются (в столбце 1 строки 2). Решение простое: откройте файл json и проверьте, что у вас в нем есть. Как уже упоминалось в toom501, я подозреваю, что у вас действительно есть более одного объекта json в вашем файле и, вероятно, по одному на строку (что сделает ваш файл «json-lines» одним jsonlines.org).
NB: вы должны опубликовать более длинный отрывок (скопированный) из файла (а не одну строку) для правильного MCVE ...






Попробуй это:
import json
with open('Dataset.json', 'r') as f:
jsonData = json.load(f)
Предполагается, что ваш набор данных (json) правильно отформатирован. посмотрев на вашу опубликованную ошибку, я думаю, что, возможно, это не так.
режим по умолчанию для open читается, так что это не должно иметь значения
Я не знал, что у него дефолт, СПАСИБО
Я сделал цикл, чтобы открыть каждую строку, и это сработало; для строки в f: data = json.loads (строка)
{"category": "WELLNESS", "headline": "Tracey Heggins, Senna Of The Twilight Saga, делится своим GPS-гидом", "авторы": "", "link": "huffingtonpost.com/entry/…", "short_description": "The стресс и напряжение в нашей постоянно связанной жизни могут иногда сбить нас с курса. GPS For The Soul может помочь вам найти "," date ":" 2012-09-22 "}
Мне нужно агрегировать текстовые данные в разделах «short_description» и «заголовок» и использовать агрегированные текстовые данные для создания двух моделей N-граммов для N = {1, 2}; после того, как мне нужно записать две модели в один файл EXCEL на двух разных листах ;; какие-нибудь советы? Спасибо
Не могли бы вы добавить образец json файла
Dataset.json? Похоже, у вас внутри файла несколько json ...