У меня есть несколько пустых файлов JSON, которые выдают исключение, когда я пытаюсь их просмотреть. Как мне заставить это работать?

Я изучаю Cambridge Analytica и хочу получать как можно больше новостных статей из некоторых новостных агентств.

Я смог очистить их, и теперь у меня есть куча файлов JSON в папке. В некоторых из них записан только этот [], в то время как в других есть нужные мне данные.

Используя pandas, я использовал следующее и получил каждый webTitle в файле.

df = pd.read_json(json_file)
df['webTitle']

Дело в том, что всякий раз, когда есть пустой файл, он даже не позволяет мне присвоить df['webTitle'] переменной.

Есть ли способ проверить, пуст ли он, и просто перейти к следующему файлу? Я хочу превратить это в электронную таблицу с несколькими keys и столбцами и values в виде строк для каждой новостной статьи.

Мои файлы упорядочены по дням, и я использовал API TheGuardian для получения данных.

Я еще не много писал, но на всякий случай вот код как есть:

import pandas as pd
import os


def makePathToFile(path):
    pathtoJson = []
    for root,sub,filename in os.walk(path):
        for i in filename:
            pathToJson.append(os.path.join(path, i))
    return pathToJson




def readJsonAndWriteCSV (pathToJson):
    for json_file in pathToJson:
        df = pd.read_json(json_file)

Спасибо!

Вы должны задать конкретный вопрос программирования в стеке и показать пример вашей собственной попытки использования кода. Я бы попытался сначала очистить, и если у вас есть какие-либо ошибки, задайте конкретный вопрос. Такова природа правил стека.

Simeon Ikudabo 21.05.2018 01:59

Я понимаю! Я здесь новичок и подумал, что могу дать несколько советов, прежде чем начать, даже не зная, возможно ли это, ха-ха

Gabriel Almeida 21.05.2018 02:01

Пожалуйста, взгляните на это, stackoverflow.com/help/dont-ask, а затем посмотрите, можете ли вы отредактировать свой вопрос, чтобы он не был закрыт как «Слишком широкий».

vascowhite 21.05.2018 02:01

Вы можете начать с получение данных с веб-страницы.

vascowhite 21.05.2018 02:04

@GabrielAlmeida, все в порядке, Габриэль. Как сказал vasxowhite, отредактируйте свой вопрос позже, чтобы он не был закрыт, и если у вас есть какие-либо конкретные вопросы, спросите и покажите пример вашего кода, и мы будем готовы помочь!

Simeon Ikudabo 21.05.2018 02:04

@SimeonIkudabo Я добился нескольких вещей, но теперь застрял на других, ха-ха

Gabriel Almeida 23.05.2018 19:40
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
6
66
1

Ответы 1

Вы можете настроить оповещение Google для ключевых слов новостей, которые хотите, а затем очистить результаты в python с помощью https://pypi.org/project/galerts/

Другие вопросы по теме