Я изучаю Cambridge Analytica и хочу получать как можно больше новостных статей из некоторых новостных агентств.
Я смог очистить их, и теперь у меня есть куча файлов JSON в папке.
В некоторых из них записан только этот [], в то время как в других есть нужные мне данные.
Используя pandas, я использовал следующее и получил каждый webTitle в файле.
df = pd.read_json(json_file)
df['webTitle']
Дело в том, что всякий раз, когда есть пустой файл, он даже не позволяет мне присвоить df['webTitle'] переменной.
Есть ли способ проверить, пуст ли он, и просто перейти к следующему файлу?
Я хочу превратить это в электронную таблицу с несколькими keys и столбцами и values в виде строк для каждой новостной статьи.
Мои файлы упорядочены по дням, и я использовал API TheGuardian для получения данных.
Я еще не много писал, но на всякий случай вот код как есть:
import pandas as pd
import os
def makePathToFile(path):
pathtoJson = []
for root,sub,filename in os.walk(path):
for i in filename:
pathToJson.append(os.path.join(path, i))
return pathToJson
def readJsonAndWriteCSV (pathToJson):
for json_file in pathToJson:
df = pd.read_json(json_file)
Спасибо!
Я понимаю! Я здесь новичок и подумал, что могу дать несколько советов, прежде чем начать, даже не зная, возможно ли это, ха-ха
Пожалуйста, взгляните на это, stackoverflow.com/help/dont-ask, а затем посмотрите, можете ли вы отредактировать свой вопрос, чтобы он не был закрыт как «Слишком широкий».
Вы можете начать с получение данных с веб-страницы.
@GabrielAlmeida, все в порядке, Габриэль. Как сказал vasxowhite, отредактируйте свой вопрос позже, чтобы он не был закрыт, и если у вас есть какие-либо конкретные вопросы, спросите и покажите пример вашего кода, и мы будем готовы помочь!
@SimeonIkudabo Я добился нескольких вещей, но теперь застрял на других, ха-ха






Вы можете настроить оповещение Google для ключевых слов новостей, которые хотите, а затем очистить результаты в python с помощью https://pypi.org/project/galerts/
Вы должны задать конкретный вопрос программирования в стеке и показать пример вашей собственной попытки использования кода. Я бы попытался сначала очистить, и если у вас есть какие-либо ошибки, задайте конкретный вопрос. Такова природа правил стека.