Я проанализировал форму данных .json, а затем построил их, но мне нужен только определенный диапазон от нее
например год-месяц = с 2014-12 по 2020-03
КОД ЕСТЬ
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_json("observed-solar-cycle-indices.json", orient='records')
data = pd.DataFrame(data)
print(data)
x = data['time-tag']
y = data['ssn']
plt.plot(x, y, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()
Вот результат, как видите его слишком много
вот файл json: https://services.swpc.noaa.gov/json/solar-cycle/observed-solar-cycle-indices.json Как либо разобрать определенное значение из файла JSON, либо построить определенный диапазон?
Извините, формат год-день
Вы уверены? Я загрузил ваш файл json, на который вы ссылались. Проверяя data['time-tag']
, я вижу, что годы идут от yyyy-01 до yyyy-12. Вы можете проверить это с помощью data[data['time-tag'].str.contains('1900')]
, введя 1900 любой год.
Привет, Джирапат, ответ работает на тебя?
извините, вы были правы, это год - месяцы
Нет проблем, рад, что смог вам помочь.
Вы можете выполнить поиск значения индекса ваших дат начала и окончания для значений x и y. Используйте это, чтобы создать меньший набор списков, которые вы можете построить.
Например, это может быть что-то вроде
x = data['time-tag']
y = data['ssn']
start_index = x.index('2014-314')
end_index = x.index('2020-083')
x_subsection = x[start_index : end_index]
y_subsection = y[start_index : end_index]
plt.plot(x_subsection, y_subsection, 'o')
plt.xlabel('Year-day'), plt.ylabel('SSN')
plt.show()
Возможно, вам потребуется преобразовать фрейм данных в массив с помощью np.array().
Я запустил скрипт и получил эту ошибку: x = data['time-tag'] IndexError: действительными индексами являются только целые числа, срезы (:
), многоточие (...
), numpy.newaxis (None
) и целые или логические массивы.
Следующее должно работать:
Выберите данные, используя дату начала и окончания
ndata = data[ (data['time-tag'] > '2014-01') & (data['time-tag'] < '2020-12')]
Постройте данные. Маркировка по оси X адаптирована для отображения только каждой 12-й метки.
x = ndata['time-tag']
y = ndata['ssn']
fig, ax = plt.subplots()
plt.plot(x, y, 'o')
every_nth = 12
for n, label in enumerate(ax.xaxis.get_ticklabels()):
if n % every_nth != 0:
label.set_visible(False)
plt.xlabel('Year-Month')
plt.xticks(rotation='vertical')
plt.ylabel('SSN')
plt.show()
Что вы подразумеваете под «например, год-дата = с 2014-314 по 2020-083», не должен ли год идти максимум до 2014-012, если формат - «год-месяцы»?