Из кадра данных «movie1» мне нужно создать новый «movie2007to16», в котором есть данные с 2007 года и позже. Имя столбца — «title_year», которое изначально было типом с плавающей запятой, но имело некоторые значения NaN, которые я заменил на 0. Затем я преобразовал его в тип int8.
Но когда я пытаюсь создать новый фрейм данных с 'title_year'>2006, я получаю
"TypeError: '>' not supported between instances of 'str' and 'int'".
Что я делаю неправильно?
Просмотрел ответы на эту точную ошибку на stackoverflow и других сайтах и попробовал решения, но безуспешно.
movie1['title_year']=pd.to_numeric(movie1['title_year'], errors='coerce').fillna(0).astype(np.int8)
movie2007to16=movie1[movie1['title_year'>2006]]
Я ожидаю новый фрейм данных, в котором есть записи за 2007 год и позже.
Вы сравниваете строковый литерал 'title_year'
с целым числом 2006
здесь:
'title_year'>2006
Пытаться:
movie2007to16 = movie1[movie1['title_year'] > 2006]