Python, я хочу преобразовать определенный тип столбца после импорта CSV-файла

import numpy as np

data_arr = np.loadtxt("asset.csv", delimiter = ",", dtype = 'str')
data_arr

Результат:

array([['G1', '1', '100', '5', '0'],

['G1', '1', '21', '538', '0'],

['G1', '1', '22', '6000', '0'],

...,

['G2', '8', '61', '241908', '8800'],

['G2', '8', '70', '57341', '16800'],

['G2', '9', '51', '1340', '0']], dtype='<U7')

Но я хочу преобразовать столбцы 2,3,4,5 (поля '1', '100', '5', and '0' в первой строке) в тип int

потому что я хочу попробовать

family_number = np.array([1,2,3,4,100])

capital = data_arr[data_arr[:,0]= = "G1"]

for i, number in enumerate(family_number):

    family_numbers = capital[capital[:,1]>i] & capital[capital[:,1]<=number]

    print("\t" + len(family_numbers))

Как я могу преобразовать тип столбцов? Пожалуйста помоги!

используйте dtype = 'int64'. Есть ли причина указывать str как dtype?

— 29.05.2019 06:17

python csv types casting

29.05.2019 06:15

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

131

Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Попробуйте что-то вроде:

df[col_bame]=df[can l_name].astype(int)

29.05.2019 06:19

Ответ принят как подходящий

Укажите правильные типы столбцов:

np.loadtxt('asset.csv', delimiter = ",", dtype='S20,int64,int64,int64,int64')

Обновлено: укажите максимальную длину строки рядом. Например. теперь это должно работать, если ваш первый столбец не превышает 20 символов.

Когда я это делаю, поле 'str' исчезает! массив([('', 1, 100, 5, 0), ('', 1, 21, 538, 0), ('', 1, 22, 6000, 0), ..., ('', 8, 61, 241908, 8800), ('', 8, 70, 57341, 16800), ('', 9, 51, 1340, 0)], dtype=[('f0', '<U'), ('f1', '<i4'), ('f2', '<i4'), ('f3', '<i4'), ('f4', '<i4')])

— 29.05.2019 07:34

Извините за столько вопросов, но есть 2 проблемы. сначала пишет TypeError: тип данных "s20" не понят. Во-вторых, когда я набираю «str,int,int,int,int» вместо того, что вы рекомендуете, он говорит IndexError: слишком много индексов для массива

— 29.05.2019 08:29

s20 не S20.

— 29.05.2019 08:30

29.05.2019 06:24

Вы можете нарезать результат и использовать astype:

arr = np.array([['1', '2', '3'], ['3', '4', '5'], ['5', '6', '7']])
arr
# array([['1', '2', '3'],
#        ['3', '4', '5'],
#        ['5', '6', '7']], dtype='<U1')

arr[:,1:].astype(int)
# array([[2, 3],
#        [4, 5],
#        [6, 7]])

Я имею в виду, что другие ответы и комментарии (@Amadan's, например) кажутся правильными в том смысле, что вы можете импортировать их с разными типами данных в первую очередь. Но если вы застряли постфактум, код, подобный приведенному выше, должен работать.

Кажется, он был преобразован, но после этого возникает еще одна проблема, подобная этой TypeError: '>' не поддерживается между экземплярами 'numpy.ndarray' и 'int'

— 29.05.2019 07:43

29.05.2019 06:32