Например, у меня есть фрейм данных df
вот так:
| Name | color | id | weight |
|------- |-------- |---- |-------- |
| john | blue | 67 | 70 |
| clara | yellow | - | 67 |
| diana | red | 89 | 56 |
Здесь числовые столбцы, такие как «id» и «вес», должны иметь все числовые значения, в отличие от второго значения «id», которое является «-».
Если я делаю df.dtypes
, он возвращает:
| name | object
| color | object
| id | object
| weight | float
** Как я могу пройти через столбец данных по столбцам, а затем проверить, является ли тип столбца объектом, а затем, если это объект, затем проверить, становится ли он объектом из-за опечатки '-' как id- если да затем поднимите флаг **
Заархивируйте имя столбца и dtypes, чтобы создать кортеж:
for col_name, col_type in zip(df.columns, df.dtypes):
if col_type == "object":
# do whatever here
pass
спасибо, эта структура позволяет мне делать свою работу