Сравнить несколько столбцов с Numpy и panda

Здравствуйте, моя цель и найти, какая схема (Nom_ci) Я не могу найти правильный путь, я пытаюсь найти правильный метод, Я сделал это с набором IF ELIF ... но время было огромным

Можете ли вы помочь мне найти лучший метод

заранее спасибо

import pandas as pd
import numpy as np
import re



cycling = pd.DataFrame(
    {
        'Comp_ci': [1, 2, 3, 3, 3, 3, 3, 2, 1, 1], 
        'Nom_ci': ['RONCQ_A2_OPTI_SRV_S3', 
                 'RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3', 
                 'RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3', 
                 'RONCQ_A2_SRV_PC_S3, RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3', 
                 'RONCQ_A2_PC_SRV_S3, RONCQ_A2_SRV_S3, RONCQ_A2_TEMP_SRV_S3', 
                 'RONCQ_A2_OPTI_SRV_S3, RONCQ_A2_PC_SRV_S3, RONCQ_A2_SRV_S3', 
                 'RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3, RONCQ_A2_PC_SRV_S3', 
                 'RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3', 
                 'RONCQ_A2_SRV_S3',
                 'RONCQ_A2_PC_SRV_S3'],
        'result hope':['autre','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A2_VSR_S3','RONCQ_A2_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A2_VSR_S3','autre']
    }
)
print(cycling)

condition=((cycling['Count RSF Circuit']==1) & 
           (cycling['Nom ConcatSet'][0].str.contains("_OPTI").eq(False)) & 
           (cycling['Nom ConcatSet'][0].str.contains("_TEMP").eq(False))&
           (cycling['Nom ConcatSet'][0].str.contains("_PC").eq(False)))


cycling['col3'] = np.where(condition, cycling['Nom ConcatSet'], 'autre')
print(cycling)

python pandas numpy

19.12.2020 20:43

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

РЕДАКТИРОВАТЬ : Хорошо, я думаю, что понял, чего вы пытались достичь: это все?

temp = cycling.Nom_ci.str.split(', +') # will split on ',' or ' ' (using regex)
print(temp)
print('-'*50)

temp = temp.explode() #will explode the lists to one serie (do note that the indexes are kept untouched)
print(temp)
print('-'*50)

temp = temp.to_frame() #will convert your serie to a dataframe
print(type(temp))
print('-'*50)

temp['match'] = temp['Nom_ci'].str.contains('(_TEMP)|(_PC)|(_OPTI)')==False #will get you a boolean serie (using regex) from your patterns, which will allow you to select the desired strings
print(temp)
print('-'*50)

temp =  temp[temp.match==True] #do select the rows corresponding to your criteria (note that the indexes are still untouched)
print(temp)
print('-'*50)

temp.rename({'Nom_ci':'col3'}, axis=1, inplace=True) #rename your column to whatever you want
print(temp)
print('-'*50)

temp.drop('match', inplace=True, axis=1) #drop the "match" column which is now useless
print(temp)
print('-'*50)

cycling = cycling.join(temp) #join the dataframes based on indexes
print(temp)
print('-'*50)

cycling['col3'].fillna('autre', inplace=True) #fill the "nan" values with "autres"
print(cycling)

Здравствуйте, прежде всего спасибо за вашу помощь, когда у нас есть только один элемент информации в ячейке, это не представляет проблемы, бывает, чтобы найти основную цепь, с другой стороны, когда их 2 или даже три, я не могу найти решение, без пропуска 3 промежуточных столбцов цель состоит в том, чтобы найти элемент в столбце «Nom_ci», удалив остальные 2 (потому что у них есть критерии OPTI, TEMP, PC)

— 19.12.2020 22:22

Я просто изменил свой ответ. Все еще не уверен, что понял вашу проблему здесь; если я прав, вы действительно должны быть более точными в своих вопросах (особенно объясняя, что посещенный результат был в столбце «result_hope», это очень помогло бы!).

— 20.12.2020 14:33

Спасибо за ваш ответ, с другой стороны, я извлекаю информацию из огромного массива и deisré, что COL3 связан с DF, я пробовал DF ['CP'] = temp ('col3'), но это не работает, и я не понимаю почему.

— 20.12.2020 22:59

Если вы хотите присоединиться к кадрам данных, вы должны использовать либо слияние , либо соединение. Кроме этого, я не могу вам больше помочь без копии вашего кода и вашей трассировки исключений...

— 21.12.2020 08:22

19.12.2020 21:37