Здравствуйте, моя цель и найти, какая схема (Nom_ci) Я не могу найти правильный путь, я пытаюсь найти правильный метод, Я сделал это с набором IF ELIF ... но время было огромным
Можете ли вы помочь мне найти лучший метод
заранее спасибо
import pandas as pd
import numpy as np
import re
cycling = pd.DataFrame(
{
'Comp_ci': [1, 2, 3, 3, 3, 3, 3, 2, 1, 1],
'Nom_ci': ['RONCQ_A2_OPTI_SRV_S3',
'RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3',
'RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3',
'RONCQ_A2_SRV_PC_S3, RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3',
'RONCQ_A2_PC_SRV_S3, RONCQ_A2_SRV_S3, RONCQ_A2_TEMP_SRV_S3',
'RONCQ_A2_OPTI_SRV_S3, RONCQ_A2_PC_SRV_S3, RONCQ_A2_SRV_S3',
'RONCQ_A3_SRV_S3, RONCQ_A2_OPTI_SRV_S3, RONCQ_A2_PC_SRV_S3',
'RONCQ_A2_TEMP_SRV_S3, RONCQ_A3_SRV_S3',
'RONCQ_A2_SRV_S3',
'RONCQ_A2_PC_SRV_S3'],
'result hope':['autre','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A2_VSR_S3','RONCQ_A2_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A3_VSR_S3','RONCQ_A2_VSR_S3','autre']
}
)
print(cycling)
condition=((cycling['Count RSF Circuit']==1) &
(cycling['Nom ConcatSet'][0].str.contains("_OPTI").eq(False)) &
(cycling['Nom ConcatSet'][0].str.contains("_TEMP").eq(False))&
(cycling['Nom ConcatSet'][0].str.contains("_PC").eq(False)))
cycling['col3'] = np.where(condition, cycling['Nom ConcatSet'], 'autre')
print(cycling)






РЕДАКТИРОВАТЬ : Хорошо, я думаю, что понял, чего вы пытались достичь: это все?
temp = cycling.Nom_ci.str.split(', +') # will split on ',' or ' ' (using regex)
print(temp)
print('-'*50)
temp = temp.explode() #will explode the lists to one serie (do note that the indexes are kept untouched)
print(temp)
print('-'*50)
temp = temp.to_frame() #will convert your serie to a dataframe
print(type(temp))
print('-'*50)
temp['match'] = temp['Nom_ci'].str.contains('(_TEMP)|(_PC)|(_OPTI)')==False #will get you a boolean serie (using regex) from your patterns, which will allow you to select the desired strings
print(temp)
print('-'*50)
temp = temp[temp.match==True] #do select the rows corresponding to your criteria (note that the indexes are still untouched)
print(temp)
print('-'*50)
temp.rename({'Nom_ci':'col3'}, axis=1, inplace=True) #rename your column to whatever you want
print(temp)
print('-'*50)
temp.drop('match', inplace=True, axis=1) #drop the "match" column which is now useless
print(temp)
print('-'*50)
cycling = cycling.join(temp) #join the dataframes based on indexes
print(temp)
print('-'*50)
cycling['col3'].fillna('autre', inplace=True) #fill the "nan" values with "autres"
print(cycling)
Я просто изменил свой ответ. Все еще не уверен, что понял вашу проблему здесь; если я прав, вы действительно должны быть более точными в своих вопросах (особенно объясняя, что посещенный результат был в столбце «result_hope», это очень помогло бы!).
Спасибо за ваш ответ, с другой стороны, я извлекаю информацию из огромного массива и deisré, что COL3 связан с DF, я пробовал DF ['CP'] = temp ('col3'), но это не работает, и я не понимаю почему.
Если вы хотите присоединиться к кадрам данных, вы должны использовать либо слияние , либо соединение. Кроме этого, я не могу вам больше помочь без копии вашего кода и вашей трассировки исключений...
Здравствуйте, прежде всего спасибо за вашу помощь, когда у нас есть только один элемент информации в ячейке, это не представляет проблемы, бывает, чтобы найти основную цепь, с другой стороны, когда их 2 или даже три, я не могу найти решение, без пропуска 3 промежуточных столбцов цель состоит в том, чтобы найти элемент в столбце «Nom_ci», удалив остальные 2 (потому что у них есть критерии OPTI, TEMP, PC)