Как получить конкретную строку для тестирования и другую для обучения?

Я хочу протестировать определенную строку из своего набора данных и увидеть результат, но не знаю, как это сделать. Например, я хочу проверить строку номер 100, а затем проверить точность.

feature_cols = [0,1,2,3,4,5]
X = df[feature_cols] # Features
y = df[6] # Target variable

# Split dataset into training set and test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1,
                                                    random_state=1)

#Create Decision Tree classifer object
clf = DecisionTreeClassifier(max_depth=5)

#Train Decision Tree Classifer
clf = clf.fit(X_train,y_train)

#Predict the response for test dataset
y_pred = clf.predict(X_test)

print("Accuracy:", metrics.accuracy_score(y_test, y_pred))

Знаете ли вы индекс строки, которую хотите протестировать?

iamchoosinganame 28.05.2019 22:36

Например, чтобы проверить последнюю строку в наборе данных и все остальные строки для обучения.

Albanit 28.05.2019 22:38

В этом случае не используйте train_test_split для разделения данных.

iamchoosinganame 28.05.2019 22:39

И как сделать? Есть ли у вас какие-либо идеи.

Albanit 28.05.2019 22:40
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
4
740
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Я рекомендую исключить строку, которую вы хотите протестировать, из набора данных.

test_row=100
train_idx=np.arange(X.shape[0])!=test_row
test_idx=np.arange(X.shape[0])==test_row
X_train=X[train_idx]
y_train=y[train_idx]
X_test=X[test_idx]
y_test=y[test_idx]

Теперь X_test будет содержать одну строку. Однако точность теперь будет либо 0, либо 1, поскольку вы тестируете только один образец.

Другие вопросы по теме