Как применить несколько алгоритмов sklearn с разными параметрами к нескольким кадрам данных?

Я ищу эффективный способ применить несколько алгоритмов кластеризации sklearn к нескольким кадрам данных без слишком большого повторения.

import pandas as pd
import numpy as np
from sklearn.datasets import make_moons,make_blobs
from sklearn.cluster import KMeans, DBSCAN
from matplotlib import pyplot

X1, y1 = make_moons(n_samples=100, noise=0.1)
X2, y2 = make_blobs(n_samples=100, centers=3, n_features=2)

И я хочу применить к этим наборам данных как kmeans, так и dbscan, но для каждого набора данных требуются разные параметры, как я могу использовать цикл для применения нескольких моделей к нескольким данным и, в конечном итоге, отобразить их в сетке? Спасибо.

python scikit-learn subplot

09.03.2019 15:44

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы создали несколько словарей для определения гиперпараметров для каждой комбинации набора данных | кластеризации_алго.

Может быть, следующий подход может сработать для вас! [Разработано на основе документация по кластеризации sklearn]

import pandas as pd
import numpy as np
from sklearn.datasets import make_moons,make_blobs
from sklearn.cluster import KMeans, DBSCAN
from matplotlib import pyplot as plt

noisy_moons = make_moons(n_samples=100, noise=0.1)
blobs = make_blobs(n_samples=100, centers=3 , center_box = (-1,1),cluster_std=0.1)

colors = np.array(['#377eb8', '#ff7f00', '#4daf4a',
                   '#f781bf', '#a65628', '#984ea3',
                   '#999999', '#e41a1c', '#dede00'])

#defining the clustering algo which we want to try
clustering_models = [KMeans,DBSCAN]

from collections import namedtuple
Model = namedtuple('Model', ['name', 'model'])
models = [Model(model.__module__.split('.')[-1][:-1], model) 
          for model in clustering_models]

#defn of params for each dataset|clustering_algo
datasets_w_hyperparams = [(noisy_moons[0], 
                           {models[0][0]: {'n_clusters': 2}, models[1][0]: {'eps': .3, }}),
                          (blobs[0], 
                           {models[0][0]: {'n_clusters': 2}, models[1][0]: {'eps': .1, }})]

f,axes=plt.subplots(len(datasets_w_hyperparams),len(models),figsize = (15,10))
for data_id,(dataset,params) in enumerate(datasets_w_hyperparams):
    for model_id,model in enumerate(models):
        ax = axes[data_id][model_id]
        name, clus_model = model
        pred = clus_model(**params[name]).fit_predict(dataset)
        ax.scatter(dataset[:,0],dataset[:,1], s=20, color= colors[pred])
        ax.set_title(name)
plt.show()

09.03.2019 17:57

Другие вопросы по теме

Как использовать кривую в питоне

Распознавание пользовательских именованных объектов

Отрегулируйте пользовательскую функцию потерь для классификации повышения градиента

Точность классификации на основе одного набора функций

Можно ли установить base_estimator как OneVsRestClassifier(DecisionTreeClassifier()) для Adaboost?

Должно ли количество классификаторов в стековом классификаторе равняться количеству столбцов моего набора данных для обучения/тестирования?

Должен ли я нормализовать или стандартизировать свой набор данных для knn?

Влияет ли установка случайного состояния в RandomForestClassifier sklearn на вашу модель?

Как мы рассчитываем вероятность в питоне?

ValueError: Спам или нет Прогнозирование спама с использованием линейной регрессии

Как применить несколько алгоритмов sklearn с разными параметрами к нескольким кадрам данных?

Ответы 1

Другие вопросы по теме

Похожие вопросы