RedDeveloper
Блог
Вопросы
Теги
Топ 100 вопросов про Data Mining
Коллекция из 100 самых популярных вопросов про
data-mining
с ответами и комментариями.
Топ 100
Топ 15
Топ 20
Топ 25
Топ 30
Топ 50
Все вопросы
Вопросы на собеседовании
1
Альтернативы программного обеспечения с открытым исходным кодом Datamining
2
Как выполнить кластеризацию в Word2Vec
3
Может ли кто-нибудь объяснить интеллектуальный анализ данных, SSIS, BI, ETL и другие связанные технологии?
4
Как получить выбранные функции в GridSearchCV в sklearn в python
5
Ошибка: «Несовместимо с запрошенным типом» при построении varImp
6
Какое приложение для интеллектуального анализа данных использовать?
7
Сравнение нескольких словарей в Python
8
Как получить научные результаты из неэкспериментальных данных (датамайнинг?)
9
Алгоритм классификации экземпляров из набора данных, аналогичный другому меньшему набору данных, где этот меньший набор данных представляет один класс
10
Как установить сеанс для пользователя на основе разницы во времени в пандах
11
Обработка данных на основе значений трендов
12
Weka не дискретизирует последний столбец
13
Как объединить таблицы в Matlab (2018), сопоставив временные интервалы?
14
Как стандартный DBSCAN в sklearn работает так быстро?
15
Разница между кластеризацией временных рядов и сегментацией временных рядов
16
Как перебирать каждый столбец и каждую ячейку в фрейме данных pandas
17
Нахождение выкройки в наборе
18
Хорошо объясненные алгоритмы индексации и поиска в метрических пространствах
19
Построение центров кластеров KMeans для каждой итерации в Python
20
Как создать собственное глобальное ограничение с помощью решателя CP-SAT инструментов OR?
21
Классификация с использованием DBSCAN с разделением тестового поезда
22
Вычислить сходство между списком слов
23
Найдите все потенциально похожие документы из списка документов, используя кластеризацию
24
Сгенерируйте матрицу изображений из кода цепочки Freeman
25
Форма ввода LSTM для многомерных временных рядов?
26
Sklearn или Pandas, вменяйте недостающие значения с помощью простой линейной регрессии
27
PyPDF возвращает Junk-коды
28
Как использовать библиотеку Orange, не открывая программное обеспечение
29
Как изменять и получать доступ к элементам с помощью массивов numpy
30
Масштабируемость в компьютерном алгоритме
31
Подмножество a-правил в R длиной lhs
32
Как получить набор данных, содержащий как категориальные, так и непрерывные данные, в определяемую пользователем метрическую функцию в DBSCAN?
33
Python - Геотекст - Такие города, как "Рио-де-Жанейро" не распознаются
34
Как показать частоту записей, находящихся на расстоянии 15 минут друг от друга
35
Разная последовательность функций приводит к разному результату при использовании LightGBM?
36
Дескремблирование Javascript BitCoin miner
37
Среднее значение матрицы путаницы в R
38
Несбалансированная модель, не понимающая, какие шаги предпринять
39
Лучший формат XML для журналов событий с точки зрения поддержки инструментов для интеллектуального анализа и визуализации данных?
40
Представление последовательных правил в интеллектуальном анализе данных (интеллектуальный анализ шаблонов последовательностей)
41
Самый простой способ очистки сложных данных
42
Как использовать visibility_graph для создания сети?
43
Networkx изменить взвешенный ориентированный граф на неориентированный
44
Импорт набора данных ARFF с помощью RWeka в RStudio (зависимая ошибка: rJava)
45
Использование периодограммы для определения сезонности временных рядов
46
Итерация по правилам ассоциации с использованием заголовка набора элементов
47
Обрабатывать отсутствующие значения в python по среднему значению атрибута для всех образцов, принадлежащих к тому же классу, что и данный кортеж?
48
Как получить уравнения, связывающие элементы из правил с помощью априорного алгоритма?
49
Я пытаюсь преобразовать столбец str в число с плавающей запятой в фрейме данных, используя Python 2
50
LSH: решить ТОЧНЫЙ поиск ближайшего соседа?
51
Как WEKA оценивает кластеры?
52
Преобразование фрейма данных в объект транзакции для априорной функции без экспорта и перезагрузки фрейма данных
53
TermDocumentMatrix Ошибка редких символов (испанский)
54
Сегментирование набора данных
55
Предложение по реализации Minhash с n перестановкой
56
Множественная линейная регрессия с категориальными функциями с использованием sklearn - python
57
Как установить имя файла как данные из переменной (в R)?
58
Как мне решить, какой метод / алгоритм интеллектуального анализа данных выбрать?
59
Открытие набора данных через URL-адрес в WEKA
60
Классификация текста + NLP + Data-Mining + Data Science: следует ли остановить удаление слов и выделение корней перед применением tf-idf?
61
Пакет "fdapace" (R) - создать функциональный график первого главного компонента
62
Как мы можем различать шум и выбросы в DataMining
63
Расчет расстояния между парами с помощью функции distance () с метрикой HVDM в R
64
Сравнение черепицы для выявления почти повторяющихся элементов
65
Результаты кластеризации Weka отличаются для одних и тех же настроек
66
Какой метод машинного обучения можно использовать для многомерных временных рядов?
67
Cooks.distance возвращает больше значений, чем есть в моем наборе данных
68
Разделить фрейм данных после PrefixSpan
69
R: переупорядочивание данных, отсортированных по одному столбцу
70
Почему BIDE использует полумаксимальный период для обрезки поискового пространства?
71
Как найти метки классов после одной горячей кодировки в LabelBinarizer sklearn
72
Есть ли полнофункциональная реализация NSGA-II?
73
Использование LabelEncoder в sklearn в столбце фрейма данных
74
Что такое образец поверхности, образец шаблона и образец ансамбля в сопоставлении текста НЛП?
75
Получение неверной ошибки сравнения типов
76
Почему перед выбором модели не выполняется настройка модели?
77
Как найти «эквивалентные» тексты?
78
Как использовать python/selenium, чтобы щелкнуть строку таблицы для очистки заданных данных?
79
Убедитесь, что имя столбца является уникальным идентификатором
80
Как написать запрос на загрузку данных из DBLP?
81
Почему в этой реализации Apriori работает быстрее, чем FP-Growth?
82
Как получить конкретную строку для тестирования и другую для обучения?
83
Определить подходящие значения параметров функции расстояния для этого графика
84
Как преобразовать файл arff в матрицу
85
Как сгруппировать данные на основе подмножества атрибутов (4 атрибута)?
86
Как сравнить LDA с другими тематическими моделями?
87
Как проверить, содержит ли строка слово при применении правила_ассоциации?
88
Гистограмма IP-адресов (серия Panda)
89
Как вычисляется центр класса для атрибута решения в алгоритме фаззификации на основе центра класса?
90
Получение тегов для вектора в модели Doc2Vec
91
Как измерить разницу между функциями в фрейме данных?
92
Рассчитать коэффициент дисбаланса для набора данных с несколькими классами
93
Как сгруппировать изображение с помощью DBSCAN и получить вывод через изображение?
94
Data Analytics vs Data Science vs Data Mining vs Data Analysis
95
Почему FP-Growth возвращает более одного Consequent?
96
K-means находит одноэлементный кластер, когда я стандартизирую функции (набор данных для оптовых клиентов)
97
Что означает эта ошибка в прогнозах на тестовом наборе в WEKA
98
Индекс выпуска ELKI
99
Вызывает ли однократное горячее кодирование проблемы с несбалансированной функцией?
100
Как выполнить предварительную обработку данных в игре - k-means