RedDeveloper
Блог
Вопросы
Теги
Вопросы на собеседовании Data Mining
Изучите нашу коллекцию (Топ-100) часто задаваемых вопросов по теме
data-mining
при собеседовании на работу и будьте во всеоружии.
Вопросы на собеседовании
Топ 15
Топ 20
Топ 25
Топ 30
Топ 50
Топ 100
Все вопросы
1
Альтернативы программного обеспечения с открытым исходным кодом Datamining
2
Какое приложение для интеллектуального анализа данных использовать?
3
Нахождение выкройки в наборе
4
Вопросы по технике ансамбля в машинном обучении
5
Лучший формат XML для журналов событий с точки зрения поддержки инструментов для интеллектуального анализа и визуализации данных?
6
Сравнение нескольких словарей в Python
7
Заменить среднее значение столбца, используя цикл for в R
8
Очистка данных с помощью Pandas
9
Хорошо объясненные алгоритмы индексации и поиска в метрических пространствах
10
Как измерить разницу между функциями в фрейме данных?
11
Data Analytics vs Data Science vs Data Mining vs Data Analysis
12
Как найти подобную закономерность вместе с отсутствующими объектами в больших данных?
13
Масштабируемость в компьютерном алгоритме
14
Что мы можем сделать с набором данных, в котором 98 процентов столбцов имеют нулевые значения?
15
Моделирование данных машинного обучения
16
Как рассчитать косинусное сходство с уже рассчитанными оценками TFIDF
17
Попытка извлечь данные из нескольких тысяч файлов JSON на Java с отклонениями от схемы
18
Может ли кто-нибудь объяснить интеллектуальный анализ данных, SSIS, BI, ETL и другие связанные технологии?
19
Как получить научные результаты из неэкспериментальных данных (датамайнинг?)
20
Создать словарь из файла .txt с каждой строкой в качестве значений и серийным номером в качестве ключа
21
Алгоритм классификации экземпляров из набора данных, аналогичный другому меньшему набору данных, где этот меньший набор данных представляет один класс
22
Импорт набора данных ARFF с помощью RWeka в RStudio (зависимая ошибка: rJava)
23
Классификация с использованием DBSCAN с разделением тестового поезда
24
Как сгруппировать данные на основе подмножества атрибутов (4 атрибута)?
25
Вычислить сходство между списком слов
26
Сгенерируйте матрицу изображений из кода цепочки Freeman
27
LSH: решить ТОЧНЫЙ поиск ближайшего соседа?
28
Форма ввода LSTM для многомерных временных рядов?
29
Сегментирование набора данных
30
Как объединить таблицы в Matlab (2018), сопоставив временные интервалы?
31
Как вызвать Dataframe и найти строку в функции с помощью R?
32
Обработка выбросов в интеллектуальном анализе данных
33
Как найти кластер в письме
34
Наивная байесовская точность увеличивается с увеличением альфа-значения
35
На графике матрицы неточностей не отображаются данные
36
Пакет "fdapace" (R) - Как получить доступ к основным компонентам функционального анализа главных компонентов
37
Cooks.distance возвращает больше значений, чем есть в моем наборе данных
38
Как создать список наборов с k + 1 элементами из списка наборов с k элементами, если порядок не имеет значения?
39
Python: используйте strptime () для объекта, который не имеет нулевого заполнения
40
Невозможно создать список правил с помощью алгоритма априори
41
Ошибка при использовании функции makeRegrTask из пакета MLR
42
Azure Application Insights - как анализировать экспортированные данные
43
Иерархическая кластеризация и вероятность принадлежности кластеру - Weka
44
Rapidminer - разделение строк со значениями неправильного типа
45
Найдите связанные элементы в программировании r для интеллектуального анализа данных
46
Как найти метки классов после одной горячей кодировки в LabelBinarizer sklearn
47
Как мы можем установить недостающие данные (NA) в R?
48
Как устранить эту ошибку TypeError?
49
Использование LabelEncoder в sklearn в столбце фрейма данных
50
Определить точность модели, оценивающей вероятность одного из классов
51
Поиск частых закономерностей с помощью pyfpgrowth
52
Среднее значение матрицы путаницы в R
53
Как найти «эквивалентные» тексты?
54
Как использовать функцию интеллектуального анализа данных SQL Server 2008 с ASP.Net
55
Удаление слайдов из SlideShare
56
Представление последовательных правил в интеллектуальном анализе данных (интеллектуальный анализ шаблонов последовательностей)
57
Преобразование кода манипуляции с кадрами данных Python в R
58
Построение центров кластеров KMeans для каждой итерации в Python
59
Как использовать python/selenium, чтобы щелкнуть строку таблицы для очистки заданных данных?
60
Самый простой способ очистки сложных данных
61
Как создать собственное глобальное ограничение с помощью решателя CP-SAT инструментов OR?
62
Убедитесь, что имя столбца является уникальным идентификатором
63
Как написать запрос на загрузку данных из DBLP?
64
Как использовать visibility_graph для создания сети?
65
Ошибка TfidfVectorizer в очищенном текстовом наборе данных
66
Почему в этой реализации Apriori работает быстрее, чем FP-Growth?
67
Дамп Википедии доступен на AWS S3
68
Как получить конкретную строку для тестирования и другую для обучения?
69
Networkx изменить взвешенный ориентированный граф на неориентированный
70
Как запустить кластерный анализ в R для текстовых данных
71
Как получить выбранные функции в GridSearchCV в sklearn в python
72
Определить подходящие значения параметров функции расстояния для этого графика
73
Как преобразовать файл arff в матрицу
74
Использование периодограммы для определения сезонности временных рядов
75
Как определить, следует ли использовать алгоритмы машинного обучения или метод интеллектуального анализа данных для данного сценария?
76
Прогнозирование годовых данных
77
Как сравнить LDA с другими тематическими моделями?
78
Как проверить, содержит ли строка слово при применении правила_ассоциации?
79
Что лучше Orange.data.Table или Pandas для управления данными в python?
80
Гистограмма IP-адресов (серия Panda)
81
Как установить сеанс для пользователя на основе разницы во времени в пандах
82
Обрабатывать отсутствующие значения в python по среднему значению атрибута для всех образцов, принадлежащих к тому же классу, что и данный кортеж?
83
Как вычисляется центр класса для атрибута решения в алгоритме фаззификации на основе центра класса?
84
Найдите все потенциально похожие документы из списка документов, используя кластеризацию
85
Получение тегов для вектора в модели Doc2Vec
86
Рассчитать коэффициент дисбаланса для набора данных с несколькими классами
87
Как получить уравнения, связывающие элементы из правил с помощью априорного алгоритма?
88
Можно ли выбрать набор экземпляров из набора данных, введя один экземпляр?
89
Я пытаюсь преобразовать столбец str в число с плавающей запятой в фрейме данных, используя Python 2
90
Почему FP-Growth возвращает более одного Consequent?
91
Кластеризация / классификация текстов на необычном языке
92
K-means находит одноэлементный кластер, когда я стандартизирую функции (набор данных для оптовых клиентов)
93
Что означает эта ошибка в прогнозах на тестовом наборе в WEKA
94
ПОЧЕМУ подсчет поддержки кандидата из 3-х пунктов "подгузник с хлебом и молоком" дается как 3, алгоритм Apriori,
95
Индекс выпуска ELKI
96
Полу-контролируемая кластеризация / классификация
97
Вызывает ли однократное горячее кодирование проблемы с несбалансированной функцией?
98
Как WEKA оценивает кластеры?
99
Как выполнить предварительную обработку данных в игре - k-means
100
Методы интеллектуального анализа данных