Есть компания, она предоставляет 200 товаров для своих 8000 клиентов. Среднее количество клиентов, купивших продукты, составляет 10. Некоторые крупные клиенты могут купить 20 или более продуктов.
Основные продукты популярны, теперь компания хочет расширить свой рынок с помощью AI.
В этом вопрос, компания не предоставляет вам данные клиентов. Вам нужно что-то погуглить, чтобы заменить.
Мое общее решение: если клиент A покупает продукты a, b, c, d и e, клиент B покупает продукты a, b, c и d. Если я продвигаю е клиенту Б, я легко это сделаю.
Серьезно, на мой взгляд, это набор данных 8000 * n, и мне нужно сначала выполнить кластеризацию данных, тепловую карту или дендрограмму. Затем с помощью прогнозного моделирования p (e | a , b , c , d) для каждого кластера. Это нормально?
Вы можете игнорировать следующие предложения.
Здравствуй! Я бакалавр информационных систем в последнем семестре, присоединяюсь к проекту (новый проект направлен на то, чтобы позволить студентам из разных отраслей сотрудничать), у меня есть бизнес-наставник, который ничего не знает о компьютерных науках, и товарищи по бизнес-команде, которые не знают, что такое R, что это SPSS.
Наш проект неплохо звучит, приятно поговорили с клиентом, вроде все хорошо. Мы начинаем делать график сейчас.
Да, вы можете это сделать, однако при этом вы ограничиваете себя, поскольку вы также можете чему-то научиться у покупателя, который купил (a, b, d, f, e).
Общая проблема, которую вы хотите решить, - это рекомендация. Современные методы обычно используют для этого матричная факторизация.
Вот хорошая библиотека для R. Подобные библиотеки должны быть доступны для SPSS.
Анализ рыночной корзины может помочь вам, как объединить продукты, чтобы увеличить количество покупок. Это лучшая технология для вас, потому что порядок покупки товаров учитывается, а при кластерном анализе - нет. Взгляните на ссылку от IBM SPSS Modeler (здесь они называют узел правила ассоциации - ibm.com/support/knowledgecenter/en/SS3RA7_17.0.0/components/…)