Я хотел бы изобразить поток путей, по которым следует пользователь, использующий Neo4j. Я хочу получить результат, похожий на диаграмму Санки. Проект, который я делаю, требует аналогичных результатов, таких как Google Analytics. Является ли использование Neo4j возможным вариантом?
В настоящее время я думал о сохранении URL-адреса как узлов и отношений между двумя узлами как отношений с типом «PATH». Пройденный путь сохраняется как свойство связи со значением.
Например, если пользователь переходит из A->B->C->D, тогда отношения между A и B будет иметь свойство A_B:1 и связь между B и C будет иметь свойство связи AB_C:1.Relationship между C и D будет иметь свойство связи ABC_D:1.
Есть ли у кого-нибудь свой вклад в это? Это хорошая модель?
Если бы вы использовали Neo4j, то, безусловно, имело бы смысл использовать узлы для моделирования состояний и отношения для моделирования потоков между состояниями.
Но пытаться сохранить информацию о потоке в реальном времени в качестве дополнительных свойств данных — очень плохая идея, поскольку поток в реальном времени можно получить непосредственно из узлов и связей без каких-либо дополнительных данных. Добавление собственных свойств потока в реальном времени было бы совершенно избыточным, увеличивало бы сложность, тратило бы время и память, а также было бы уязвимо к условиям гонки (и, следовательно, не было бы надежным).
Не совсем понятно ваш вариант использования. Вы пытаетесь показать движение одного пользователя или общую схему движения нескольких пользователей? Мой ответ больше ориентирован на первое. Если последнее, то ваше первоначальное предложение может иметь смысл. Кроме того, по этим ссылкам показаны 2 возможных способа визуализации диаграммы Сэнки (с использованием NeoDash или Excel): neo4j.com/labs/neodash/2.4/user-guide/reports/sankey , neo4j.com/labs/apoc /4.1/export/xls , youtube.com/watch?v=LgyhBVAIDc0.
Моя цель — сохранить пользовательскую активность нескольких пользователей для группы сайтов в графовой базе данных. Поэтому мне нужно смоделировать свои данные таким образом, чтобы я мог эффективно запрашивать их, чтобы показать количество пользователей, которые путешествовали с одного сайт на другой. Imageie 100 пользователей перемещаются с сайта A на B и еще 2000 с сайта A на C. Еще 100 с B на D. Таким образом, запрос должен охватывать получение этой информации из графа. Для справки я предоставлю запрос, над которым я работал.
СОВПАДЕНИЕ (n:UrlNode {метка: 'H'})-[r:PATH*]->(m:UrlNode) WHERE ALL(rel IN r WHERE ANY(ключ IN ключей(rel) ГДЕ ключ СОДЕРЖИТ 'H')) С н, м, р, [отн В р | key(rel)] AS allKeys UNWIND allKeys AS keyList UNWIND keyList AS key With n, m, r, key ГДЕ ключ СОДЕРЖИТ 'H' RETURN n, m, COLLECT(key) AS filteredkeys, r AS rels
Я отредактировал вопрос, чтобы показать диаграмму, которая будет представлена во внешнем интерфейсе нашего проекта. Меня не интересует внешний интерфейс. Мне нужно только найти способ обеспечить внутренний уровень хранения для хранения пользовательских данных и запроса количество пользователей, перешедших с одного URL-адреса на следующий. А также последовательный поток и количество пользователей.
Не могли бы вы предложить модель. И как я смогу получать поток в реальном времени непосредственно из узлов и связей, учитывая, что мне нужно вести учет количества пользователей, перешедших от URL-адреса к следующему URL-адресу? Например, если 10 пользователей попали на URL-адрес A и из A, 7 перешли на URL-адрес B и 3 перешли на URL-адрес C. Как мне это отслеживать. Мне нужно отобразить несколько переходов, подобных этому. Мои данные также указаны в миллионах пользователей. Любая помощь будет оценена