В настоящее время я пытаюсь получить данные из 2 таблиц с LEFT JOIN, имеющим неизвестное значение.
Я пытался использовать LEFT JOIN, но это не сработало.
Вот мой пример кода:
SELECT
cc.shid,
cc.user,
ts.type,
sum(cc.qty1) + sum(cc.qty2) as qty_tot,
COUNT(cc.id) as nb
FROM
content_c cc
LEFT JOIN
(SELECT
s.shid,
s.type
FROM
tab_s s
LIMIT 1
) as ts ON ts.shid = cc.shid
WHERE
cc.time_i like '2019-01%'
GROUP BY
cc.user,
ts.type
С этим запросом он никогда не будет работать: ts будет содержать первое вхождение tab_s независимо от cc.shid. Интересно, есть ли способ сделать это:
LEFT JOIN
(SELECT
s.shid,
s.type
FROM
tab_s s
WHERE
s.shid = cc.shid
LIMIT 1
) as ts ON ts.shid = cc.shid
Есть идеи ? Есть ли в SQL понятие указателя или что-то в этом роде? Например, я могу использовать &cc.shid или @cc.shid?
Обратите внимание, что выполните следующие действия:
LEFT JOIN tab_s ts ON ts.shid = cc.shid
Заставит мой запрос занять более 1 минуты, чтобы отобразить результаты. И я не могу установить индекс в tab_s.shid, а также в cc.shid, поскольку он имеет несколько вхождений.
Пожалуйста, имейте в виду, что content_c может иметь несколько вхождений cc.shid, поэтому мне нужно взять только первый результат (LIMIT 1). Это важно.
Трудно сказать, что вы пытаетесь сделать из запроса, который не работает, но я предполагаю, что у вас есть, например, Пользователи и Адреса, и может быть несколько адресов, но только последний (определенный какой-то датой) адрес "текущий" «Итак, вы пытаетесь получить список пользователей и их текущий адрес, а у некоторых пользователей могут не быть записанных адресов, поэтому вам нужно левое соединение. Это что-то близкое к тому, что вы пытаетесь сделать? Разместите, пожалуйста, образцы данных в таблицах
LIMIT 1 приводит к тому, что из подзапроса возвращается только одна общая строка, а не одна строка на идентификатор. Какой столбец позволяет определить, является ли конкретная строка в content_c первой? Например, минимальная/максимальная дата или что-то в этом роде. (Надеюсь, вы не скажете: «О, это может быть любая строка, мы просто случайным образом записываем повторяющиеся бессмысленные строки в content_c, и любая из них подойдет для использования в запросе»)
Нет, это не так. Речь идет о статьях и комментариях, и я хочу привести некоторую статистику. Вы можете увидеть это как content_c = статьи + комментарии & tab_s = тип статьи. Я хочу создать статистику: для каждого пользователя отображать количество комментариев, количество прокомментированных статей и «тип статьи». На самом деле, отображение количества комментариев работает, количество прокомментированных статей тоже, но когда я пытаюсь включить тип статьи (которая войдет в ORDER BY), это не сработало. Я постараюсь опубликовать некоторые данные.
Ваша таблица содержания содержит статьи и комментарии к ним? Эээ.. Мне будет интересно увидеть эту структуру данных, потому что кажется, что есть необходимость разделить те, которые уже
Нет, он содержит только идентификатор статей. Мне не нужно больше статей, поэтому я просто использую COUNT для id, чтобы получить количество статей.
У вас есть несколько записей в tab_s с одним и тем же shid и одним и тем же shid, также помеченным одним и тем же типом в столбце s.type .... и поэтому вы ищете LIMIT 1, верно?
Вот так. Но также обратите внимание, что у меня есть несколько записей в content_c с одним и тем же shid.
Как обсуждалось в комментариях к вопросу, можете ли вы попробовать этот сценарий и посмотреть, соответствует ли он вашим требованиям? Это вернет строку для каждого идентификатора в таблице «content_c» с влиянием GROUP BY.
SELECT
cc.shid,
cc.user,
ts.type,
sum(cc.qty1) + sum(cc.qty2) as qty_tot,
COUNT(cc.id) as nb
FROM content_c cc
LEFT JOIN
(
SELECT DISTINCT s.shid, s.type FROM tab_s s
) AS ts ON ts.shid = cc.shid
WHERE cc.time_i like '2019-01%'
GROUP BY cc.shid,cc.user,ts.type
Используйте коррелированный подзапрос:
SELECT cc.shid, cc.user, cc.type,
SUM(cc.qty1) + SUM(cc.qty2) as qty_tot,
COUNT(cc.id) as nb
FROM (SELECT cc.*,
(SELECT s.type
FROM tab_s s
WHERE ts.shid = cc.shid
LIMIT 1
) as type
FROM content_c cc
) cc
WHERE cc.time_i >= '2019-01-01' AND
cc.time_i < '2019-02-01'
GROUP BY cc.shid, cc.user, cc.type;
Примечания:
LIMIT
без ORDER BY
подозрительно. Почему в базовой таблице могут быть дубликаты?GROUP BY
должен включать все неагрегированные столбцы в SELECT
.
Индексы не обязательно должны быть уникальными. Вы можете легко проиндексировать
tab_s
.shid