Группировать повторяющиеся строки в TSQL

У меня есть следующая таблица и данные в SQL Server 2005:

create table LogEntries (
  ID int identity,
  LogEntry varchar(100)
)

insert into LogEntries values ('beans')
insert into LogEntries values ('beans')
insert into LogEntries values ('beans')
insert into LogEntries values ('cabbage')
insert into LogEntries values ('cabbage')
insert into LogEntries values ('beans')
insert into LogEntries values ('beans')

Я хотел бы сгруппировать повторяющиеся записи журнала, чтобы получить следующие результаты:

LogEntry  EntryCount
beans     3
cabbage   2
beans     2

Можете ли вы придумать какой-либо способ сделать это в TSQL, помимо использования курсора?

sql sql-server sql-server-2005 tsql

17.12.2008 12:34

ReactJs | Supabase | Добавление данных в базу данных

Это и есть ваш редактор таблиц в supabase.👇

Понимание Python и переход к SQL

Перед нами лабораторная работа по BloodOath:

1 625

Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

SQL не совсем моя сильная сторона, но не буду

SELECT LogEntry, COUNT(1) AS Counter FROM LogEntries GROUP BY LogEntry

сделай это?

Нет, это приведет к бобам - 5 Кочанная капуста - 2

— 17.12.2008 12:51

Ах, в медвежью яму тоже упал. Ну что ж. По крайней мере, я в хорошей компании :)

— 17.12.2008 12:51

17.12.2008 12:43

Не думаю, что это можно сделать одним запросом. Чтобы обеспечить количество в запросе, вам необходимо сгруппировать, используя столбец LogEntry. Однако это даст вам только общее количество записей в LogEntry, а не количество записей в последовательности, которые вы ищете. Я думаю, что вызывается курсор (или переносите весь набор данных в ваше приложение и используйте там логику для получения желаемых результатов).

17.12.2008 12:47

Если мой мозг еще не загрузился сегодня утром

SELECT 
  LogEntry, COUNT(LogEntry) as EntryCount
FROM
  LogEntries
GROUP BY
  LogEntry

Нет, это приведет к бобам - 5 Кочанная капуста - 2

— 17.12.2008 12:51

17.12.2008 12:48

Теперь я достаточно внимательно посмотрел на реальный вопрос :-)

Хм, при пересмотре, почему бы просто не использовать курсор? Производительность не всегда хуже, чем у обычного SQL - и другим людям наверняка будет легко следовать коду, когда они придут посмотреть на него. Оберните его в сохраненный процесс или функцию, и вы сможете использовать его практически везде, где вам может понадобиться.

17.12.2008 12:55

Ответ принят как подходящий

Это комплексное решение проблемы. Спектакль, наверное, отстой, но работает :)

CREATE TABLE #LogEntries (
  ID INT IDENTITY,
  LogEntry VARCHAR(100)
)

INSERT INTO #LogEntries VALUES ('beans')
INSERT INTO #LogEntries VALUES ('beans')
INSERT INTO #LogEntries VALUES ('beans')
INSERT INTO #LogEntries VALUES ('cabbage')
INSERT INTO #LogEntries VALUES ('cabbage')
INSERT INTO #LogEntries VALUES ('carrots')
INSERT INTO #LogEntries VALUES ('beans')
INSERT INTO #LogEntries VALUES ('beans')
INSERT INTO #LogEntries VALUES ('carrots')

SELECT logentry, COUNT(*) FROM (
    SELECT logentry, 
    ISNULL((SELECT MAX(id) FROM #logentries l2 WHERE l1.logentry<>l2.logentry AND l2.id < l1.id), 0) AS id
    FROM #LogEntries l1
) AS a
GROUP BY logentry, id


DROP TABLE #logentries

Полученные результаты:

beans   3
cabbage 2
carrots 1
beans   2
carrots 1

ISNULL () требуется для первого набора компонентов.

Блестяще! Спасибо, это намного проще, чем курсор, который я написал.

— 17.12.2008 23:23

Я тоже схожу с ума, так как сейчас я смотрю на это, я сам использовал такого рода решения на основе наборов в прошлом.

— 18.12.2008 14:24

17.12.2008 13:38

Я думаю, это сработает ... хотя не слишком тщательно проверял

select 
    COUNT(*),subq.LogEntry 
from 
(
    select 
        ROW_NUMBER() OVER(ORDER BY id)-ROW_NUMBER() OVER(PARTITION BY logentry ORDER BY id) as t,*
    from 
        LogEntries
) subq 
group by 
    subq.t,subq.LogEntry 
order by 
    MIN(subq.ID)

Спасибо, работает. Раньше я не использовал ключевое слово partition. Это интересно.

— 17.12.2008 23:26

Это очень элегантное и хитрое использование функции OVER (). Хороший!

— 18.12.2008 14:19

АККУРАТНЫЙ! Я недостаточно хорошо разбираюсь в партиционировании ... подойдет!

— 18.12.2008 14:25

17.12.2008 13:52