Как я могу выбрать случайное количество строк на основе различных критериев?

У меня есть таблица с тремя основными категориями: age, city и gender.

Половая колонка boolean.

Возрастная категория находится в следующем диапазоне:

['18-25','26-35','36-45','46-55','56-65','66-75','75+']

Категория города насчитывает около 19 cities. Итак, для каждого города в категории '18-25' и '75+' я хотел бы выбрать 24 случайных ряда для females и 20 для males.

Для остальных cities я хотел бы выбрать 40 случайных males и 47 случайных females.

Можно ли добиться этого без необходимости запускать конкретный запрос для каждого случая?

Извините за отсутствие кода, но, честно говоря, я даже не знаю, с чего и как начать :(

пример данных пожалуйста и ожидаемый результат! так что мы можем помочь :о)

Mikhail Berlyant 15.12.2020 01:04

Спасибо @MikhailBerlyant. Это нелегко объяснить, но в основном это было похоже на цепочку из 3 сообщений, где я искал ответы. Вы определенно помогли мне с одним из этих вопросов. Я смог решить важную мою проблему с вашим unnest ответом. Мне нужно больше учиться.

Pedro Pablo Severin Honorato 15.12.2020 13:14
ReactJs | Supabase | Добавление данных в базу данных
ReactJs | Supabase | Добавление данных в базу данных
Это и есть ваш редактор таблиц в supabase.👇
Понимание Python и переход к SQL
Понимание Python и переход к SQL
Перед нами лабораторная работа по BloodOath:
0
2
74
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать row_number() для случайного перечисления строк, а затем просто фильтровать:

select t.*
from (select t.*,
             row_number() over (partition by city, age, gender order by rand()) as seqnum
      from t
     ) t
where (age in ('18-25', '75+') and
       (gender = 'female' and seqnum <= 24 or
        gender = 'male' and seqnum <= 20
       )
      ) or 
      (age not in ('18-25', '75+') and
       (gender = 'female' and seqnum <= 47 or
        gender = 'male' and seqnum <= 40
       )
      )

Привет @Гордон Линофф. Это, в сочетании с другими ответами на потоковые сообщения (фактически 3 сообщения), смогло решить мою проблему. Чтобы получить другие части случайного выбора, мне нужно выполнить тот же запрос, изменить диапазон age и seqnum чисел, а затем выполнить запрос union all, верно?

Pedro Pablo Severin Honorato 15.12.2020 13:16

@PedroPabloSeverinHonorato . . . Я думаю, что неправильно понял исходный вопрос. Я изменил ответ. Union all всё равно не надо. . . просто сложная логика фильтрации.

Gordon Linoff 15.12.2020 13:21

Другие вопросы по теме