У меня есть таблица с тремя основными категориями: age
, city
и gender
.
Половая колонка boolean
.
Возрастная категория находится в следующем диапазоне:
['18-25','26-35','36-45','46-55','56-65','66-75','75+']
Категория города насчитывает около 19 cities
. Итак, для каждого города в категории '18-25'
и '75+'
я хотел бы выбрать 24 случайных ряда для females
и 20 для males
.
Для остальных cities
я хотел бы выбрать 40 случайных males
и 47 случайных females
.
Можно ли добиться этого без необходимости запускать конкретный запрос для каждого случая?
Извините за отсутствие кода, но, честно говоря, я даже не знаю, с чего и как начать :(
Спасибо @MikhailBerlyant. Это нелегко объяснить, но в основном это было похоже на цепочку из 3 сообщений, где я искал ответы. Вы определенно помогли мне с одним из этих вопросов. Я смог решить важную мою проблему с вашим unnest
ответом. Мне нужно больше учиться.
Вы можете использовать row_number()
для случайного перечисления строк, а затем просто фильтровать:
select t.*
from (select t.*,
row_number() over (partition by city, age, gender order by rand()) as seqnum
from t
) t
where (age in ('18-25', '75+') and
(gender = 'female' and seqnum <= 24 or
gender = 'male' and seqnum <= 20
)
) or
(age not in ('18-25', '75+') and
(gender = 'female' and seqnum <= 47 or
gender = 'male' and seqnum <= 40
)
)
Привет @Гордон Линофф. Это, в сочетании с другими ответами на потоковые сообщения (фактически 3 сообщения), смогло решить мою проблему. Чтобы получить другие части случайного выбора, мне нужно выполнить тот же запрос, изменить диапазон age
и seqnum
чисел, а затем выполнить запрос union all
, верно?
@PedroPabloSeverinHonorato . . . Я думаю, что неправильно понял исходный вопрос. Я изменил ответ. Union all
всё равно не надо. . . просто сложная логика фильтрации.
пример данных пожалуйста и ожидаемый результат! так что мы можем помочь :о)