Как заполнить нулевые значения, используя последнюю заливку для того же идентификатора в psql?

У меня есть фрейм данных в PostgreSQL, как показано ниже, и мне нужна последняя запись для каждого идентификатора, если какая-либо последняя запись для каждого идентификатора содержит значение NULL в любом столбце, я хочу заменить его следующим последним значением в том же столбце

данные

id    ingdt         code  gender  address   
1     27-10-2018    NULL  NULL    street1    
1     24-10-2018    1234  NULL    street2
1     20-08-2017    3245  M       street2
2     24-09-2018    NULL  F       Astreet
2     24-10-2018    2857  F       Bstreet
3     24-08-2018    3489  M       NULL
3     22-08-2018    5802  M       Cstreet

Ожидаемый результат

final_output

id    ingdt         code  gender  address   
1     27-10-2018    1234  M       street1   
2     24-10-2018    2857  F       Bstreet
3     24-08-2018    3489  M       Cstreet

Пытался

insert into final_output select * from (
(select code, id from data where code != null order by ingdt limit 1) x join
(select gender, id from data where gender != null order by ingdt limit 1) y join 
(select address, id from data where address != null order by ingdt limit 1)z on y.id=x.id)
2
0
108
1

Ответы 1

демонстрация: db <> рабочий пример

Использование оконные функции может помочь вам:

SELECT DISTINCT
    id, 
    max(ingdt) OVER (PARTITION BY id),
    first_value(code) OVER (PARTITION BY id ORDER BY code IS NULL, ingdt DESC) AS code,
    first_value(gender) OVER (PARTITION BY id ORDER BY gender IS NULL, ingdt DESC) AS gender,
    first_value(address) OVER (PARTITION BY id ORDER BY address IS NULL, ingdt DESC) AS address
FROM mytable
ORDER BY id

Объясняя first_value(...) OVER (...):

Оконная функция может группировать ваши строки в отдельные фреймы. Это делается ключевым словом PARTITION BY. В этом случае я генерирую кадры для каждого id.

Теперь я проверяю, соответствует ли значение столбца NULL. Это дает мне true или false. Я сортирую этот результат, как любой столбец boolean, сначала с false (имеется в виду NOT NULL). Если строк NOT NULL много, берется последняя строка (ingdt DESC). Этот заказ также выполняется для каждого кадра отдельно.

first_value() вычисляет первое значение упорядоченного кадра.

Другие вопросы по теме