Объединить две таблицы данных на основе сопоставления с образцом

Данный:

library(data.table)
dat1 <- setDT(data.frame(pat=c("A.C",".BC"),val=c(1,2)))
dat2 <- setDT(data.frame(q=c("ABC","AXC","XBC"),val2=c(10,11,12)))

Я хочу, чтобы результат был:

dat3 <- setDT(data.frame(pat=c("A.C","A.C",".BC",".BC"),val=c(1,1,2,2),q=c("ABC","AXC","ABC","XBC"),val2=c(10,11,10,12)))
dat3
   pat val   q val2
1: A.C   1 ABC   10
2: A.C   1 AXC   11
3: .BC   2 ABC   10
4: .BC   2 XBC   12

Другими словами, левое соединение dat1 с dat2 для каждого совпадения шаблона регулярного выражения pat со строкой запроса q
Мне было интересно, возможно ли это с помощью краткого выражения слияния data.table, т.е.

dat1[dat2, .(pat, val, q, val2), on= .(grepl(pat,q))] # this does not work

или любой другой data.table трюк для эффективности. На самом деле dat1 — это сотни строк, а dat2 может быть 10–100 тысяч строк.
Это звучит достаточно просто, но я не нашел поста, который полностью освещал бы эту тему.

Самое близкое, что мне удалось сделать, это следующее:

match_pat_to_q <- function(pattern, data, data.col = "q"){
  ret<-lapply(pattern, function(x){
    data[grepl(x,get(data.col))]
  })
  names(ret) <- pattern # becomes an .id column in next step
  rbindlist(ret, idcol=TRUE)
}

match_pat_to_q(dat1$pat, dat2)[dat1, on=.(.id==pat)]

   .id   q val2 val
1: A.C ABC   10   1
2: A.C AXC   11   1
3: .BC ABC   10   2
4: .BC XBC   12   2

r merge data.table

31.05.2024 16:00

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете решить свою проблему следующим образом:

dat1[, dat2[grep(pat, q), .(val, x=q, val2)], by=pat]

      pat   val      x  val2
   <char> <num> <char> <num>
1:    A.C     1    ABC    10
2:    A.C     1    AXC    11
3:    .BC     2    ABC    10
4:    .BC     2    XBC    12

Вы группируете dat1 по pat. Это позволяет логически создать одну группу для каждого шаблона в dat1. Затем для каждой группы вы фильтруете соответствующие данные из dat2, используя сопоставление с образцом, одновременно выбирая необходимые переменные.

31.05.2024 16:26

Другие вопросы по теме

Соедините два фрейма данных, используя последнюю строку из каждой группы

Как написать полифил для сортировки массива, используя метод сортировки слиянием

Polars `join_asof` с повторяющимися значениями `by`

Как выполнять перекрестные запросы к базе данных и вставки с помощью SQL в Azure

Как объединить несколько данных по строкам и столбцам?

Объединение таблиц Power Query

Использование составной функции пакета node js Sharp не дает анимированного результата

Объединение двух фреймов данных по значению столбца и имени столбца

Как объединить/объединить две строки после того, как длинные столбцы были неправильно прочитаны в отдельные строки?

Объединить два кадра данных с разными заголовками

Объединить две таблицы данных на основе сопоставления с образцом

Ответы 1

Другие вопросы по теме

Похожие вопросы