Создать фиктивный столбец на основе других столбцов

Допустим, у меня есть этот набор данных

> example <- data.frame(a = 1:10, b = 10:1, c = 1:5 )

Я хочу создать новую переменную d. Я хочу, чтобы в d значение 1, когда хотя бы в одной из переменных a b c присутствует значение 1 2 или 3. d должен выглядеть так:

d <- c(1, 1, 1, 0, 0, 1, 1, 1, 1, 1)

Заранее спасибо.

r multiple-columns dummy-variable

27.04.2018 11:36

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

1 474

Ответы 7

Вы можете сделать это с помощью apply (хотя и немного медленно)

Логика: any будет сравнивать, присутствуют ли какие-либо 1,2 или 3 или нет, apply используется для повторения этой логики в каждой из строк. Затем, наконец, преобразование логического результата в числовое, добавив +0 (вы можете выбрать здесь as.numeric, если хотите быть более выразительным)

d <- apply(example,1 ,function(x)any(x==1|x==2|x==3))+0

Если кто-то хочет ограничить столбцы или запустить логику для некоторых столбцов, то это также можно сделать:

d <- apply(example[,c("a","b","c")], 1, function(x)any(x==1|x==2|x==3))+0

Здесь у вас есть контроль над столбцами, которые следует принимать или игнорировать в зависимости от ваших потребностей.

Выход:

> d
 [1] 1 1 1 0 0 1 1 1 1 1

Спасибо за быстрый ответ. Что, если бы у меня была 4-я переменная, но мне все равно, что там. При "любых" значениях 1,2,3 в четвертой переменной также будут учитываться ....

— 27.04.2018 11:51

@AmelioTornincasa, Да, это будет повторяться для каждой переменной, присутствующей в вашем data.frame

— 27.04.2018 12:04

27.04.2018 11:42

Вы можете использовать rowSums, чтобы получить логический вектор 1, 2 or 3, появляющийся в каждой строке, и обернуть его в as.integer для преобразования в 0 и 1, т.е.

as.integer(rowSums(df == 1|df == 2| df == 3) > 0)
#[1] 1 1 1 0 0 1 1 1 1 1

27.04.2018 11:51

Попробуйте этот метод, проверьте, есть ли в каком-либо столбце один элемент в списке x.

x<-c(1,2,3)
example$d<-as.numeric(example$a %in% x | example$b %in% x | example$c %in% x)
example
    a  b c d
1   1 10 1 1
2   2  9 2 1
3   3  8 3 1
4   4  7 4 0
5   5  6 5 0
6   6  5 1 1
7   7  4 2 1
8   8  3 3 1
9   9  2 4 1
10 10  1 5 1

Это то, что я искал. Спасибо :)

— 27.04.2018 12:06

Это лучший ответ - простой, быстрый, понятный код. Не уверен, почему он был отклонен. Использование apply, dplyr и т. д. Здесь излишне. Если бы у вас было 10 столбцов, все могло бы быть иначе.

— 27.04.2018 13:26

Спасибо @ dash2. Все остальные ответы работают хорошо, но в моем случае спрашивающий может также найти вывод, интегрированный в его исходный data.frame, и я полагаю, что это то, что он хочет.

— 27.04.2018 14:36

27.04.2018 11:54

Будет работать с любым количеством варов:

example <- data.frame(a = 1:10, b = 10:1, c = 1:5 )
x <- c(1, 2, 3)
as.integer(Reduce(function(a, b) (a %in% x) | (b %in% x), example))

27.04.2018 12:05

Две другие возможности, которые работают с любым количеством столбцов:

#option 1
example$d <- +(rowSums(sapply(example, `%in%`, 1:3)) > 0)

#option 2
library(matrixStats)
example$d <- rowMaxs(+(sapply(example, `%in%`, 1:3)))

которые оба дают:

> example
    a  b c d
1   1 10 1 1
2   2  9 2 1
3   3  8 3 1
4   4  7 4 0
5   5  6 5 0
6   6  5 1 1
7   7  4 2 1
8   8  3 3 1
9   9  2 4 1
10 10  1 5 1

27.04.2018 12:18

В пакете dplyr:

library(dplyr)
x <- 1:3
example %>% mutate(d = as.integer(a %in% x | b %in% x | c %in% x))

27.04.2018 12:32

общее решение:

example %>%
sapply(function(i)i %in% x) %>% apply(1,any) %>% as.integer
#[1] 1 1 1 0 0 1 1 1 1 1

27.04.2018 12:58

Другие вопросы по теме

Сравните два столбца и верните значение из третьего

Как применить «цикл for» во всех столбцах R?

Css - три столбца, одинакового размера на больших устройствах, центральный элемент для перехода вверх и два других ниже на меньших устройствах

Cor.test пропущенные имена столбцов в r

Фильтр по нескольким столбцам с переменными

Несколько строк PHP для одной записи в 1 строку с несколькими столбцами

R - применить одно условие к нескольким столбцам

Как проверить разницу для данных, хранящихся в одном столбце в R?

Суммируйте все значения в каждом столбце bash

Можно ли создать пользовательский интерфейс с табличным представлением с двумя столбцами?

Создать фиктивный столбец на основе других столбцов

Ответы 7

Другие вопросы по теме

Похожие вопросы