Фильтровать строки на основе комбинации слов

У меня есть фрейм данных со столбцом, состоящим из слов, разделенных запятыми. Я хочу фильтровать строки с точным сочетанием слов

text
a,boy,and,a,girl
mummy, and, papa
teach, learn
teach, learn
teach

например: я хочу строки с учить, только учиться

какой язык вы используете? Python или R?

Sociopath 31.07.2018 13:01

любой из них, желательно r

anant saxena 31.07.2018 13:02
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
2
2
64
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Попробуй это

df <- data.frame(column_name = c("text", "a,boy,and,a,girl", "teach", "teach, learn"))

Это дает то, как будет выглядеть фрейм данных. Затем вы можете сделать следующий фильтр, используя пакет dplyr:

test <- df %>% filter(grepl("teach|text", column_name))

data.frame (column_name = c ("a, boy, and, a, girl", "учить", "учить, учиться")) test <- df%>% filter (grepl ("учить | текст", имя_столбца) ). Это дает и «учить», и «учить, учиться», тогда как я хочу только «учить, учиться»

anant saxena 31.07.2018 13:18

результат команды ur - имя_столбца 1 учить 2 учить, учить, тогда как я хочу только учить, учить

anant saxena 31.07.2018 13:21

как искать, если у меня есть и учить, и учить, и учить, учить в двух разных строках, какое должно быть решение. поскольку grepl ищет шаблон. Должен ли я использовать оба шаблона или их можно сократить?

anant saxena 31.07.2018 13:41

Попробуйте это: df <- data.frame(column_name = c("text", "a,boy,and,a,girl", "teach", "teach, learn", "learn, teach"))test <- df %>% filter(grepl("teach |learn", column_name))

gabzo 31.07.2018 13:52

Другие вопросы по теме