Как удалить ненормальные слова из строки, например '0xd46b6c46a37f4578' или 'jrLJW PUNtTLrQGZ25X4DA' - python

У меня есть строка, содержащая правильные слова и некоторую тарабарщину, не имеющую никакого смысла для читателя. Я хочу удалить эти ненормальные слова из строки. Обратите внимание, что это всего лишь образцы слов, их множество в строке. Пример:

0xe933b1dfab45d591 0xe7d363050cec0146
0xf5e4005d43867c48 0x1e0b75e9dff872f5
0xa46406ec8a4e6cdc 0x3ea14cfd28ccf8fe
0x750b065d3715b1c8 0x6bb50ebe411dd5da
0xd46b6c46a37f4578 0x15b9290f631cded2
0xafcfd4f9daa2187e 0x9dcc5dbad77c926a AEj_0IB_BpqtlN76JnAdUQ0gWWYXEzVQrFBrGQ 0ahUKEwjj09PGppLeAhXUZSsKHZltBc8Q61gI1QIoBzAF

Я удалил лишние символы, такие как +, -, ', используя следующее:

text = re.sub(r'[^\w]', ' ', text)

но я не мог найти способ удалить эти символы. Нужна помощь . Спасибо.

Что определяет слово abnormal?

Sayse 19.10.2018 12:55

не могли бы вы уточнить? я просто хочу удалить нечитаемые слова из строки

Ashutosh Roy 19.10.2018 12:56

что определяет их нечитаемость? Они не стоят в английском словаре или по какому критерию?

dhae 19.10.2018 12:57

Что ж, "l33tsp34k" может показаться вам ненормальным, но есть много людей, которые смогут понять его значение.

Sayse 19.10.2018 12:59

Все ли «ненормальные» слова начинаются с «0x» и находятся ли они в отдельных строках, как показано выше? Пожалуйста, улучшите свой вопрос. См. Эту ссылку: stackoverflow.com/help/how-to-ask

Nick 19.10.2018 12:59

да, я понимаю это, но я просто хочу различать их, основываясь на том, что в обычных английских словах нет чисел. Либо там просто числа, либо либо слово. Для нормальных критериев.

Ashutosh Roy 19.10.2018 13:02

Расположены ли другие цепочки слов, как в реальном предложении? Или они вместе, без пробелов?

def_init_ 19.10.2018 13:04

да, есть и другие цепочки слов, но они не похожи на предложения.

Ashutosh Roy 19.10.2018 13:08
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
3
8
86
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Это работает для вас?

newtext = ""
    for word in text.split():
       if not(any(char.isdigit() for char in word) and any(char.isalpha() for char in word)):
           newtext += word + " "

Это проверяет, содержит ли строка, разделенная пробелами в вашем тексте, буквы и цифры. А если этого не происходит, они помещаются в новую строку.

отредактировал его, выбрал неправильные случаи, теперь он работает на моем компьютере, для вас?

dhae 19.10.2018 13:35

это сделало это. Спасибо большое, что спасли мою шею.

Ashutosh Roy 19.10.2018 13:39

Другие вопросы по теме