У меня есть строка, содержащая правильные слова и некоторую тарабарщину, не имеющую никакого смысла для читателя. Я хочу удалить эти ненормальные слова из строки. Обратите внимание, что это всего лишь образцы слов, их множество в строке. Пример:
0xe933b1dfab45d591 0xe7d363050cec0146
0xf5e4005d43867c48 0x1e0b75e9dff872f5
0xa46406ec8a4e6cdc 0x3ea14cfd28ccf8fe
0x750b065d3715b1c8 0x6bb50ebe411dd5da
0xd46b6c46a37f4578 0x15b9290f631cded2
0xafcfd4f9daa2187e 0x9dcc5dbad77c926a AEj_0IB_BpqtlN76JnAdUQ0gWWYXEzVQrFBrGQ 0ahUKEwjj09PGppLeAhXUZSsKHZltBc8Q61gI1QIoBzAF
Я удалил лишние символы, такие как +, -, ', используя следующее:
text = re.sub(r'[^\w]', ' ', text)
но я не мог найти способ удалить эти символы. Нужна помощь . Спасибо.
не могли бы вы уточнить? я просто хочу удалить нечитаемые слова из строки
что определяет их нечитаемость? Они не стоят в английском словаре или по какому критерию?
Что ж, "l33tsp34k" может показаться вам ненормальным, но есть много людей, которые смогут понять его значение.
Все ли «ненормальные» слова начинаются с «0x» и находятся ли они в отдельных строках, как показано выше? Пожалуйста, улучшите свой вопрос. См. Эту ссылку: stackoverflow.com/help/how-to-ask
да, я понимаю это, но я просто хочу различать их, основываясь на том, что в обычных английских словах нет чисел. Либо там просто числа, либо либо слово. Для нормальных критериев.
Расположены ли другие цепочки слов, как в реальном предложении? Или они вместе, без пробелов?
да, есть и другие цепочки слов, но они не похожи на предложения.






Это работает для вас?
newtext = ""
for word in text.split():
if not(any(char.isdigit() for char in word) and any(char.isalpha() for char in word)):
newtext += word + " "
Это проверяет, содержит ли строка, разделенная пробелами в вашем тексте, буквы и цифры. А если этого не происходит, они помещаются в новую строку.
отредактировал его, выбрал неправильные случаи, теперь он работает на моем компьютере, для вас?
это сделало это. Спасибо большое, что спасли мою шею.
Что определяет слово
abnormal?