Извлечение арабского числа из текстового файла

У меня есть текстовый файл, который включает ")رقم : ٤٢٢٧ ٢٢٤" . Я использую этот код для извлечения ٢٢٤٤٢٢٧ :

 arabic_num = re.search(r':([\d\s]+)', text, re.UNICODE)
    arabic_num = arabic_num.group(1)
    arabic_num = arabic_num.replace(' ', '')

Но вывод неверный ٤٢٢٧٢٢٤. Это происходит, когда я удаляю пробел между ٢٢٤ и ٤٢٢٧. Как я могу это исправить, имея в виду, что любые арабские цифры могут быть между : и ), а иногда число в текстовом файле не включает пробелы между цифрами.

python regex string ocr

20.06.2023 16:21

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Это регулярное выражение захватит все между ")" и ":"

text = ")رقم : ٤٢٢٧ ٢٢٤"
arabic_num = re.search(r'\).*\:', text, re.UNICODE)

и если вам не нужны ")", ":" и пробел, вы можете удалить:

arabic_num.group().strip(")").strip(":").replace(" ", "")

Спасибо. Но я хочу, чтобы вывод был ٢٢٤٤٢٢٧ не ٢٢٤ ٤٢٢٧ . Обратите внимание, что текстовая переменная в вашем коде не является строкой в вопросе.

— 20.06.2023 17:08

Обновлено до правильной строки, но концепция аналогична. Вы можете добавить .replace(' ', ''), чтобы удалить пробелы

— 20.06.2023 17:13

20.06.2023 16:47

Другие вопросы по теме

Извлечение арабского числа из текстового файла

Разделить строку без учета специальных символов

Регулярное выражение для остановки при первом совпадении одного или другого символа

Как сопоставить строку между квадратными скобками, включая экранированные квадратные скобки?

Как сопоставить определенный шаблон с регулярным выражением в сериализованной строке

Безопасное экранирование метасимволов регулярных выражений Raku

Как я могу разделить строку с помощью пользовательского регулярного выражения? (Я просто не могу понять правильное регулярное выражение, пожалуйста, помогите)

Скрипт Bash не обрабатывает регулярное выражение

Мне нужно регулярное выражение для управления шаблоном ввода 2 цифры-пробел-2 буквы-пробел-3 цифры

Захват данных в регулярном выражении в python 3.11

Извлечение арабского числа из текстового файла

Ответы 1

Другие вопросы по теме

Похожие вопросы