Как подтвердить, что строка является версией чего-то или нет?

К вашему сведению, это не дубликат, пожалуйста, удалите этот тег.

Пробовал packaging.version.Version не работает на 1.0.2h и 192.168.0.3.

Вопрос

Я получаю версии разных библиотек/двоичных файлов в списке. И этот список включает в себя несколько мусорных значений версии наряду с правильной. Я хочу написать код Python, который может отделять правильные версии от списка версий.

Пожалуйста, предложите логику или библиотеку python, которая может сделать следующее

Псевдокод

Correct_verList = []

verList = ['2.6.36', '1.2.dfgdf', '1.sdfsdgsdsf', '3.0/0+3*/1,-/0/0,//O*K1', 'so.802', '5.0(side)', '6.2*20hm' , '192.168.0.222', '1.33', '0.97a', '1.0.2h', '2.4.2b3']

#Psuedo Code
for ver in verList: 
    if ver is the correct version:
         Correct_verList.append(ver)

print(Correct_verList)

Ожидаемый результат

Correct_verList = [1.33, 0.97a, 2.6.36, 1.0.2h, 2.4.2b3]

@DeveshKumarSingh, дорогой, это другое, так как нужно выяснить, является ли строка версией или нет. а ты предложил сравнение версий.

Umair 29.05.2019 08:58

Если вы снова посмотрите на ответ, version.Version("1.3.xy123") проверит, является ли строка действительной версией или нет.

Devesh Kumar Singh 29.05.2019 08:59
packaging.version.Version вроде не позволяет 1.0.2h.
tfw 29.05.2019 09:17
packaging.version.Version говорит, что 192.168.0.12 это версия, на самом деле это не версия.
Umair 29.05.2019 09:21

Невозможно добавить ответ из-за дубликата, но если ваше требование очень конкретно состоит из числа, за которым следует точка, за которой следует комбинация букв и цифр, за которой может следовать точка, и комбинация букв и цифр, вы можете решить это с помощью регулярное выражение, что-то вроде import re; result = [x for x in verList if re.fullmatch('\d+\.\w+(\.\w+)?', x)]

tfw 29.05.2019 09:42

@tfw этот код работает для данного списка. Но это слишком специфично для данного списка. Там написано 2.sfufdf, 2.34e.34e и 2.0.xxxdd версии, но это не так. И похоже, что я ничего не могу сделать с дубликатом, это зависит от @DeveshKumarSingh

Umair 29.05.2019 10:08

Ваши требования все еще не очень ясны для меня, но, возможно, вместо этого их могло бы решить выражение (\d+\.){1,2}\d+\w*. Кроме того, как предложил ответчик, я рекомендую вам прочитать документацию для RegEx и немного поэкспериментировать с ней, например. через регулярное выражение101 или RegExr.

tfw 29.05.2019 11:08
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
7
74
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

То, что вы ищете, называется регулярное выражение. Эта ссылка предоставляет вам документацию по регулярному выражению Python.

Это регулярное выражение может выполнить эту работу: '(([0-9]+[.]){1,2}([0-9]*([0-9]|[a-z]){0,2}[0-9]+)'

Что вы можете сделать, так это использовать метод findall() и проверить, является ли результат той же строкой, которую вы тестировали. Код будет таким (я его не тестировал):

import re
Correct_verList = []

verList = ['2.6.36', '3.0/0+3*/1,-/0/0,//O*K1', 'so.802', '5.0(side)', '6.2*20hm' , '192.168.0.222', '1.33', '0.97a', '1.0.2h', '2.4.2b3']

for ver in verList:
    a=re.findall('(([0-9]+[.]){1,2}([0-9]*([0-9]|[a-z]){0,2}[0-9]+)',ver)
    if len(a)!=0:
       if a[0][0]==ver:
           Correct_verList.append(ver)
print(Correct_verList)

Это регулярное выражение не будет соответствовать всем его требованиям. Обратите внимание, что буквы могут быть включены в последний сегмент.

tfw 29.05.2019 08:58

@tfw вы правы, в последнем символе сегмента также возможен

Umair 29.05.2019 08:59

@Umair исправил. Соответствует ли он вашим требованиям?

TUI lover 29.05.2019 09:15

@TUIlover, в коде ошибка.

Umair 29.05.2019 09:46

@Umair исправил. Тем не менее, вы не объяснили, почему 192.168.0.12 не должно быть в списке, и мой код не исключает его

TUI lover 29.05.2019 10:02

@TUIlover 192.168.0.12 — это IP-адрес. К вашему сведению, версия имеет максимум три сегмента.

Umair 29.05.2019 10:06

@Umair теперь должно работать

TUI lover 29.05.2019 10:13

Спасибо @TUIlover, это работает. Не могли бы вы ограничить количество символов, появляющихся в последнем сегменте, максимум двумя. Например, 1.2.dfgdf и 1.sdfsdgsdsf не являются версиями.

Umair 29.05.2019 10:19

@Umair Вместо этого вы должны использовать это регулярное выражение: '(([0-9]+[.]){1,2}([0-9]*([0-9]|[a-z]){0,2}[0-9]+)'. Я настоятельно рекомендую вам прочитать это. 7.2.1. Раздел короткий и очень полезный, так как регулярные выражения реализованы таким образом во многих языках. Если вы считаете, что на вопрос дан ответ, пожалуйста, проголосуйте за ответ и отметьте вопрос как отвеченный.

TUI lover 29.05.2019 10:27

@TUIlover Наконец-то я это сделал...RegEx это потрясающая библиотека. Спасибо, я сделаю это.

Umair 07.06.2019 23:07

Другие вопросы по теме