Если у меня есть такая строка, как
«17:31:51 до 134 дней, 11:26, 1 пользователь, средняя нагрузка: 0,22, 0,15, 0,10»
как лучше всего извлечь в конце только средние значения нагрузки x3? Я написал регулярное выражение, которое делает это, но является ли это наиболее эффективным / самым быстрым методом?
>>> s = "17:31:51 up 134 days, 11:26, 1 user, load average: 0.22, 0.15, 0.10"
>>> print re.findall(r"([0-9]\.\d+)", s)
['0.22', '0.15', '0.10']
Это должно работать:
# s is the string to parse
loadavg = [float(x) for x in s.rsplit('load average: ', 1)[1].split(', ')]
У вас есть такая же информация в специальном файле /proc/loadavg
, поэтому вы можете:
>>> open("/proc/loadavg").readline().split(" ")[:3]
Неужели выходное время безотказной работы тоже отличалось?
Кажется, твой путь в порядке. Если вы хотите избежать регулярных выражений, вы можете сделать что-то вроде
>>> print s.split(': ')[1].split(', ')
['0.22', '0.15', '0.10']
Я бы определенно использовал регулярное выражение. Возможно, вы могли бы немного повысить эффективность, сначала вызвав s.find('load average')
и начав сопоставление регулярного выражения с этой позиции, а не с начала строки (что по умолчанию).
На самом деле, мне больше нравится способ Адама.
Регулярное выражение - это способ. Но, может быть, более надежно:
re.search(r"load average: (\d+.\d\d), (\d+.\d\d), (\d+.\d\d)$", s).groups()
Если вы не делаете это очень часто в замкнутом цикле, вам не нужно беспокоиться о производительности. Ясность - вот что самое главное. И я бы сказал, что это регулярное выражение трудно превзойти.
Думайте об этом как о строке формата. Ясно как можно ясно, не так ли?
Или, если вы действительно ищете средние значения нагрузки, то в Python 2.3+ у вас есть:
import os
os.getloadavg()
Не стоит беспокоиться об оптимизации регулярных выражений. Вызов os.system ('uptime'), который вы, кажется, используете, занимает примерно в 1000 раз больше времени, чем вызов re.findall. hans.gerwitz.com/2004/08/12/…