Я пишу скрипт, который ищет регулярное выражение в одном или нескольких входных файлах. Если входной файл не указан (или вместо файла есть "-"
), он должен искать в stdin
.
Пример: myscript.py [-h] [-u | -c | -m] [infile [infile ...]] regex
Чего я не понимаю, так это того, как это отличает имя файла от регулярного выражения?
Допустим, я набираю myscript.py file1 file2 regex
. Откуда он знает, что regex
— это регулярное выражение, а не другой файл?
Мой код выглядит следующим образом:
def init_parser():
parser = argparse.ArgumentParser(
description = "The script searches one or more named input files for lines\
containing a match to a regular expression pattern."
)
parser.add_argument(
'-f','--infile', nargs='*', type=argparse.FileType('r'), default='-',
help='the name of the file(s) to search.'
)
parser.add_argument('regex', help='the regular expression.')
group = parser.add_mutually_exclusive_group()
group.add_argument(
'-u', '--underscore', action='store_true',
help='prints "^" under the matching text.'
)
group.add_argument(
'-c', '--color', action='store_true',
help='highlights matching text.'
)
group.add_argument(
'-m', '--machine', action='store_true',
help='generates machine readable output.'
)
return parser
Поскольку нет флагов для указания регулярного выражения, сценарий не может различать файлы и регулярное выражение. Если я не укажу файл (потому что я хочу, чтобы он читался из stdin
), он думает, что мое регулярное выражение является файлом, и не работает.
ИЛИ сначала поставьте регулярное выражение (предположительно, оно всегда указано), тогда infile может взять остальные позиционные аргументы
Предполагая, что у вас всегда будет регулярное выражение в командной строке, если вы сначала поместите аргумент регулярного выражения, а затем infile, это примет другие указанные вами позиционные аргументы:
parser.add_argument('regex', help='the regular expression.')
parser.add_argument('infile', nargs='*', type=argparse.FileType('r'), help='the name of the file(s) to search.')
Вы сами ответили на свой вопрос в последней его части: «Поскольку нет флагов для указания регулярного выражения, скрипт не может различать файлы и регулярное выражение». Чтобы исправить это, добавьте спецификацию флага/аргумента для регулярного выражения до файлов:
myscript.py -r regex [-h] [-u | -c | -m] [infile [infile ...]]