Что такое Pythonic способ дополнить числовую строку нулями слева, т.е. чтобы числовая строка имела определенную длину?






Помимо zfill, вы можете использовать общее форматирование строк:
print(f'{number:05d}') # (since Python 3.6), or
print('{:05d}'.format(number)) # or
print('{0:05d}'.format(number)) # or (explicit 0th positional arg. selection)
print('{n:05d}'.format(n=number)) # or (explicit `n` keyword arg. selection)
print(format(number, '05d'))
Документация для форматирование строки и ф-струны.
@zwirbeltier PEP 3101 объясняет, как использовать формат, это то, что я имел в виду.
«РЕДАКТИРОВАТЬ» по-прежнему гласит: «… этот метод форматирования не рекомендуется…».
@zwirbeltier Да, и он устарел. Но прямо в PEP об этом не говорится. В документации, однако, говорится, что вместо этого следует использовать format, и люди обычно интерпретируют это как намерение отказаться от поддержки.
Документы: обратная совместимость - обратную совместимость можно поддерживать, оставив существующие механизмы на месте. Новая система не конфликтует ни с одним из имен методов существующих методов форматирования строк, поэтому обе системы могут сосуществовать до тех пор, пока не придет время отказаться от старой системы.
@Konrad: «Однако в документации рекомендуется использовать формат». Я знаю, что опаздываю на вечеринку, но мне хотелось бы узнать, что вы имеете в виду. В документации, которую я вижу (docs.python.org/3/library/stdtypes.html#old-string-formatti ng), говорится, что использование format или других альтернатив «может помочь избежать [вышеупомянутых] ошибок», связанных с интерполяцией %. Это не очень надежная «осужденность».
@LarsH Что ж, примечательно, что ссылка в моем ответе изначально указывала на форматирование %. Теперь он указывает на форматирование str.format. Ссылку не менял! Скорее был переписан веб-сайт документации Python за этой ссылкой. Кроме того, в документации использовались более строгие формулировки буквально заявляет, что str.format «должен быть предпочтительнее форматирования %», как я написал в цитируемом вами комментарии.
Да уж. Учитывая, что «устаревший» имеет официальное значение в мире Python, а % еще официально не является устаревшим, формулировка в вашем ответе вводит в заблуждение. Намерение отказаться от рекомендаций в будущем, да: docs.python.org/3/whatsnew/3.0.html?highlight=deprecated «Планируется, в конечном итоге, сделать этот API единственным API для форматирования строк, а начать не рекомендовать - оператором% в Python 3.1».
@LarsH Спасибо, что нашел это. Таким образом, они сильно отстают от графика (Python 3.1 не в будущем, он в далеком прошлом). Учитывая это, я все еще не думаю, что ответ вводил в заблуждение, просто не обновлялся строго каждый раз, когда график разработки Python менялся в новом, произвольном направлении. В любом случае, это дало мне возможность удалить из своего ответа некоторые неактуальные и устаревшие вещи.
Спасибо за обновление ответа. Вы правы, я как-то упустил тот факт, что 3.1 не в будущем (я использовал 3.7.x ... да!). Я предполагаю, что я просто хотел сказать, что отказ от% был явно запланирован, хотя официально этого никогда не было.
Струны:
>>> n = '4'
>>> print(n.zfill(3))
004
А для чисел:
>>> n = 4
>>> print(f'{n:03}') # Preferred method, python >= 3.6
004
>>> print('%03d' % n)
004
>>> print(format(n, '03')) # python >= 2.6
004
>>> print('{0:03d}'.format(n)) # python >= 2.6 + python 3
004
>>> print('{foo:03d}'.format(foo=n)) # python >= 2.6 + python 3
004
>>> print('{:03d}'.format(n)) # python >= 2.7 + python3
004
Документация по форматированию строк.
Комментарии python >= 2.6 неверны. Этот синтаксис не работает на python >= 3. Вы можете изменить его на python < 3, но могу ли я предложить вместо этого всегда использовать круглые скобки и полностью опускать комментарии (поощряя рекомендуемое использование)?
Обратите внимание, что вам не нужно нумеровать строки формата: '{:03d} {:03d}'.format(1, 2) неявно присваивает значения по порядку.
@ JasonR.Coombs: Я полагаю, вы имели в виду оператор print, когда это должна быть функция print на Python 3? Я редактировал в скобках; поскольку печатается только одна вещь, теперь она работает идентично на Py2 и Py3.
Можно ли адаптировать любой из этих подходов для работы с переменным количеством нулей?
Как вы могли не использовать цифру 7 в своем примере?!? ?
@Nickolay есть один очевидный способ, последний.
Для переменного количества нулей?
width = 10
x = 5
print "%0*d" % (width, x)
> 0000000005
См. Печатную документацию для получения всех интересных подробностей!
Обновление для Python 3.x (7,5 лет спустя)
Эта последняя строка теперь должна быть:
print("%0*d" % (width, x))
Т.е. print() теперь является функцией, а не утверждением. Обратите внимание, что я все еще предпочитаю стиль Old School printf(), потому что, IMNSHO, он читается лучше, и потому, что, ммм, я использую эту нотацию с января 1980 года. Что-то ... старые собаки ... что-то что-то ... новые трюки .
с 1980 года ... так вы 60-летний программист ... не могли бы вы дать более подробное объяснение того, как "%0*d" % (width, x) интерпретируется Python?
Просто используйте метод Rjust строкового объекта.
В этом примере будет сделана строка из 10 символов с дополнительным заполнением по мере необходимости.
>>> t = 'test'
>>> t.rjust(10, '0')
>>> '000000test'
Для почтовых индексов, сохраненных как целые числа:
>>> a = 6340
>>> b = 90210
>>> print '%05d' % a
06340
>>> print '%05d' % b
90210
Вы правы, и в любом случае мне больше нравится ваше предложение с zfill
str(n).zfill(width) будет работать с string, int, float ... и совместим с Python 2.Икс и 3.Икс:
>>> n = 3
>>> str(n).zfill(5)
'00003'
>>> n = '3'
>>> str(n).zfill(5)
'00003'
>>> n = '3.0'
>>> str(n).zfill(5)
'003.0'
>>> '99'.zfill(5)
'00099'
>>> '99'.rjust(5,'0')
'00099'
если хотите обратного:
>>> '99'.ljust(5,'0')
'99000'
просто ljust в строке, заключенной вручную. Спасибо
Вы также можете повторить «0», добавить его к str(n) и получить крайний правый срез ширины. Быстрое и грязное выражение лица.
def pad_left(n, width, pad = "0"):
return ((pad * width) + str(n))[-width:]
Однако это работает только для положительных чисел. Если вам тоже нужны негативы, все станет немного сложнее. Но это выражение подходит для быстрой и грязной работы, если вы не против таких вещей.
Я абсолютно не понимаю, почему это отклонено. Если это потому, что он не работает с отрицательными числами, достаточно честно, но подавляющая причина, по которой можно было бы оставить панель с нулями, - это номера идентификаторов. Если у вас отрицательные идентификационные номера, я думаю, у вас большие проблемы ... вы ожидаете, что ваш блокнот будет иметь форму «00000-1234»? или -000001234? Честно говоря, этот ответ работает: он простой, чистый, расширяемый. Возможно, это не zfill, но если он отвечает на вопрос, за него следует проголосовать.
Для Python 3.6+ с использованием f-строк:
>>> i = 1
>>> f"{i:0>2}" # Works for both numbers and strings.
'01'
>>> f"{i:02}" # Works only for numbers.
'01'
Для Python 2 - Python 3.5:
>>> "{:0>2}".format("1") # Works for both numbers and strings.
'01'
>>> "{:02}".format(1) # Works only for numbers.
'01'
Для тех, кто пришел сюда, чтобы понять, а не просто быстрый ответ. Я делаю это специально для временных строк:
hour = 4
minute = 3
"{:0>2}:{:0>2}".format(hour,minute)
# prints 04:03
"{:0>3}:{:0>5}".format(hour,minute)
# prints '004:00003'
"{:0<3}:{:0<5}".format(hour,minute)
# prints '400:30000'
"{:$<3}:{:#<5}".format(hour,minute)
# prints '4$$:3####'
"0" symbols what to replace with the "2" padding characters, the default is an empty space
">" symbols allign all the 2 "0" character to the left of the string
":" symbols the format_spec
Быстрое сравнение времени:
setup = '''
from random import randint
def test_1():
num = randint(0,1000000)
return str(num).zfill(7)
def test_2():
num = randint(0,1000000)
return format(num, '07')
def test_3():
num = randint(0,1000000)
return '{0:07d}'.format(num)
def test_4():
num = randint(0,1000000)
return format(num, '07d')
def test_5():
num = randint(0,1000000)
return '{:07d}'.format(num)
def test_6():
num = randint(0,1000000)
return '{x:07d}'.format(x=num)
def test_7():
num = randint(0,1000000)
return str(num).rjust(7, '0')
'''
import timeit
print timeit.Timer("test_1()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_2()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_3()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_4()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_5()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_6()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_7()", setup=setup).repeat(3, 900000)
> [2.281613943830961, 2.2719342631547077, 2.261691106209631]
> [2.311480238815406, 2.318420542148333, 2.3552384305184493]
> [2.3824197456864304, 2.3457239951596485, 2.3353268829498646]
> [2.312442972404032, 2.318053102249902, 2.3054072168069872]
> [2.3482314132374853, 2.3403386400002475, 2.330108825844775]
> [2.424549090688892, 2.4346475296851438, 2.429691196530058]
> [2.3259756401716487, 2.333549212826732, 2.32049893822186]
Я сделал разные тесты с разными повторениями. Различия невелики, но во всех тестах решение zfill было самым быстрым.
What is the most pythonic way to pad a numeric string with zeroes to the left, i.e., so the numeric string has a specific length?
str.zfill специально предназначен для этого:
>>> '1'.zfill(4)
'0001'
Обратите внимание, что он специально предназначен для обработки числовых строк по запросу и перемещает + или - в начало строки:
>>> '+1'.zfill(4)
'+001'
>>> '-1'.zfill(4)
'-001'
Вот справка по str.zfill:
>>> help(str.zfill)
Help on method_descriptor:
zfill(...)
S.zfill(width) -> str
Pad a numeric string S with zeros on the left, to fill a field
of the specified width. The string S is never truncated.
Это также самый эффективный из альтернативных методов:
>>> min(timeit.repeat(lambda: '1'.zfill(4)))
0.18824880896136165
>>> min(timeit.repeat(lambda: '1'.rjust(4, '0')))
0.2104538488201797
>>> min(timeit.repeat(lambda: f'{1:04}'))
0.32585487607866526
>>> min(timeit.repeat(lambda: '{:04}'.format(1)))
0.34988890308886766
Чтобы лучше всего сравнить яблоки с яблоками для метода % (обратите внимание, что он на самом деле медленнее), который в противном случае будет предварительно рассчитывать:
>>> min(timeit.repeat(lambda: '1'.zfill(0 or 4)))
0.19728074967861176
>>> min(timeit.repeat(lambda: '%04d' % (0 or 1)))
0.2347015216946602
Немного покопавшись, я нашел реализацию метода zfill в Objects/stringlib/transmogrify.h:
static PyObject *
stringlib_zfill(PyObject *self, PyObject *args)
{
Py_ssize_t fill;
PyObject *s;
char *p;
Py_ssize_t width;
if (!PyArg_ParseTuple(args, "n:zfill", &width))
return NULL;
if (STRINGLIB_LEN(self) >= width) {
return return_self(self);
}
fill = width - STRINGLIB_LEN(self);
s = pad(self, fill, 0, '0');
if (s == NULL)
return NULL;
p = STRINGLIB_STR(s);
if (p[fill] == '+' || p[fill] == '-') {
/* move sign to beginning of string */
p[0] = p[fill];
p[fill] = '0';
}
return s;
}
Давайте пройдемся по этому коду C.
Сначала он анализирует аргумент позиционно, что означает, что он не допускает аргументы ключевого слова:
>>> '1'.zfill(width=4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: zfill() takes no keyword arguments
Затем он проверяет, такой же ли он длины или длиннее, и в этом случае возвращает строку.
>>> '1'.zfill(0)
'1'
zfill вызывает pad (эта функция pad также вызывается ljust, rjust и center). Это в основном копирует содержимое в новую строку и заполняет отступы.
static inline PyObject *
pad(PyObject *self, Py_ssize_t left, Py_ssize_t right, char fill)
{
PyObject *u;
if (left < 0)
left = 0;
if (right < 0)
right = 0;
if (left == 0 && right == 0) {
return return_self(self);
}
u = STRINGLIB_NEW(NULL, left + STRINGLIB_LEN(self) + right);
if (u) {
if (left)
memset(STRINGLIB_STR(u), fill, left);
memcpy(STRINGLIB_STR(u) + left,
STRINGLIB_STR(self),
STRINGLIB_LEN(self));
if (right)
memset(STRINGLIB_STR(u) + left + STRINGLIB_LEN(self),
fill, right);
}
return u;
}
После вызова pad, zfill перемещает любой предшествующий + или - в начало строки.
Обратите внимание, что для того, чтобы исходная строка была фактически числовой, не требуется:
>>> '+foo'.zfill(10)
'+000000foo'
>>> '-foo'.zfill(10)
'-000000foo'
для производительности, есть ли случаи, когда строки f лучше, включая варианты использования для python2 vs python3? Кроме того, я думаю, что, поскольку zfill не распространен, в вашем ответе будет ссылка на документы
@eladsilver зависит от вашего намерения, учитывая поведение с + и -, и я добавил ссылку на документы!
Другой подход заключался бы в использовании понимания списка с проверкой условий длины. Ниже представлена демонстрация:
# input list of strings that we want to prepend zeros
In [71]: list_of_str = ["101010", "10101010", "11110", "0000"]
# prepend zeros to make each string to length 8, if length of string is less than 8
In [83]: ["0"*(8-len(s)) + s if len(s) < desired_len else s for s in list_of_str]
Out[83]: ['00101010', '10101010', '00011110', '00000000']
При использовании Python >= 3.6 самый чистый способ - использовать ф-струны с форматирование строки:
>>> s = f"{1:08}" # inline with int
>>> s
'00000001'
>>> s = f"{'1':0>8}" # inline with str
>>> s
'00000001'
>>> n = 1
>>> s = f"{n:08}" # int variable
>>> s
'00000001'
>>> c = "1"
>>> s = f"{c:0>8}" # str variable
>>> s
'00000001'
Я бы предпочел форматирование с помощью int, поскольку только тогда знак обрабатывается правильно:
>>> f"{-1:08}"
'-0000001'
>>> f"{1:+08}"
'+0000001'
>>> f"{'-1':0>8}"
'000000-1'
Спасибо за новый пример синтаксиса. заполнить char 'x' будет: v = "A18"; s = f '{v: x> 8}' + "|"; или s = v.ljust (8, «х») + «|»;
@Charlie 木匠 Это был вопрос ко мне или просто заявление?
просто заявление. протестировал еще несколько вариантов использования.
Это тоже нормально:
h = 2
m = 7
s = 3
print("%02d:%02d:%02d" % (h, m, s))
поэтому вывод будет: «02:07:03»
Я сделал функцию:
def PadNumber(number, n_pad, add_prefix=None):
number_str = str(number)
paded_number = number_str.zfill(n_pad)
if add_prefix:
paded_number = add_prefix+paded_number
print(paded_number)
PadNumber(99, 4)
PadNumber(1011, 8, "b'")
PadNumber('7BEF', 6, "#")
Выход :
0099
b'00001011
#007BEF
Я добавляю, как использовать int из длины строки внутри f-строки, потому что она, похоже, не покрыта:
>>> pad_number = len("this_string")
11
>>> s = f"{1:0{pad_number}}" }
>>> s
'00000000001'
это описано в этом ответе: stackoverflow.com/a/57360675/860196
PEP 3101 никоим образом не утверждает, что% устарел.