Из стандарта сразу не понятно, что strncmp
(от string.h
)
int strncmp(const char *s1, const char *s2, size_t n);
должен возвращаться, если его третий аргумент n
равен 0
.
Согласно проекту стандарта C17, 7.24.4.4:
Функция
strncmp
сравнивает не болееn
символов (символы, следующие за нулевым символом, не сравниваются) [...].
Функция
strncmp
возвращает целое число больше, равно или меньше нуля, соответственно, поскольку [...] массив, на который указываетs1
, больше, равен или меньше [...] массива, на который указываетs2
.
Что должен вернуть strncmp(s1, s2, 0)
? Или стандарт умалчивает о случае, когда последним аргументом strncmp
является 0
?
Моя интуиция подсказывает мне, что 0
в качестве возвращаемого значения будет наиболее разумным:
0
является наиболее «симметричным» ответом (отрицательное или положительное возвращаемое значение подразумевает асимметрию и несовместимо с тем, что сравнения не проводились).0
согласуется с моделью, в которой 0
предполагается до тех пор, пока не будет найдено различие, не будут проведены n
сравнения или не будет достигнут конец строки.Но приведенное выше рассуждение является философским.
Кажется, что стандарт технически ничего не заявляет об этом случае. Я думаю, было бы лучше, если бы это
0
) илиЧто бы это ни стоило, glibc
дает мне 0
(и никаких предупреждений или ошибок) для набора простых тестовых случаев, таких как strncmp("abc", "def", 0)
, со следующими флагами компилятора:
-Wall -Wextra -std=c90 -pedantic
-Wall -Wextra -std=c17 -pedantic
Из стандарта C11 (7.23.1 соглашения о строковых функциях)
2 Если аргумент, объявленный как size_t n, указывает длину массив для функции, n может иметь нулевое значение при вызове этого функция. Если иное прямо не указано в описании конкретной функции в этом подпункте, аргументы указателя на такой вызов должен по-прежнему иметь действительные значения, как описано в 7.1.4. На таком вызов, функция, которая находит символ, не находит вхождения, функция, которая сравнивает две последовательности символов, возвращает ноль, а функция, которая копирует символы, копирует нулевые символы.
То же самое написано в следующих стандартах C, включая стандарт C23.
Это логически последовательно. Параметр n
указывает размер диапазона. Когда n
равно 0
, это означает, что диапазон пуст. И два пустых множества не могут быть больше или меньше друг друга. Оба они являются пустыми множествами и, следовательно, равны друг другу.
@LoverofStructure FYI: есть «7.1.4 Использование библиотечных функций», что полезно.
В качестве примечания, глядя на исходный код GLIBC, strncmp()
это:
int
STRNCMP (const char *s1, const char *s2, size_t n)
{
unsigned char c1 = '\0';
unsigned char c2 = '\0';
if (n >= 4)
{
size_t n4 = n >> 2;
do
{
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0' || c1 != c2)
return c1 - c2;
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0' || c1 != c2)
return c1 - c2;
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0' || c1 != c2)
return c1 - c2;
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0' || c1 != c2)
return c1 - c2;
} while (--n4 > 0);
n &= 3;
}
while (n > 0)
{
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0' || c1 != c2)
return c1 - c2;
n--;
}
return c1 - c2;
}
Приведенный выше код показывает, что возвращается c1 - c2
. Если параметр n
равен 0
, функция возвращает '\0' - '\0'
= 0
.
Это вопрос языкового юриста, то есть ответ должен определяться языком стандарта. То, что делает конкретная реализация, не свидетельствует о том, что требует стандарт, за исключением случаев, когда это может пролить свет на двусмысленность или интерпретацию. Реализации часто расширяют поведение, требуемое стандартом C, поэтому тот факт, что реализация обеспечивает определенное поведение, не указывает на то, что стандарт требует этого.
@EricPostpischil Я полностью с тобой согласен. Вот почему я начал свой ответ с «в качестве примечания»: предоставить пример реализации. Кстати, это подтверждает примеры, приведенные ОП, который сделал несколько попыток с GLIBC (последняя часть его вопроса).
«указывает длину массива для функции» — как неловко, что я не нашел эту формулировку (хотя я немного просмотрел документ). Однако я должен сказать, что мне не нравится формулировка: (1) задействовано более одного массива («подразумевает контекстуальную уникальность») и (2) формулировка расплывчата.