У меня есть файл с содержимым:
manufacturer,model,year,mileage,price
plym fury 1970 73 2500
chevy malibu 1999 60 3000
ford mustang 1965 45 10000
volvo s80 1998 102 9850
ford thundbd 2003 15 10500
chevy malibu 2000 50 3500
bmw 315i 1985 115 450
honda accord 2001 30 6000
ford taurus 2004 10 17000
toyota rav4 2002 180 750
chevy impala 1985 85 1550
ford explor 2003 25 9500
Меня просят отсортировать файл сначала по названию производителя, а потом по цене в обратном порядке. Я реализовал то же самое с помощью команды:
(head -n 1 a) && (tail +2 a | sort -k1,1 -k5nr)
И дает мне правильный вывод:
manufacturer,model,year,mileage,price
bmw 315i 1985 115 450
chevy malibu 2000 50 3500
chevy malibu 1999 60 3000
chevy impala 1985 85 1550
ford taurus 2004 10 17000
ford thundbd 2003 15 10500
ford mustang 1965 45 10000
ford explor 2003 25 9500
honda accord 2001 30 6000
plym fury 1970 73 2500
toyota rav4 2002 180 750
volvo s80 1998 102 9850
Однако если я изменю sort -k1,1 -k5nr to sort -k1,1 -nrk5, я получу
manufacturer,model,year,mileage,price
ford taurus 2004 10 17000
ford thundbd 2003 15 10500
ford mustang 1965 45 10000
volvo s80 1998 102 9850
ford explor 2003 25 9500
honda accord 2001 30 6000
chevy malibu 2000 50 3500
chevy malibu 1999 60 3000
plym fury 1970 73 2500
chevy impala 1985 85 1550
toyota rav4 2002 180 750
bmw 315i 1985 115 450
Как одно незначительное различие меняет весь результат и какую разницу оно имеет?
Я пробовал обращаться к различным источникам, но ни один из них не помог.





Давайте сначала рассмотрим соответствующие абзацы на страницах руководства:
-k, --key=KEYDEF
sort via a key; KEYDEF gives location and type
KEYDEF is F[.C][OPTS][,F[.C][OPTS]] for start and stop position, where F is a field number and C a character position in the field; both are origin 1, and the stop position defaults to the line's
end. If neither -t nor -b is in effect, characters in a field are counted from the beginning of the preceding whitespace. OPTS is one or more single-letter ordering options [bdfgiMhnRrV], which
override global ordering options for that key. If no key is given, use the entire line as the key. Use --debug to diagnose incorrect key usage.
Если опция указана как -nrk5, -n является глобальной опцией, то есть она применяется ко всем полям, включая ваш первый ключ -k1,1. Поскольку поле не содержит ничего, что можно было бы интерпретировать как числовые значения, все они считаются равными, и вы фактически просто сортируете пятое поле в обратном числовом порядке.
Если параметр указан как -k5nr, n является частью KEYDEF и применяется только к -k5, поэтому -k1,1 не затрагивается, и первое поле сортируется в алфавитном порядке, что дает ожидаемый результат.
Вы можете увидеть более четко, следуя рекомендациям на странице руководства и используя опцию --debug. В случае -nrk5 вы получите следующие сообщения об ошибках:
sort: key 2 is numeric and spans multiple fields
ford taurus 2004 10 17000
^ no match for key
_____
_________________________
что, хотя и не очень понятно, помогает вам диагностировать, что не так с опциями. Обратите внимание: если вы используете -k5nr, вы все равно получите сообщение о том, что -k5 охватывает несколько полей (т. е. первая строка выше все равно будет там), но сообщение «нет соответствия ключу» будет заменено подчеркиванием первого поля, которое указывает он на самом деле используется в сортировке.
Итак, ответ на главный вопрос: да, порядок имеет значение.