в поисках решения моей проблемы я нашел эту тему: Сортировка по последнему полю строки
Я использовал некоторые решения для сортировки с помощью sed
и awk
, и они работают, еще одна вещь, которую мне нужно, это удалить все строки, кроме одной, на основе последней строки в строке.
Пример, у меня есть:
www.site.com/324242_1234
www.site.com/233_1234
www.site.com/45357_1234
www.site.com/6545_2345
www.site.com/5433_2345
www.site.com/87745_456
www.site.com/453209_456
www.site.com/1345_456
Нужен этот результат:
www.site.com/324242_1234
www.site.com/6545_2345
www.site.com/87745_456
Поэтому мне нужно сохранить только одну строку, содержащую эту последнюю строку, в этом примере они разделены подчеркиванием. Я ценю помощь.
$ sort -t_ -u -k2 file
www.site.com/324242_1234
www.site.com/6545_2345
www.site.com/87745_456
предполагает, что предшествующих символов подчеркивания нет.
awk
решение может быть
$ awk -F_ '!a[$NF]++' file
www.site.com/324242_1234
www.site.com/6545_2345
www.site.com/87745_456
Объяснение После установки разделителя полей $NF
относится к последнему полю, a[$NF]++
подсчитывает вхождения каждого значения, начиная с нуля. !a[$NF]++
отрицает значение, поэтому оно будет истинным только тогда, когда счетчик равен нулю, что является первым просматриваемым экземпляром значения ключа. На этом сайте есть много примеров этой awk
идиомы.
пожалуйста, объясните загадочный скрипт awk
Как насчет этого?
cat file | sed -e 's/_/\t/gi' | sort -uk 2,2 | sed -e 's/\t/_/gi'
Где файл имеет строки
awk -F[_/] '{print $NF,$(NF-1),$0}' input_file |sort -r -nk2,1 |awk '!a[$1]++{gsub($1FS$2,"");gsub(/^ /,"");print}'
www.site.com/87745_456
www.site.com/6545_2345
www.site.com/45357_1234
Вы получите гораздо более дружелюбный прием и гораздо лучшую помощь здесь, если вы покажете, какой код вы пробовали до сих пор, и описали, какие проблемы у вас возникли с ним. Без кода ваш вопрос выглядит как запрос на бесплатную консультацию, а на StackOverflow многим это не нравится.