Команда Linux для префикса значения для всех строк в файле, кроме первой строки и строк, начинающихся с символа решетки

Учитывая файл input.csv, как показано ниже,

EMP_ID,EMP_NAME,JOINING_DATE,SALARY
1,T Natarajan,22-APR-2024,6000000
2,Velmurugan,22-JUL-2024,2000000
3,Rowin,21-OCT-2024,5000000
#END_OF_FILE

как добавить префикс «E_» ко всем строкам, кроме первой строки и строк, начинающихся с символа решетки (#). Ожидаемый результат:

EMP_ID,EMP_NAME,JOINING_DATE,SALARY
E_1,T Natarajan,22-APR-2024,6000000
E_2,Velmurugan,22-JUL-2024,2000000
E_3,Rowin,21-OCT-2024,5000000
#END_OF_FILE

Пробовал эту команду sed -i -E '/^(#)/! s/^/E_/' input.csv, но она также обновляет 1-ю строку.

Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
0
108
6
Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

Ответ принят как подходящий

Вы ничего не делаете, чтобы исключить первую строку.

С помощью фигурных скобок можно объединить два условия:

sed '/^#/!{;1!s/^/E_/;}' input.csv

или возможно

sed '2,${;/^#/!s/^/E_/;}' input.csv

или вы можете изменить логику, чтобы пропустить эти строки;

sed '/^#/b;1b;s/^/E_/' input.csv

(Команда b говорит «перейти к этой точке сценария»; без метки она переходит к концу, пропуская остальную часть сценария для текущей строки ввода.)

Я убрал опцию -i; верните его, как только убедитесь, что результаты соответствуют вашим ожиданиям.

Кроме того, круглые скобки ничего не значили, поэтому я их тоже удалил. При этом скрипт больше не использует синтаксис ERE, поэтому я также удалил опцию -E.

Точки с запятой рядом с фигурными скобками необязательны в некоторых диалектах, но, вероятно, необходимы в других.

Если вы хотите сделать это в Awk, это должно быть легко.

awk 'FNR > 1 && !/^#/ { sub(/^/, "E_") } 1' file >newfile

В стандартном Awk нет такой опции, как опция -i в (нестандартном) sed; но GNU Awk предлагает -i inplace

Вы также можете использовать awk в качестве решения

awk 'NR > 1 && !/^#/ {$0 = "E_" $0} "true"' input.csv

Объяснение:

NR > 1 означает выполнение, начиная со второй строки А «истина» означает отображение всех строк.

!/^#/: проверяет, не начинается ли строка с #. Если строка начинается с хеша, это условие будет ложным и префикс не будет добавлен.

"true", конечно, тоже подойдет, но общепринятая идиома — просто 1. Но это не учитывает требование заменять только те строки, которые не начинаются с #.
tripleee 03.05.2024 09:54

Действительно, любая непустая строка или 0 считаются истинными.

stzov 05.05.2024 16:29

Вы можете использовать awk для печати всей строки, если это не первая строка или она начинается с #.

В противном случае вы печатаете всю строку, перед которой стоит E_.

awk 'NR==1 || /^#/ {print; next} {print "E_" $0}' input.csv

Выход

E_EMP_ID,EMP_NAME,JOINING_DATE,SALARY
E_1,T Natarajan,22-APR-2024,6000000
E_2,Velmurugan,22-JUL-2024,2000000
E_3,Rowin,21-OCT-2024,5000000
#END_OF_FILE
!NF пропускает пустые строки, а не первую.
tripleee 03.05.2024 10:51

@tripleee Да, вы правы, так должно быть !NR, но я изменил его на NR==0, чтобы было понятнее.

The fourth bird 03.05.2024 10:56

Это все еще неверно; в первой строке есть NR==1. Но теперь я обновил свой ответ решением Awk.

tripleee 03.05.2024 10:57

@tripleee Теперь все должно быть в порядке, ваш awk с сабвуфером тоже очень хорош.

The fourth bird 03.05.2024 11:05

Это может сработать для вас (GNU sed):

sed '1!s/^[^#]/E_&/' file

Если это не первая строка и не начинается с символа #, вставьте E_ в начале строки.

Я попробовал это с другим подходом, однако он работает только с предоставленными строками.

sed -i -e 's/^/E_/' -e '1s/E_//' -e 's/E_#/#/' file

Добавление чего-либо повсюду, а затем удаление этого при определенных условиях всегда является худшим (менее понятным и/или более хрупким и/или менее эффективным) подходом, чем простое добавление чего-либо при определенных условиях. В этом случае, если первая строка ввода начиналась с E_#7, то 's/^/E_/' изменило бы ее на E_E_#7, затем '1s/E_//' изменило бы ее обратно на E_#7, а затем 's/E_#/#/' изменило бы ее на #7, тем самым испортив ее. Вы сказали: «Однако это работает только с предоставленными строками». - очевидно, что публиковать скрипт, который работает только с определенным набором входных данных, бесполезно.

Ed Morton 07.05.2024 13:54

Используя любой awk:

$ awk '{print (NR==1 || /^#/ ? "" : "E_") $0}' file
EMP_ID,EMP_NAME,JOINING_DATE,SALARY
E_1,T Natarajan,22-APR-2024,6000000
E_2,Velmurugan,22-JUL-2024,2000000
E_3,Rowin,21-OCT-2024,5000000
#END_OF_FILE

Другие вопросы по теме