Какую команду Vim использовать для удаления всего текста после определенного символа в каждой строке файла?

Сценарий:

У меня есть текстовый файл с данными, разделенными вертикальной чертой (как в символе |).
Каждое поле данных в полях, разделенных вертикальной чертой, может иметь переменную длину, поэтому подсчет символов не будет работать (или использовать какую-то функцию подстроки ... если она даже существует в Vim).

Возможно ли с помощью Vim удалить все данные из второго канала до конца строки для всего файла? Там примерно 150 000 строк, так что делать это вручную будет привлекательно только мазохисту ...

Например, измените следующие строки с:

1111|random sized text 12345|more random data la la la|1111|abcde
2222|random sized text abcdefghijk|la la la la|2222|defgh
3333|random sized text|more random data|33333|ijklmnop

к:

1111|random sized text 12345
2222|random sized text abcdefghijk
3333|random sized text

Я уверен, что это можно как-то сделать ... Надеюсь.

Обновлено: Я должен был упомянуть, что я запускаю это в Windows XP, поэтому у меня нет доступа к некоторым из упомянутых команд * nix (cut не распознается в Windows).

Установите команды * nix, чувак. Вы никогда не пожалеете об этом. Я использую cygwin на XP, но думаю, что в наши дни есть более открытые альтернативы.

— 16.01.2009 01:50

Я думал об этом. Я просто должен быть осторожен, устанавливая на свой компьютер нестандартные вещи. К счастью, они дают нам больше свободы действий, чем обычный пользователь.

— 16.01.2009 06:59

См. Также аналогичный (более свежий) вопрос «Как удалить текст после указанного символа в Vim».

— 30.09.2011 08:49

regex vim vi replace

15.01.2009 23:30

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

8 308

Перейти к ответу Данный вопрос помечен как решенный

Ответы 12

Ответ принят как подходящий

:%s/^\v([^|]+\|[^|]+)\|.*$/\1/

Включает "очень волшебный" режим для этого регулярного выражения. Это позволяет избежать использования парных скобок, плюсов и прочего с помощью обратной косой черты. Смотрите: h / \ v

— 15.01.2009 23:45

15.01.2009 23:38

Я обнаружил, что vim не очень хорош для обработки очень больших файлов. Я не уверен, насколько велик ваш файл. Может быть, cat и sed вместе сработают лучше.

В любом случае, 150000 строк этого типа должно быть в порядке с Vim.

— 15.01.2009 23:48

У меня было более 100 МБ файлов (сгенерированных), и Vim - единственный редактор, который я видел, который их обрабатывает ... Я не знаю, почему у вас могут возникнуть проблемы с этим!

— 15.01.2009 23:50

С этим файлом поработал нормально =)

— 16.01.2009 00:15

И я отредактировал лог-файлы размером 20 ГБ с помощью регулярных выражений vim. Да, это было медленно. Но сделал свое дело.

— 16.01.2009 12:47

15.01.2009 23:40

Вот решение sed:

sed -e 's/^\([^|]*|[^|]*\).*$/\1/'

15.01.2009 23:41

Зачем использовать Vim? Почему бы просто не бежать

cat my_pipe_file | cut -d'|' -f1-2

15.01.2009 23:42

Если вам не нужно использовать Vim, другой альтернативой будет команда unix cut:

cut -d '|' -f 1-2 file > out.file

15.01.2009 23:43

Вы также можете записать макрос:

qq02f|Djq

а затем вы сможете воспроизвести его с помощью 100@q, чтобы запустить макрос на следующих 100 строках.

Макро объяснение:

qq: запускает запись макроса;
0: переходит к первому символу строки;
2f|: находит второе вхождение символа | в строке;
D: удаляет текст после текущей позиции до конца строки;
j: переход к следующей строке;
q: завершает запись макроса.

Это преждевременно перестанет работать, если в какой-либо строке нет двух | на нем, но работает иначе.

— 15.01.2009 23:50

15.01.2009 23:43

Вы также можете:

:%s/^\([^\|]\+|[^\|]\+\)\|.*$/\1/g

15.01.2009 23:48

Это отфильтрует все строки в буфере (1,$) через вырез, чтобы выполнить задание:

:1,$!cut -d '|' -f 1-2

Чтобы сделать это только в текущей строке, попробуйте:

:.!cut -d '|' -f 1-2

16.01.2009 00:02

Еще один способ сделать то же самое в Vim:

%s/^\(.\{-}|\)\{2}\zs.*//
%s/^\(.\{-}\zs|\)\{2}.*//  " If you want to remove the second pipe as well.

На этот раз регулярное выражение соответствует как можно меньшему количеству символов (\{-}), за которыми следует |, и дважды (\{2}), они игнорируются, чтобы заменить весь следующий текст (\zs) ничем (//).

То же самое. Приятно, что этот ответ на самом деле немного объясняет, что он делает.

— 16.01.2009 07:00

16.01.2009 01:31

Вы можете использовать :command для создания пользовательской команды для запуска подстановки:

:command -range=% YourNameHere <line1>,<line2>s/^\v([^|]+\|[^|]+)\|.*$/\1/

28.01.2010 21:51

Используйте Awk:

awk -F"|" '{$0=$1"|"$2}1' file

27.03.2010 16:58

Вместо подстановки можно использовать команду :normal для повторения последовательность из двух команд нормального режима на каждой строке: 2f|, прыжок ко второму символу | в строке, а затем к D, удалив все до конца строки.