Команда paste объединяет строки с одинаковыми номерами: сначала берутся первые строки из каждого файла и объединенная строка записывается в выходной поток, затем берутся вторые строки, третьи и т. д. По умолчанию разделителем полей является символ табуляции, если только не указана опция -d, которая позволяют задать иной разделитель.
Формат команды paste таков:
paste [опции] файл…
Рассмотрим опции команды paste:
-d список | Сообщает команде paste о необходимости применять вместо табуляции другой разделитель полей. Допускается указывать список разделителей, В этом случае разделители используются циклически: между первыми двумя строками вставляется первый разделитель из списка, между следующими двумя — второй и т. д. Когда список заканчивается, осуществляется возврат к началу списка и процедура повторяется. |
-s | Задает режим последовательного слияния строк каждого входного файла по отдельности |
- | Означает выборку строки из стандартного входного потока |
Для иллюстрации процедуры вставки обратимся к следующим двум файлам, полученным путем применения команды cut к рассмотренному выше файлу pers.
$ cat pas1
ID897
ID667
ID9B2
$ cat раs2
P. Jones
S. Round
L. Clip
По умолчанию команда paste вставляет столбцы один за другим:
$ paste pas1 pas2
ID897 P. Jones
ID667 S. Round
ID982 L. Clip
Порядок задания файлов в командной строке играет роль:
$ paste pas2 pas1
P. Jones ID897
S. Round ID667
L. Clip ID982
Если требуется создать выходной файл, в котором разделителем полей будет какой‑то другой символ вместо табуляции, воспользуйтесь опцией -d. В приведенном ниже примере строки объединяемых файлов разделяются двоеточием:
$ paste -d: pas2 pas1
P. Jones:ID897
S. Round:ID667
L. Clip:ID982
Наличие опции -s заставляет команду paste работать немного по–другому: для каждого входного файла она выполняет слияние всех его строк, записывая результат в выходной поток. Представленная ниже команда сначала отображает все имена служащих, а затем — их идентификационные номера.
$ paste -a pas2 pas1
P. Jones S. Round L. Clip
ID897 ID667 ID982
Команда paste имеет удобную опцию — (дефис), которая позволяет принимать данные из стандартного входного потока. Каждый дефис в командной строке соответствует одной колонке выходных данных. Например, список файлов каталога можно отобразить в четырехколоночном формате, как показано ниже:
$ cd /etc
$ ls | paste -d" " - - - -
init.d rc rc.local rc.sysinit rc0.d rc1.d rc2.d rc3.d rc4.d rc5–d rc6.d
Если же нужно отобразить список в одну колонку, воспользуйтесь такой командой:
$ ls | paste -
init. d
rc
rc.local
rc.sysinit
rc0.d
rc1.d
11.6. Разделение файла на части с помощью команды split
Команда split позволяет разделять крупные текстовые файлы на более мелкие, Это может оказаться удобным, например, при передаче файлов по сети. Общий формат команды split таков:
split [-размер_выходного_файла] входной_файл [префикс]
Первый параметр определяет количество строк, на которое нужно разбить файл. По умолчанию файл разбивается на фрагменты по 1000 строк. Если размер файла не кратен 1000, последний фрагмент будет содержать менее 1000 строк. Например, из файла, содержащего 2800 строк, в результате выполнения данной команды образуются три файла, включающих соответственно 1000, 1000 и 800 строк.
Имя каждого созданного файла представляется в формате от префикс[аа] до префикс[zz]. По умолчанию префиксом является буква 'x'. Таким образом, команда split создает такую последовательность файлов:
хаа, xab, … xzy, xzz
Если расположить файлы в алфавитном порядке и выполнить их последовательную конкатенацию, получим исходный файл.