Лабораторная работа №5
Тема: Примеры использования команд для
обработки текстовых файлов в Linux.
По курсу “Операционные системы.”
Кишинев, 2020
----------------------------------------------------------------------------------------------------
Использовать команды для обработки текстовых файлов из
списка:
grep (-wrvincABC), sort (-nrRMku), uniq (-cdDu -f N), cut (-cdf), head, tail,
wc, nl, paste, join, cmp, diff, tr.
----------------------------------------------------------------------------------------------------
Grep — утилита командной строки, которая находит на вводе целые
строки, отвечающие заданному регулярному выражению, и выводит
их, если вывод не отменён специальным ключом.
----------------------------------------------------------------------------------------------------
Grep -w, --word-regexp заставить ШАБЛОН соответствовать только
целым словам.
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
Sort (-nrRMku) - утилита для вывода текстовых строк в определенном
порядке. Проще говоря, для сортировки.
----------------------------------------------------------------------------------------------------
Sort -r сортировать в обратном порядке
----------------------------------------------------------------------------------------------------
Sort -R случайная сортировка
----------------------------------------------------------------------------------------------------
Sort -M сортировка по месяцам.
----------------------------------------------------------------------------------------------------
Sort -k сортировать по ключу;
----------------------------------------------------------------------------------------------------
Sort -u игнорировать повторяющиеся строки
----------------------------------------------------------------------------------------------------
Uniq (-cdDu -f N) - утилита Unix, с помощью которой можно вывести
или отфильтровать повторяющиеся строки в отсортированном файле.
----------------------------------------------------------------------------------------------------
Uniq –c в начале каждой строки выводит число, которое обозначает
количество повторов.
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------
Cut (-cdf) - используется, если нужно вырезать часть текста — при этом
он может находиться в файле либо быть напечатанным через
стандартный ввод.
----------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------
Head - выводит начальные строки (по умолчанию — 10) из одного
или нескольких документов.
----------------------------------------------------------------------------------------------------
Tail - позволяет выводить заданное количество строк с конца файла, а
также выводить новые строки в интерактивном режиме.
----------------------------------------------------------------------------------------------------
-n, --lines = [+] ЧИСЛО выводить последние ЧИСЛО строк вместо
последних 10; или используйте -n + NUM для вывода, начиная со
строки NUM
----------------------------------------------------------------------------------------------------
-c, --bytes = [+] ЧИСЛО вывести последние ЧИСЛО байтов; или
используйте -c + NUM для вывода, начиная с байта NUM каждого
файла
----------------------------------------------------------------------------------------------------
Wc - утилита, выводящая число переводов строк, слов и байт для
каждого указанного файла и итоговую строку, если было задано
несколько файлов.
----------------------------------------------------------------------------------------------------
Paste команда Unix, предназначенная для вставки колонок.
----------------------------------------------------------------------------------------------------
Join команда UNIX-подобных операционных систем, объединяющая
строки двух упорядоченных текстовых файлов на основе наличия
общего поля.
Команда join выдает на стандартный вывод результат соединения
двух отношений, задаваемых строками файла1 и файла2. Если вместо
файла1 стоит -, то используется стандартный ввод.
----------------------------------------------------------------------------------------------------
Cmp сравнивает два файла и, если они различаются, сообщает о
первом байте и строке, где было обнаружено различие.
----------------------------------------------------------------------------------------------------
Diff предназначена для задействования одноименной утилиты,
осуществляющей сравнение двух указанных пользователем файлов и
вывод информации об их различиях.
----------------------------------------------------------------------------------------------------