Вы находитесь на странице: 1из 6

Лекции № АРХИВАЦИЯ ДАННЫХ

Сжатые папки. Архивация. Программы для архивации.

Цели:

дидактическая: научить студентов работать с сжатыми папками Windows, с программой


архиватором WinRAR. определять емкость носителя информации; копировать, переименовывать
файлы и работать с каталогами. помочь учащимся получить представление об архивации файлов,
познакомиться с понятием избыточности, научить архивировать и распаковывать файлы, дать
основные понятия, необходимые для грамотной работы на компьютере.
развивающая: развитие познавательных интересов, навыков работы на компьютере,
самоконтроля, умения конспектировать. Развивать знания студентов в области информационных
технологий, продолжить формировать информационное мышление студентов.

воспитательная: воспитание информационной культуры учащихся, внимательности,


аккуратности, дисциплинированности, усидчивости. Показать важность знаний и умений в сфере
информационных компьютерных технологий.

Вид занятий (тип урока): изучение нового материала.


Организационные формы обучения: Объяснение материала и инструктаж по выполнению задания
Методы обучения: выполнение практического задания.
Средства обучения: персональные компьютеры, презентация PowerPoint по архивации WinRAR,
методические указания к выполнению лабораторной работы, мультимедийный проектор,наглядный
материал использования функциональных клавиш на плакате.
Вид и формы контроля знаний: контрольное тестирование.
Средства контроля: компьютерная контролирующая программа «Knowing».
Внутрипредметные связи: тема «Архиваторы»
Виды самостоятельной работы студентов: выполнение практического задания.
Домашнее задание

Одним из наиболее широко распространенных видов сервисных программ являются программы,


предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при
котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем
памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными


способами , например за счет упрощения кодов, исключения из них постоянных битов или
представления повторяющихся символов или повторяющейся последовательности символов в виде
коэффициента повторения и соответствующих символов.

Целью процесса сжатия, как правило, есть получение более компактного выходного потока
информационных единиц из некоторого изначально некомпактного входного потока при помощи
некоторого их преобразования.

Основными техническими характеристиками процессов сжатия и результатов их работы являются:

1. степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего
потоков;
2. скорость сжатия - время, затрачиваемое на сжатие некоторого объема информации входного
потока, до получения из него эквивалентного выходного потока;

3. качество сжатия - величина, показывающая на сколько сильно упакован выходной поток, при
помощи применения к нему повторного сжатия по этому же или иному алгоритму.
Представьте себе следующую ситуацию. Вы работаете на компьютере в каком-нибудь текстовом или
графическом редакторе. Это занимает у вас несколько часов. В конце работы вы пытаетесь сохранить на
диске набранную информацию. При этом редактор выдаёт сообщение о том, что диск переполнен и
файл с вашим документом не может быть сохранён. Жесткий диск, на необъятные размеры которого вы
рассчитывали, оказывается полностью занятым. В результате длительной работы на нём скопился
большой объём необходимой информации, которую никак нельзя удалить: все преимущества жесткого
диска утеряны. Теперь, чтобы результат вашего труда не пропал даром (если это ещё возможно), вам
придётся совершить довольно сложную последовательность действий и при этом не ошибиться. Как
избежать подобных осложнений? Как освободить место для работы и при этом не уничтожить ни
одного файла? Можно ли сохранить информацию объёмом 50 Мбайт на диске ёмкостью 40 Мбайт? Как
сделать информацию менее уязвимой для компьютерных вирусов? Ответить на эти вопросы и
выполнить необходимые действия вам позволят архиваторы.

Простейшим архиватором является человеческий мозг. Убедиться в этом вам поможет следующий
пример.

Рассмотрим следующую строчку:

AAAABBBCCCCCDD

Если перед вами поставить задачу: «Запомните строку и воспроизведите её», то скорее всего вы
запомните её как: «четыре А, три B, пять С, две D». Если записать это, то получим строку:

4A3B5C2D

Где цифра обозначает, сколько раз повторяется в строке следующая за ней буква. Такую строчку
довольно просто восстановить в первоначальный вид, а хранить её более выгоднее в преобразованном,
т.к. она занимает меньше места. На аналогичных, только более развитых, принципах основано действие
специальных программ, называемых архиваторами.

Редакторы, работающие с текстовой, графической, звуковой и другой информацией, кодируют ее


наиболее естественным, но не самым экономичным способом.

Действительно, если внимательно посмотреть любой текст, то можно заметить, что такие буквы «а» и
«о», встречаются в нем гораздо чаще чем «ю» и «у». То же самое можно отнести и к сочетаниям букв.
На рисунках цвета соседних точек в большинстве случаев близки по оттенку. Подобно этому в любой
последовательности информации некоторые сочетания встречаются намного чаще других.

Все это приводит к тому, что в файлах, хранящих эту информацию, некоторые комбинации из 0 и 1
встречаются гораздо чаще, чем другие. В таких случаях говорят, что информация обладает
избыточностью, и есть возможность перекодировать содержание файла, уменьшив его размер. Для
сжатия достаточно придерживаться правила: чем чаще встречается комбинация, тем более коротким
сочетанием из 0 и 1 ее можно перекодировать. Разумеется, делать это должна программа.

Программы, осуществляющие сжатие (упаковку файлов), называют архиваторами.

Создано множество различных архиваторов, наиболее распространенные из них WinRar и WinZip, в


ОС Windows также входит служебная программа Архивация данных. Выбирая архиватор, необходимо
руководствоваться его универсальностью и надежностью, но не забывать конечно и о главных
параметрах - качество и скорость сжатия.

При сжатии можно уменьшить размер файла в несколько раз, что дает заметную экономию памяти.
Это особенно ценно при пересылке файлов через сеть Интернет или размещении их на носителях,
объем которых невелик, например, на дискетах.
Если попытаться повторить процедуру сжатия, то никакого эффекта не будет, так как
избыточность информации главным образом устраняется при первой упаковке.

Необходимо заметить, что не все типы файлов рационально архивировать с целью уменьшения их
размера. Примером может служить рисунок в формате JPEG, звук в формате MP3 и другие.

Информация, упакованная архиватором, хранится в наиболее экономичной форме, но она


закодирована искусственным способом, поэтому прежде, чем открыть содержание файла,
необходимо произвести перекодировку файла (принято говорить: распаковать, разархивировать,
восстановить файл).

2. ЧТО ТАКОЕ АРХИВИРОВАНИЕ

Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не
уменьшается. Архивация необходима не только для экономии памяти, но и для надежного хранения
копий ценной информации, для быстрой передачи информации по сети.

Архивирование (упаковка, сжатие) это процесс записи файла в архивный файл, 


разархивирование (распаковка) - процесс извлечения файла из архива. 
Архив - упакованный (сжатый) файл.

Архивация информации это такое преобразование информации, при котором объем информации


уменьшается, а количество информации остается прежним.

Степень сжатия информации зависит от типа файла и от выбранного метода упаковки. Степень
(качество) сжатия файлов характеризуется коэффициентом сжатия:

Kc = (Vc / Vи) . 100%.

Vc - объем сжатого файла, Vи - объем исходного файла.

Проблемы архивации тесно связаны с проблемами кодирования (замена символов текста двоичными
кодами с помощью кодовой таблицы), шифрования (криптография), компрессией звуковых и видео-
сигналов.

2.1 Какие существуют методы архивирования

Все используемые методы сжатия информации можно разделить на два класса:

 упаковка без потерь - исходную информацию можно точно восстановить по имеющейся


упакованной информации;
 упаковка с потерей информации - распакованное сообщение будет отличаться от исходного
сообщения.

В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в
основном, две простые идеи.

Первая идея основана на учете частот символов, она разработана Д. А. Хаффманом а 1952 году. Эта
идея базируется на том факте, что в обычном тексте частоты появления различных символов
неодинаковы. Часто встречающиеся символы кодируются короткими последовательностями битов, а
более редкие - длинными. К каждому сжатому архиву прикладывается таблица соответствия символов и
кодов.
Вторая идея упаковки состоит в использовании того факта, что в сообщениях часто встречаются
несколько подряд идущих одинаковых байтов, а некоторые последовательности байтов повторяются
многократно. При упаковке такие места можно заменить командами вида "повторить данный байт n
раз" (при упаковке графической информации) или "взять часть текста длиной k байтов, которая
встречалась m байтов назад" (при упаковке текстовой информации). Такой алгоритм архивации
называется RLE (кодирование путем учета повторений).

2.2. Какими возможностями обладают архиваторы

Средства архивации-разархивации, как правило, обеспечивают:

 создание архива;
 обслуживание архива (добавление файлов, удаление файлов из архива, замену файлов в архиве и
т.п.);

 извлечение файлов из архива;

 автоматическую архивацию и разархивацию поддерева файловой структуры;

 тестирование целостности архивов;

 создание многотомных архивов с возможностью задания произвольного размера тома;

 создание самораспаковывающихся архивов;

 создание пароля для доступа к архиву;

 работу с частично разрушенными архивами.

Каждый архиватор обычно реализует свой собственный уникальный алгоритм сжатия.

2.3. Как сжать звуковые файлы

Для уменьшения размеров мультимедийных файлов используют процедуру сжатия.

Cжатие (уплотнение, компрессия) это такое преобразование информации, в результате которого


исходный файл уменьшается в объеме, а количество информации в сжатом файле уменьшается на
такую небольшую величину, которой практически можно пренебречь.

Компрессия без потерь используется, например, архиваторами ZIP, RAR, ARJ. Применение подобных
алгоритмов для сжатия файлов, содержащих оцифрованный звук, не позволяет получить сжатие более
чем в 2 раза.

Звуковой сигнал, преобразованный с помощью АЦП, обычно не повторяет сам себя и по этой причине
плохо сжимается с помощью алгоритмов сжатия без потерь. Многие приемы сжатия аудиоинформации
основываются на обмане органов чувств человека путем исключения избыточной и информации,
которую человек не способен воспринять (в силу своих физиологических особенностей).

Такие методы относятся к классу компрессии с потерями. Они не ставят цель абсолютно точного
восстановления формы исходных колебаний. Их главная задача - достижение максимального сжатия
звукового сигнала при минимальных слышимых искажениях восстановленного после с жатия сигнала.

Звуковой файл можно сжать с помощью компадирования, которое заключается в сжатии по амплитуде


исходного звукового сигнала и последующем его восстановлении с помощью расширителя. Значение
амплитуды звука заменяется логарифмом этого значения. Полученные числа округляются, и для их
записи требуется меньшее число разрядов. Для воспроизведения сжатого сигнала, его подвергают
потенцированию (преобразование, обратное логарифмированию).

Еще один способ сжатия звукового сигнала заключается в том, что исходный звуковой сигнал
очищается с помощью фильтров от неслышимых компонент (например, низкие басовые шумы). Затем
производится более сложный анализ сигнала: вычисляются и удаляются замаскированные частоты,
заглушенные другими мощными сигналами. Таким образом можно исключить до 70% информации из
сигнала, практически не изменив качество его звучания.

Есть и другие способы, так же основанные на свойствах человеческого слуха.

Если звуковой сигнал представляет собой однотонные звуки с постоянным уровнем громкости, то
биоакустические свойства слуха не позволяют его сжать. В этом случае дают эффект традиционные
методы архивации информации, например, алгоритм Хаффмана.

2.4. Как сжать графические файлы

Методы сжатия видеоинформации разделяются на две группы, в зависимости от скорости упаковки


изображения:

 сжатие неподвижных изображений может выполняться с любой скоростью, т.к. этот процесс


не регламентирован во времени, в силу статичности изображения.
 сжатие движущихся изображений должно выполняться, как правило, в режиме реального
времени по мере ввода данных.

Стандарт JPEG позволяет сократить размеры графического файла с неподвижным изображением в 10-
20 раз. Этим методом удается при специальных действиях сжимать и движущиеся изображения.

3. Обобщение материала.

1) Первая цель архиватора — уменьшить двоичные или текстовые файлы в размере. Это
позволяет экономить весьма значительное пространство при хранении, так как обычно в
результате архивации файл сокращается приблизительно до 1/4 — 1/3 от его оригинального
размера. Этой программой могут обрабатываться файлы любого размера, которые умещаются на диске
одновременно с архивированным файлом, возникшим в процессе компрессии. При этом могут легко
обрабатываться файлы размером свыше 1 Мбайта, даже если объем свободной оперативной памяти не
превышает 200 Кбайт. Это уменьшает любые потенциальные проблемы, возникающие на разных
компьютерах.

Архивация производится с использованием специальных "таблиц компрессии", которые


автоматически встраиваются в программу и включают в себя математические процедуры,
простые для компьютера.

2) Вторая цель программы — объединять более чем один архивируемый файл лишь в одном
сжатом файле, хотя каждый файл внутри такого сжатого файла должен сохранять свое
собственное имя. Это и называется "архивированием". Во времена операционной системы CP/M
такие файлы назывались "библиотечными" ("library"). В первые годы после появления MS-DOS они
назывались .ARC - файлами. Однако с появлением схожих программ, именам файлов стали даваться
различные "расширения", чтобы можно было определить какая из программ — архиваторов была
использована. В качестве примеров можно привести .ARJ, .LZH, .PAK, .ZIP, .ZOO, .RAR и т.д.
WinRAR можно использовать двумя способами: в режиме графической оболочки со стандартным
интерфейсом Windows и в командной строке. Чтобы использовать WinRAR в режиме оболочки,
дважды щелкните мышью на значке WinRAR

— после этого для архивации и извлечения файлов вы сможете пользоваться кнопками и меню.

Вам также может понравиться