Вы находитесь на странице: 1из 20

Кодирование данных. Двоичное кодирование.

Единицы измерения и хранения информации.


Представление числовых, текстовых,
графических, звуковых данных в памяти
компьютера.
Кодирование данных
Кодирование – это представление данных одного типа через данные другого
типа. Естественные языки – это не что иное, как системы кодирования
понятий для выражения мыслей с помощью речи. В качестве другого
примера можно привести азбуку Морзе для передачи телеграфных
сигналов, морскую флажковую азбуку.
Алфавит Морзе:
Азбука Морзе в русском варианте
Двоичный алфавит «точка, «тире»:

._

Алфавит двоичных цифр:

0 1

Двоичный алфавит
«плюс», «минус»:

+ -
Алфавит клавиатурных символов ПЭВМ IBM
(русифицированная клавиатура):
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ

В канале связи сообщение, составленное из символов (букв) одного


алфавита, может преобразовываться в сообщение из символов (букв)
другого алфавита.

Правило, описывающее однозначное соответствие букв алфавитов при


таком преобразовании, называют кодом.

Процедуру преобразования сообщения называют перекодировкой.


Устройства, обеспечивающие кодирование и декодирование, будем
называть соответственно кодировщиком и декодировщиком.

Рис. Процесс передачи сообщения от источника к приемнику


Двоичное кодирование

В вычислительной технике используется двоичное кодирование, основанное


на представлении данных последовательностью из двух символов: 0 и 1. Эти
знаки называются двоичными цифрами, по-английски digit или сокращенно
bit (бит).

Одним битом можно выразить два понятия: да или нет, черное или белое,
истина или ложь, 0 или 1. Если количество битов увеличить до двух, то уже
можно выразить четыре различных понятия:
Тремя битами можно закодировать 8 понятий:
001 011 100 101 110 111.

Увеличивая на единицу количество разрядов, мы увеличиваем в два раза


количество значений, которое может быть выражено в данной системе, то
есть
N = 2m
где N – количество кодируемых значений;
m – количество двоичных разрядов
Единицы измерения и хранения информации.

Наименьшей единицей измерения является байт, поскольку одним байтом,


как правило, кодируется один символ текстовой информации.

Более крупная единица измерения - килобайт (Кбайт). В килобайтах


измеряют сравнительно небольшие объемы данных.

Более крупные единицы измерения данных образуются добавлением


префиксов мега, гига, тера.
1 Мбайт = 1024 Кбайт = 1020 байт
1 Гбайт = 1024 Мбайт = 1030 байт
1 Тбайт = 1024 Гбайт = 1040 байт
Представление числовых, текстовых,
графических, звуковых данных в памяти
компьютера.
Представление числовых данных в памяти ЭВМ Для представления
информации в памяти ЭВМ (как числовой, так и не числовой) используется
двоичный способ кодирования. Элементарная ячейка памяти ЭВМ имеет
длину 8 бит (байт).

Представление текстовых данных.


Любой текст состоит из последовательности символов. Символами могут
быть буквы, цифры, знаки препинания, знаки математических действий,
круглые и квадратные скобки и т.д. Особо обратим внимание на символ
"пробел", который используется для разделения слов и предложений между
собой. Хотя на бумаге или экране дисплея "пробел" - это пустое, свободное
место, этот символ ничем не "хуже" любого другого символа. На клавиатуре
компьютера или пишущей машинки символу "пробел" соответствует
специальная клавиша.
Текстовая информация, как и любая другая, хранится в памяти компьютера в
двоичном виде. Для этого каждому символу ставится в соответствие
некоторое неотрицательное число, называемое кодом символа, и это число
записывается в память ЭВМ в двоичном виде. Конкретное соответствие
между символами и их кодами называется системой кодировки.

В персональных компьютерах обычно используется система кодировки ASCII


(American Standard Code for Information Interchange - американский
стандартный код для обмена информации).
Система кодировки ASCII
Кодировка символов русского языка, известная как кодировка Windows-1251,
была введена "извне" - компанией Microsoft, но, учитывая широкое
распространение операционных систем и других продуктов этой компании в
России, она глубоко закрепилась и нашла широкое распространение.
Представление изображений.

Все известные форматы представления изображений (как неподвижных, так


и движущихся) можно разделить на растровые и векторные.

В векторном формате изображение разделяется на примитивы - прямые


линии, многоугольники, окружности и сегменты окружностей,
параметрические кривые, залитые определенным цветом или шаблоном,
связные области, набранные определенным шрифтом отрывки текста и т. д.

Рис. Векторное изображение


В растровом формате изображение разбивается на прямоугольную матрицу
элементов, называемых пикселями. Растр, или растровый массив
(bitmap), представляет совокупность битов, расположенных на сетчатом
поле-канве. Бит может быть включен (единичное состояние) или выключен
(нулевое состояние). Состояния битов можно использовать для
представления черного или белого цветов, так что, соединив на канве
несколько битов, можно создать изображение из черных и белых точек.
Растровое изображение напоминает лист клетчатой бумаги, на котором
каждая точка закрашена черным или белым цветом, в совокупности
формируя рисунок, как показано ниже

Рис. Растровое изображение


Представление звуковой информации.

Приемы и методы работы со звуковой информацией пришли в


вычислительную технику наиболее поздно. К тому же, в отличие от
числовых, текстовых и графических данных, у звукозаписей не было столь
же длительной и проверенной истории кодирования. В итоге методы
кодирования звуковой информации двоичным кодом далеки от
стандартизации. Множество отдельных компаний разработали свои
корпоративные стандарты, но среди них можно выделить два основных
направления.
Метод FM (Frequency Modulation) основан на том, что теоретически любой
сложный звук можно разложить на последовательность простейших
гармонических сигналов разных частот, каждый из которых представляет
собой правильную синусоиду, а, следовательно, может быть описан
числовыми параметрами, т.е. кодом. В природе звуковые сигналы имеют
непрерывный спектр, т.е. являются аналоговыми. Их разложение в
гармонические ряды и представление в виде дискретных цифровых сигналов
выполняют специальный устройства - аналогово-цифровые преобразователи
(АЦП). Обратное преобразование для воспроизведения звука,
закодированного числовым кодом, выполняют цифро-аналоговые
преобразователи (ЦАП).
Метод таблично волнового (Wave-Table) синтеза лучше соответствует
современному уровню развития техники. В заранее подготовленных
таблицах хранятся образцы звуков для множества различных музыкальных
инструментах. В технике такие образцы называют сэмплами. Числовые коды
выражают тип инструмента, номер его модели, высоту тона,
продолжительность и интенсивность звука, динамику его изменения,
некоторые параметры среды, в которой происходит звучание, а также прочие
параметры, характеризующие особенности звучания. Поскольку в качестве
образцов исполняются реальные звуки, то его качество получается очень
высоким и приближается к качеству звучания реальных музыкальных
инструментов.