Вы находитесь на странице: 1из 33

Всё есть число.

Пифагор

Кодирование и
декодирование информации
Задание 5
(базовый уровень, время – 2 мин)

Разработала Фоминова Елена Владимировна, учитель физики и


информатики МБОУ СОШ № 23 МО Усть-Лабинский район
Краснодарского края
Теория
Кодирование и декодирование
информации
Кодирование — это преобразование информации из одной ее формы
представления в другую, наиболее удобную для её хранения, передачи или
обработки.
Декодирование — процесс восстановления изначальной формы
представления информации, т. е. обратный процесс кодирования,
при котором закодированное сообщение переводится на язык,
понятный получателю. В более широком плане это:
а) процесс придания определенного смысла полученным сигналам;
б) процесс выявления первоначального
замысла, исходной идеи отправителя,
понимания смысла его сообщения.
Алфавит
В основе каждого текста лежит алфавит – конечное
множество символов. В основе русского языка лежит
алфавит, называемый кириллицей, состоящий из 33
строчных и 33 заглавных букв. В основе английского языка
лежит латиница – алфавит, состоящий из 26 строчных и 26
заглавных букв. Пусть задан алфавит Т, содержащий m
символов: Т={t1, t2, … tm}
Словом S в алфавите T называют любую
последовательность символов алфавита:
S =s1s2…sk,
где si- это символы алфавита. Число символов в слове – k
называют длиной слова.
Мощность алфавита – это количество символов в нем.
Алфавит
При нажатии на клавиатурную клавишу компьютер получает
.
сигнал в виде двоичного числа, расшифровку которого можно
найти в кодовой таблице – внутреннем представлении знаков
в ПК. Стандартом во всем мире считают таблицу ASCII.

Для хранения одного символа двоичного


кода электронно-вычислительная машина
выделяет 1 байт, то есть 8 бит. Эта ячейка
может принимать только два значения: 0 и 1.
Получается, что один байт позволяет
зашифровать 256 разных символов, ведь
именно такое количество комбинаций можно
составить. Эти сочетания и являются
ключевой частью таблицы ASCII.
Алфавит
ASCII . UNICODE
Половина
Долгое времятаблицыпри стандартов
работе с ASCII
текстами,
содержит
сохраняемыми
коды цифр, в
управляющих
компьютере, символов
используется
и латинских
код ASCII.
букв. Такой
Другая алфавит,
ее часть
заполняется
содержащий 256 национальными
различных символов,
знаками,могпсевдографическими
включать латиницу
знаками
и кириллицу,
и символами,
цифры, знаки
которые
операций,
не имеютзнаки отношения
препинания,к
математике.
скобки и другие
Код ASCII,
символы.
в котором
Но все-таки
каждый символ
этого алфавита
алфавита
кодировался
недостаточно, словом
чтобы
из 8 можно
бит (одним
былобайтом).
хранить
В этомв алфавите
памяти
2компьютера
8
=256 символов.
тексты на любых естественных языках.
Совершенно
Сегодня для ясно,
хранения
что втекстов
различных
используется
странах эта
кодировка
часть таблицы
из 2-х
будет
байтов,
отличаться.
называемаяЦифры UNICODE
при вводе кодировкой,
также преобразовываются
позволяющаяв
двоичную
словами систему
из 16 вычисления
битов кодировать
согласно стандартной
алфавит, содержащий
сводке.
В216двоичной
=65536 символов.
системе счисления, которую активно используют
компьютеры, встречаются лишь две цифры – 0 и 1.
Неоднозначное кодирование

Пример.
Пусть у нас есть алфавит из 3-х символов – А, М, П.
Введем следующую кодировку: А-0, М-1, П-10.
Рассмотрим закодированный текст: 1010.
Этому тексту соответствует два слова – МАМА и ПП.
Как видите, введенная кодировка не обеспечивает однозначное
кодирование.

Если при кодирование


выполняется условие
Фано, то декодирование
однозначно.
Условие Фано

Условие Фано: никакое кодовое слово не совпадает с


началом другого кодового слова.
Коды, для которых выполняется условие Фано, называют
префиксными (префикс слова — это его начальный
фрагмент).
Все сообщения, закодированные с помощью префиксных
кодов, декодируются однозначно.
Префиксные коды имеют важное практическое значение —
они позволяют декодировать символы полученного
сообщение по мере его получения, не дожидаясь, пока всё
сообщение будет доставлено получателю.
Нужно знать
Прямое условие Фано
Неравномерный код может быть однозначно декодирован,
если никакой из кодов не совпадает с началом (префиксом)
какого-либо другого, более длинного кода.

А В С А В С А В С
10 11 001 10 11 00 100 110 010

D: 00 D: 11 D: 00
недопустимо: недопустимо: допустимо:
C - 001 В - 11 Прямое
D – 00 D – 11 условие Фано
Код D Код D выполнено.
совпадает совпадает
с началом кода с кода В
Обратное условие Фано
Неравномерный код может быть однозначно декодирован,
если никакой из кодов не совпадает с окончанием
(постфиксом) какого-либо другого, более длинного кода.

А В С А В С А В С
10 11 001 10 11 00 100 110 010

D: 01 D: 11 D: 01
недопустимо: недопустимо: допустимо:
C - 001 В - 11 Обратное
D – 01 D – 11 условие Фано
Код D Код D выполнено.
совпадает совпадает
с концом кода с кода В
Условия Фано

Для однозначности декодирования последовательности


кодов достаточно выполнения хотя бы одного из двух
вышеуказанных условий Фано:
 при выполнении прямого условия Фано
последовательность кодов однозначно декодируется с
начала;
 при выполнении обратного условия Фано
последовательность кодов однозначно декодируется с конца.

Правило Фано – это достаточное, но необходимое


условие однозначного декодирования.
Проверяе Существующие коды букв А, Б, В, Г Вывод
Задача
мый код
буквы Д
А 1 Б В Г
1 000 001 011
Для кодирования некоторой последовательности, состоящей
из букв А,00Б, В, Г и00Д, решили 00
00
использовать 00
неравномерный
Код не
двоичный1 неткод, позволяющий
000 есть 001 однозначно
есть 011 нетдекодировать
пригоден
двоичную01последовательность,
01 01 01появляющуюся
01 на приемной
Код не
стороне канала
1 нет связи. Использовали
000 нет 001 нет код: 011
А-1, Б-000, пригоден
есть В-001,
Г-011. Укажите,
10 10 каким
10 кодовым
10 словом10 должна Код быть
не
закодирована
1 естьбуква000Д.нет
Длина этого
001нет кодового слова должна
011нет пригоден
быть наименьшей
11 11 11 из всех11 возможных. 11 Код должен
Код не
удовлетворять
1 есть свойству
000 нетоднозначного
001нет кодирования.
011нет пригоден
000 000 000 000 000 Код не
1 нет 000 есть 001 нет 011нет пригоден
Решение:
001 001 001 001 001 Код не
1 нет 000 нет 001 есть 011нет пригоден
010 010 010 010 010 Код
1 нет 000нет 001 нет 011нет пригоден
Задача 2

Для
Код К
Для проверки
Код И на
кодирования соответствие кодов
Кодпоследовательности
Н условию
Комментарий
символов, состоящей
Фано
из нужно
букв К, попарно
И, Н, О, сравнить междунеравномерный
используется собой код,
0 11 1 Нельзя, так как совпадет с началом
коды по следующимусловию
удовлетворяющий правилам:Фано. При этом для буквы К
кода И.
• когда длина обоих сравнимых кодов совпадает,
использован код 000, а Нельзя
для буквы
– код ИК –совпадает
код 11. сТребуется
началом
проверяется равенство
определить наименьшую этих кодов:
возможную если один код
суммарную длину всех
совпадает с другим, кода Н
то букв.
такая пара кодов не
кодовых слов указанных
удовлетворяет условию Фано; – код К совпадает с началом
01 Нельзя
• когда длина сравнимых кода Н различна, более
кодов
короткий код записывается под более длинным
10 Допустимый код (не ссовпадает с
выравниванием обоих кодом кодов И,по а левому
код К не краю:
совпадает с его
если все знаки более короткого
Решение: началом)кода совпадают с
соответствующими знаками в начале более
длинного кода, то такая пара кодов не
удовлетворяет условию Фано. Подсказка
Задача
Код 2
Код Код Код О Комментарий
К И Н
0 11 10 11 Нельзя, так как совпадет с кодом И.
Итак, можно предположить, что –первый
000, 001, Нельзя код найден.
код К совпадает Но
с началом
посмотрим – удастся ли при
010, 011 этом
кода О найти код для буквы О.
При этом можно отбросить те коды, которые не подошли
100, 101 Нельзя – код Н совпадает с началом
для буквы Н, - ведь код буквы О должен удовлетворять
кода О
тем же требованиям при сравнении с кодами К и И.
110, 111 Нельзя – код И совпадает с началом
и т.д. кода О
100 101 Допустимый код (не совпадает с
кодом Н, а код К и И не совпадает с
его началом)

Код К Код И Код Н Код О Подсчитаем суммарную


длину этих кодов:
0 11 100 101
1+2+3+3=9
Задача 3

Для кодирования некоторой последовательности,


состоящей из букв А, Б, В, Г, Д, Е, решили использовать
неравномерный двоичный код, удовлетворяющий условию
Фано. Для буквы А использовали кодовое слово 0; для
буквы Б – кодовое слово 10. Какова наименьшая
возможная сумма длин всех шести кодовых слов?

Это задание удобнее решать с помощью дерева:


условие Фано выполняется тогда, когда все
выбранные кодовые слова заканчиваются в листьях
дерева.
Подсказка
Задача 3

Решение:
0 1 На оставшуюся
свободную ветку
нужно «повесить» 4
А 0 1 кодовых слова (для
букв В, Г, Д, Е)
Б 0 1

0 1
В
0 1
Г
Е
Д

суммарная длина кодовых слов будет в этом случае


равна 1 + 2 + 3 + 4 + 2·5 = 20
(А-0, Б-10, В-110, Г-1110, Д-11110, Е-11111)
Задача 3

Решение:
0 1

А 0 1 Ответ: 19

Б 0 1

1
0 1 0

В Г Д Е

суммарная длина кодовых слов будет в этом случае


равна 1 + 2 + 4·4 = 19
(А-0, Б-10, В-1100, Г-1101, Д-1110, Е-1111)
Задача 4

Для кодирования некоторой последовательности, состоящей


из букв А, Б, В, Г, решили использовать неравномерный
двоичный код, удовлетворяющий условию Фано. Для буквы А
использовали кодовое слово 0, для буквы Б – кодовое слово
110. Какова наименьшая возможная суммарная длина всех
четырёх кодовых слов? суммарная длина
кодовых слов будет в
0 1 этом случае равна
1 + 3 +2 + 3 = 9
А 0 1 (А-0, Б-110, В-10, Г-111)

В 0 1
Б Г
Ответ: 9
Нужно помнить
Кодирование – это перевод информации с одного языка
на другой (запись в другой системе символов, в другом
алфавите).
Обычно кодированием называют перевод информации с
«человеческого» языка на формальный, например, в
двоичный код, а декодированием – обратный переход.
Один символ исходного сообщения может заменяться
одним символом нового кода или несколькими символами,
а может быть и наоборот – несколько символов исходного
сообщения заменяются одним символом в новом коде
(китайские иероглифы обозначают целые слова и
понятия).
Кодирование может быть равномерное и неравномерное.
При равномерном кодировании все символы кодируются
кодами равной длины.
При неравномерном кодировании разные символы могут
кодироваться кодами разной длины, это затрудняет
декодирование.
Закодированное сообщение можно однозначно
декодировать с начала, если выполняется условие Фано:
никакое кодовое слово не является началом другого
кодового слова;
закодированное сообщение можно однозначно
декодировать с конца, если выполняется обратное условие
Фано: никакое кодовое слово не является окончанием
другого кодового слова.
Условие Фано – это достаточное, но не необходимое
условие однозначного декодирования.
Задача 5

Для трехбуквенного алфавита {А, М, П} используется


кодировка А-01, М-10, П-001. Какой код минимальной длины
следует задать для кодировки буквы Т, добавляемой в
алфавит?

Решение:
Для нового символа, добавляемого в алфавит, нельзя
использовать код, состоящий из одного символа, так как
будет нарушено условие Фано. Для кода, состоящего из двух
символов, возможен только один вариант, удовлетворяющий
условию Фано, Т-11.

Ответ: 11
Задача 6

Для четырехбуквенного алфавита {А, М, П, Т} используется


кодировка А-01, М-10, П-001, Т-11. Можно ли уменьшить
длину кода одного из символов, сохраняя однозначность
декодирования?

Ответ: П-00
Задача 7

По каналу связи передаются сообщения, содержащие только


4 буквы: А, В, С, D. Для передачи используется двоичный код,
допускающий однозначное декодирование. Для букв
используются такие кодовые слова: А-111, В-0, D-110.
Укажите кратчайшее кодовое слово для буквы С, при котором
код будет допускать однозначное декодирование. Если таких
кодов несколько, укажите код с наименьшим числовым
значением.

Решение:
Коды 1 и 0 являются началом кода данных букв.
Коды 00 и 01 нельзя использовать, так как код буквы В
является их началом. Следовательно, минимальный код для
буквы C будет 10.
Ответ: 10
Задача 8

Для передачи по каналу связи сообщения, состоящего только


из символов А, Б, В и Г, используется неравномерный (по
длине) код: А-100, Б-111, B-110, Г-0. Через канал связи
передаётся сообщение: ВАБГАВ. Закодируйте сообщение
данным кодом. Полученную двоичную последовательность
переведите в шестнадцатеричный вид.

Решение:
Закодируем сообщение ВАБГАВ – 1101001110100110.
Полученную двоичную последовательность переведем в
шестнадцатеричный вид.
1101ӏ0011ӏ1010ӏ0110
D 3 A 6
Ответ: D3A6
Задача 9

По каналу связи передаются сообщения, содержащие только


3 буквы: А, В, С. Для передачи используется двоичный код,
допускающий однозначное декодирование. Для букв А и В
используются такие кодовые слова: А: 11, В: 0.
Укажите кратчайшее кодовое слово для буквы С, при
котором код будет допускать однозначное декодирование.
Если таких кодов несколько, укажите код с наименьшим
числовым значением.
Решение:
Коды 1 и 0 являются началом кода данных букв.
Коды 00 и 01 нельзя использовать, так как код буквы В
является их началом. Следовательно, минимальный код для
буквы C будет 10.
Ответ: 10
Выполни самостоятельно
Задание 1. По каналу связи передаются сообщения,
содержащие только 4 буквы: А, В, С, D; для передачи
используется двоичный код, допускающий однозначное
декодирование. Для букв А, В, D используются такие
кодовые слова: А: 0, В: 10, D: 110. Укажите кратчайшее
кодовое слово для буквы С, при котором код будет допускать
однозначное декодирование. Если таких кодов несколько,
укажите код с наименьшим числовым значением.
Ответ: 111
Задание 2. Для передачи по каналу связи сообщения,
состоящего только из символов А, Б, В и Г, используется
неравномерный (по длине) код: А-00, Б-11, В-100, Г-011.
Через канал связи передаётся сообщение: ГБВАГВ.
Закодируйте сообщение данным кодом. Полученную
двоичную последовательность переведите в
шестнадцатеричный вид. Ответ: 7С1С
Задание 3. Для передачи по каналу связи сообщения,
состоящего только из символов А, Б, В и Г, используется
неравномерный (по длине) код: А-00, Б-11, В-010, Г-011.
Через канал связи передаётся сообщение: ГБВАВГ.
Закодируйте сообщение данным кодом. Полученную
двоичную последовательность запишите в восьмеричной
системе счисления.
Ответ: 75023
Задание 4. Для передачи по каналу связи сообщения,
состоящего только из символов А, Б, В и Г, используется
неравномерный (по длине) код: А-111, Б-110, В-10, Г-0.
Через канал связи передаётся сообщение: ВАБГАВ.
Закодируйте сообщение данным кодом. Полученную
двоичную последовательность запишите в восьмеричной
системе счисления. Ответ: 27636
Задание 5. По каналу связи передаются сообщения,
содержащие только 3 буквы: А, В, С; для передачи
используется двоичный код, допускающий однозначное
декодирование. Для букв А и В используются такие кодовые
слова: А: 10, В: 0. Укажите кратчайшее кодовое слово для
буквы С, при котором код будет допускать однозначное
декодирование. Если таких кодов несколько, укажите код с
наименьшим числовым значением. Ответ: 11
Задание 6. По каналу связи передаются сообщения,
содержащие только 4 буквы: А, В, С, D; для передачи
используется двоичный код, допускающий однозначное
декодирование. Для букв А, В, D используются такие
кодовые слова: А: 111, В: 0, D: 100. Укажите кратчайшее
кодовое слово для буквы С, при котором код будет допускать
однозначное декодирование. Если таких кодов несколько,
укажите код с наименьшим числовым значением.
Ответ: 101
Список использованной
литературы
 Биллинг В.А. Подготовка к ЕГЭ по информатике.
 Богомолова О.Б. Информатика. Новый полный справочник
для подготовки к ЕГЭ. –М.: АСТ Астрель, 2016.
 Лещинер В.Р. ЕГЭ 2017. Информатика. 0 вариантов. –М.:
Издательство «Экзамен», 2017 –М.: Национальный
Открытый Университет «ИНТУИТ», 2016
 © Поляков К. Подготовка к ЕГЭ, 2009-2016
http://kpolyakov.spb.ru
Интернет-ресурсы
Слайд 1 ЕГЭ http://bashgymn.ucoz.ru/muzi/may/a12183fc240047e94e1f82d423bb0dd0.jpg
Слайд 2 https://rostovmama.ru/upload/000/u2/371/fb28decb.png
Слайд 3
https://lh5.googleusercontent.com/B3xJ9aZD4N1SbjjtLHdY4qiQjr4412-TqkTBoBLVhz9gkCkArqDm42kas04Vgl
U7ZitRhgmbaOETOuNY2WcYxJ71lEQmzDwKU94SDPMo2hb8kcckwVbU4EiSmLwZ7uvbkg
Слайд 4,5,6,13
http://3.bp.blogspot.com/-_-2yo9G5IDQ/U2dLrlEs8hI/AAAAAAAAS2A/xmGQNen3WDU/s1600/000269.jpg
Слайд 5 http://fb.ru/misc/i/gallery/38988/1040345.jpg
Слайд 7 http://fb.ru/misc/i/gallery/38988/1040342.jpg
Слайд 8 http://www.alfa-dominion.com/wp-content/uploads/2016/09/ar126593775101102-768x684.jpg
Слайд 9, 28 http://kazan.czm.su/sites/default/files/vajno-znat.jpg
https://begobike.com/wp-content/uploads/2016/07/Chitaem-pravila-gonol-na-begovelakh-1.jpg
Слайд 10,11,12 http://wallsfield.com/wp-content/uploads/2014/12/binary-code.jpg
Слайд 14, 15, 16, 17,18,19 http://www.yiliti.com/d/file/20160320/658-151111092Q4M9.jpg
Слайд 14, 16 Человечек с книгой http://wealthinoptions.com/wp-content/uploads/2014/11/18853285_ml.jpg
Слайд 20 http://til-lit.narod.ru/rekomend_K.jpg
Слайд 21,22 ноль http://5dimensions.se/wp-content/uploads/2016/04/red-number-0.jpg
Единица http://www.theintentionallife.com/wp-content/uploads/2014/12/1.jpg
Слайд 23-27 http://wealthinoptions.com/wp-content/uploads/2014/11/18853285_ml.jpg