Академический Документы
Профессиональный Документы
Культура Документы
Плотность.
Зависимости плотности.
Распределения.
Как было сказано, сжатый текст может быть развернут к исходному виду. При
этом укрупненным символам будут соответствовать текстовые фрагменты,
которые мы будем называть словами. Распределение количества разных слов по
их длине для текстов разного размера показано на Рис. 10. Распределения
получены на итерации № 40000.
Количество замен.
I = 9520* T / (C^0.8095)
Технология укрупнения.
Так как при заменах появляются новые коды, кодировка символов текста
должна быть достаточно емкой. Если выделить на каждый знак два байта, то
ограничение на количество итераций составит 65 тысяч. С учетом сказанного
понятно, что под текст потребуется удвоенный объем памяти по сравнению с
исходным количеством знаков в ASCII формате.
Рис. 15 показывает, как меняется время одной итерации при укрупнении текста
с начальным размером 1 Гб. Голубым цветом показана стадия укрупнения с
подсчетом пар на матрице. Красным - стадия парного представления текста и
подсчета пар на векторе.
Оптимизация.
13.11.2019 г.