Вы находитесь на странице: 1из 5

Исследование эффективности алгоритмов компрессии изображений на основе обобщенных вейвлет-преобразований Хаара А.М.

Белов

ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ АЛГОРИТМОВ КОМПРЕССИИ ИЗОБРАЖЕНИЙ


НА ОСНОВЕ ОБОБЩЕННЫХ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЙ ХААРА
А.М. Белов
Самарский государственный аэрокосмический университет им. С.П. Королева,
Институт систем обработки изображений РАН

В работе представлены экспериментальные исследования эффективности алгоритмов


компрессии изображений на основе обобщенных вейвлет-базисов Хаара, с точки зрения
качественных параметров компрессии, адаптивного выбора вейвлет-базиса и визуального
качества восстановленных изображений.

Введение L2 ( R 2 ) с использованием систем счислений, осно-


В настоящее время вейвлет-преобразование ши- ваниями которых являются целые гауссовы числа.
роко применяется в обработке изображений, в част- В работе [2] было представлено обобщение ме-
ности, в задачах компрессии цифровых изображе- тода построения неразделимых двумерных вейвлет-
ний. Компрессия, как и большинство других задач базисов Хаара. Такое обобщение стало возможным
обработки изображений, является двумерной зада- после разработки венгерскими математиками Ката-
чей. Двумерные вейвлет-преобразования, применя- ем и Ковачем теории, так называемых, канониче-
емые в обработке изображений, как правило, явля- ских систем счисления (КСС) в квадратичных полях
ются разделимыми, т.е. представляют собой супер- [4, 5, 6]. В работе [2] показано, что, для каждой КСС
позицию двух одномерных преобразований. может быть построен неразделимый вейвлет-базис ,
Вейвлет-сжатие, в силу квантования коэффициентов причем геометрические характеристики носителей
разложения, является сжатием с потерями, и поэто- этих вейвлетов различны. Такое разнообразие
му неизбежно возникновение артефактов на восста- неразделимых вейвлетов привело к задаче исследо-
новленном изображении. Использование раздели- вания эффективности адаптивного выбора наиболее
мых вейвлетов приводит к появлению блочных и подходящего вейвлет-базиса, для некоторого изоб-
линейных артефактов на изображении, что является ражения, либо класса изображений .
нежелательным, поскольку именно к таким ошиб- В работе даны теоретические сведения о канони-
кам зрительная система человека наиболее воспри- ческих системах счисления, об обобщенных вейвле-
имчива [7]. тах Хаара, описана общая идея алгоритмов компрес-
Причиной возникновения таких артефактов яв- сии цифровых изображений на основе таких
ляется то, что разделимые вейвлеты имеют прямо- вейвлет-базисов. Представлены экспериментальные
угольные носители, именно на границах этих пря- исследования эффективности алгоритмов компрес-
моугольных блоков и возникают линейные артефак- сии на основе таких вейвлет-базисов в сравнении с
ты. Неразделимые же вейвлеты имеют своими носи- алгоритмом компрессии на основе разделимого
телями «фрактальные» области с непрямоугольны- вейвлет-базиса Хаара . Рассмотрена целесообраз-
ми границами, что позволяет избежать возникнове- ность адаптивного выбора вейвлет базиса, с целью
ния линейных артефактов, чем, и обусловлен инте- повышения качества компрессии.
рес к задаче построения неразделимых двумерных Канонические системы счисления в
вейвлет базисов. квадратичных полях
В работе [3], авторы охарактеризовали неразде-
лимые вейвлет-базисы, представляющие собой мно- Пусть Q( d ) есть квадратичное поле
гомерные аналоги базиса Хаара. Такой вейвлет ба-
зис был определен, как вейвлет базис над L2 ( R n ) с
{ }
Q ( d ) = z = a + b d ; a , b ∈ Q , d ∈ Z , свободно от
квадратов. В работе рассматриваются только мни-
компактным носителем, соответствующий кратно- мые квадратичные поля, т.е. d ≤ −1 .
масштабному анализу порожденному масштабиру-
ющей функцией вида, где χ Q ( x ) характеристиче- Если для элемента z = a + b d ∈ Q( d ) норма

ская функция компактного множества Q образую- и след – целые числа: Norm ( z ) = a 2 − db 2 ∈ Z,


Tr ( z ) = 2a ∈ Z, то элемент называется целым ал-
щего интегральное самоподобное покрытие R n .
Построение таких преобразований, а именно гебраическим числом поля Q ( d ) . Целое алгебра-
отыскание масштабирующей функции является до-
вольно сложной задачей, что затрудняет использо- ическое число z = a + b d называется целым гаус-
вание этого метода. В работах [7, 8] был предложен совым числом, если a, b ∈ Z .
метод построения таких вейвлет базисов над

74
2008 Компьютерная оптика, том 32, №1

В работах [5], [6] введено понятие канонической 1) функции вейвлет-базиса определяются равен-
системы счисления в кольце S ( d ) целых элемен- ством:
q
тов поля Q ( d ) . ψ i = ∑ ui +1, jφ1, d j ,
j =1
Целое алгебраическое число называется основа-
нием канонической системы счисления в кольце где ui,j - элементы унитарной матрицы U , в которой
целых поля Q ( d ) , если любой целый элемент u1, j = q −1/ 2 , j = 1… q ,
поля однозначно представим в форме конечной 2  (i − 1)( 2 j − 1)π 
суммы: ui , j = cos  ,
q  2q 
k(z)
z= ∑ z jα j , где i = 2 … q , j = 1… q , d j ∈ D , q = det A ;
j =0
где z j ∈ D = {0,1, … , Norm(α ) − 1}.
2) коэффициенты фильтра для преобразования с
базисом ψ i определяются равенствами:
Пара (α , D) называется канонической системой h j = u1, j , j = 1… q ,
счисления в кольце S ( d ) целых поля Q ( d ) . j
gi = ui, j , i = 2 … q , j = 1… q .
Для представления числа z ∈ S ( d ) в КСС
Основная идея алгоритмов вейвлет-декомпози-
(α , D) часто используют, так называемую позици- ции, на основе описанных выше базисов, базируется
онную запись этого числа (адрес числа): на интерпретации точек двумерной целочисленной
z = ( z k ( z ) , zk ( z )−1 … z0 )α , где z j ∈ D . решетки (растра изображения) как элементов кольца
Фундаментальной областью T (α , D ) ∈ C КСС целых алгебраических чисел квадратичного поля,
т.е. осуществляется переход от двумерной целочис-
(α , D) в кольце S ( d ) целых элементов поля ленной решетки ГZ к решетке целых алгебраических
чисел ΓS ( d ) некоторого квадратичного поля. По-
Q ( d ) , называется множество комплексных чисел
с нулевой целой частью, т.е: сле такого перехода, двумерная индексация отсче-
−1 тов исходного сигнала, заменяется одномерной, в
T (α , D ) = ∑ d jα j , d j ∈ D . силу существования отображения множества целых
j = −∞ алгебраических чисел (по сути двумерных точек) на
Пусть a = (a0 , a1 ) – пара линейно независимых множество адресов этих чисел, что позволяет ин-
терпретировать отсчеты изображения как точки
векторов пространства R 2 . Линейная оболочка с фундаментальной области КСС.
целыми коэффициентами Γ векторов (a0 , a1 ) назы- Такой подход предполагает два варианта: исход-
вается решеткой над R 2 с базисом a = (a0 , a1 ) . ный сигнал полностью покрывается фундаменталь-

{ }
ной областью КСС, либо ее фрагментом. В работе
Γ = ξ : ξ = ξ 0 a0 + ξ 1a1 , ξ 0, ξ1 ∈ Z . [1] предложены и подробно описаны алгоритмы
Решетки ΓS ( d ) над кольцами целых алгебраи- декомпозиции и реконструкции исходного сигнала
для двух рассмотренных случаев. Для первого слу-
ческих чисел S ( d ) порождаются базисами: чая предложен алгоритм с полным деревом деком-
( )
1) a = (1,0), (0, d ) , при d ≡ 2,3(mod 4) ;
позиции (FDT), для второго случая - алгоритм с ча-
стичным деревом декомпозиции (PDT). На основе
 1 d  предложенных алгоритмов декомпозиции и рекон-
2) a =  ( ,0), (0, ) , при d ≡ 1(mod 4) , струкции были реализованы алгоритмы компрессии
 2 2 
 и декомпрессии цифровых изображений . Основная
компоненты ξ 0 и ξ 1 элементов решетки имеют идея этих алгоритмов заключается в наложении
одинаковую четность. фундаментальной области некоторой КСС на ис-
ходное изображение и последующей декомпозиции
Обобщенные вейвлет-базисы Хаара по адресам точек этой фундаментальной области.
В работе [4] предложен метод построения обоб-
Экспериментальные исследования
щенных вейвлет-базисов Хаара: Для любой КСС
В этом разделе представлены результаты экспе-
(α , D) в кольце S ( d ) существует КМА, ассоции- риментов и сравнительный анализ предложенных
рованный с парой (Γ S ( d ) , A) , и функция алгоритмов с алгоритмом компрессии на основе
разделимого вейвлет-базиса Хаара . Качество алго-
φ = χ T (α , D ) ритмов оценивалось по следующим параметрам:
является масштабирующей функцией этого КМА и: пиковое соотношение сигнал/шум (PSNR), коэффи-

75
Исследование эффективности алгоритмов компрессии изображений на основе обобщенных вейвлет-преобразований Хаара А.М. Белов

циент компрессии (k c), и визуальное качество вос- Примеры тестовых изображений и фундамен-
становленной аппроксимации изображения. тальных областей канонических систем счисления,
Наиболее показательным экспериментом, демон- алгоритмы, на основе которых, дали наилучший
стрирующим целесообразность адаптивного выбора коэффициент компрессии, приведены на рисунке 1.
вейвлет-базиса, является эксперимент на синтезиро- Также, целесообразность адаптивного выбора
ванном изображении «линии». Было сгенерировано вейвлет-базиса была исследована на классе текстур-
тестовое изображение «линии» представленное на ных изображений. Исследовалась выборка из 130
рисунке 1. На основе этого изображения было сге- полутоновых текстурных изображений размером
нерировано еще 18 тестовых изображений, которые 512 × 512 пикселей, из атласа «Brodatz». По этому
были получены посредством последовательного множеству изображений были вычислены парамет-
поворота исходного изображения на угол 5°. ры PSNR и k c для следующих алгоритмов:
FDT (−1 + i) , FDT (i 2 ) , FDT (−1 + i 3 ) и Haar, при
ширине интервала квантования δ =10. Как показали
эксперименты, исходная выборка изображений мо-
жет быть разбита на 4 класса, в каждом из которых
наиболее эффективен только один из алгоритмов,
независимо от ширины интервала квантования. Рас-
пределение исходной выборки по классам представ-
лено в таблице 1.
а Исследования показали, что рассмотренные ал-
горитмы эффективны в « своих» классах изображе-
ний при различных значениях ширины интервала
квантования, однако разница эффективности раз-
личных алгоритмов уменьшается с ростом ширины
интервала квантования. Количественные данные
эксперимента, на примере класса K FDT (i 2 ) , пред-
ставлены в таблице 2.

б Таблица 2. Распределение исходной выборки по классам


Рис. 1. Тестовые изображения при различных углах пово- Число Процентное
Класс
рота и фундаментальные области КСС: γ = 45 , изображений соотношение
T(−1+i, {0 ,1}) (а), γ = 25 , T(−1+ i 3,{0,1, 2,3}) (б) K Haar 60 46%
K FDT ( −1+ i ) 13 10%
Для полученного набора изображений был рас-
считан коэффициент компрессии для алгоритмов
K FDT (i 2) 41 32.5%

компрессии FDT (−1 + i) , FDT (i 2 ) , FDT (−1 + i 3 ) K FDT (−1+ i 3) 16 11.5%


и Haar, при ширине интервала квантования δ = 10 .
Эксперимент показал, что при различных углах по-
ворота структурные особенности изображения со-
Таблица 3. Средние значения PSNR и k c для класса
гласуются со структурными особенностями фунда-
ментальных областей, что приводит к выигрышу изображений K FDT (i 2 )
того или иного алгоритма. Подтверждающие этот
вывод количественные данные представлены в таб- Haar FDT (i 2 )
δ
лице 1. PSNR kc PSNR kc
Таблица 1. Зависимость k c от угла поворота 2 45,3982 1,6258 46,603 1,6414
изображения «линии» 4 41,37 2,1366 41,7622 2,1666
γ FDT (− 1 + i ) FDT (i 2 ) FDT (−1 + i 3 ) Haar 6 38,389 2,5952 38,5862 2,6786
8 36,3564 3,001 36,394 3,1402
10 7.219 8.751 8.644 8.478 10 35,0026 3,3186 34,9308 3,5082
25 6.261 6.751 7.207 6.244 12 33,6814 3,664 33,8362 3,8328
45 6.337 5.829 6.134 5.878 14 32,6728 3,9614 32,8332 4,143
16 31,772 4,2558 31,9276 4,4528
18 31,0288 4,5294 31,1544 4,757

76
2008 Компьютерная оптика, том 32, №1

20 30,3278 4,8106 30,4278 5,0492 сравнении с алгоритмом компрессии на основе разде-


лимого вейвлет-базиса Хаара, как с точки зрения каче-
На рисунке 2 представлены фрагменты восста- ственных параметров компрессии, так и с точки зрения
новленных аппроксимаций исходного изображе- визуального качества восстановленных изображений.
ния для четырех алгоритмов компрессии. Как Благодарности
видно из представленных иллюстраций, использо-
вание обобщенных вейвлетов Хаара в задаче ком- Работа выполнена в рамках программы фунда-
прессии позволяет повысить визуальное качество ментальных научных исследований ОИТВС РАН
восстановленных изображений, за счет того, что «Новые физические и структурные решения в инфо-
артефакты имеют непрямоугольную сложную телекоммуникациях», проект "Разработка новых
конфигурацию, и менее заметны для зрительной методов и алгоритмов кодирования изображений в
системы человека. инфотелекоммуникационных системах реального
времени", в рамках российско-американской про-
граммы «Фундаментальные исследования и высшее
образование» (CRDF Project RUX0-014-SA-06), а
также при поддержке Российского фонда фундамен-
тальных исследований (РФФИ), гранты № 07-07-
97610-р_офи, 06-01-00722-а.

Литература
1. Белов А.М. "Алгоритмы декомпозиции сигнала на
основе неразделимых вейвлет-преобразований Хаара"
а б //Компьютерная оптика. – Самара - Москва, ИСОИ
РАН, СГАУ, 2007. – Том 31, № 1. С. 63 – 66.
2. Белов А.М. "Применение канонических систем
счисления в задаче построения неразделимых хааро-
подобных вейвлетов" //Компьютерная оптика, №28,
Самара - Москва, 2006 г., с. 119 – 123.
3. Grochenig K., Multiresolution Analysis, Haar Bases, and
Self-Similar Tilings of Rn // Grochenig K., Madych W.R.
IEEE Trans. Inform. Theory, 1992, 38, pp. 556 - 568.
4. Katai I., Canonical number systems in imaginary quadrat-
ic fields // Katai I., Kovacs B. Acta Math. Acad. Sci. Hun-
в г garicae, 1981, 37, pp. 159 - 164.
5. Katai I. Canonical number systems for complex integers
Рис.2. Исходное изображение (а), восстановленные изоб- // Katai I., Szabo J. Acta Sci. Math.(Szeged), 1975, 37, pp.
ражения для алгоритмов Haar (б), FDT (−1 + i) (в), 255 - 260.
6. Kovacs A. Generalized binary number systems. Annales
FDT ( − 3 + i 7 ) (г) univ. Sci. Budapest, Sect. Comp. 2001, 20, pp. 195-206.
2
7. Mendivil F., Two Algorithms for Non-Separable Wavelet
Transforms and Applications to Image Compression, //
Заключение Mendivil F., Piché D. -Fractals: Theory and Applications
В работе представлены результаты экспериментов in Engineering, Springer-Verlag, 1999.
подтверждающие целесообразность адаптивного вы- 8. Piché D.G. Complex Bases, Number Systems and Their
бора неразделимых обобщенных вейвлет-базисов Application to Fractal-Wavelet Image Coding // PhD in
Applied Mathematics thesis. Ontario, Canada: University
Хаара, в целях повышения качества решения задачи
of Waterloo, 2002.
компрессии. Также показана эффективность алгорит-
мов компрессии, на основе таких вейвлет-базисов, в

77
research of the efficiency of algorithms of image compression based on the generalized haar wavelet transforms
A.M. Belov 1,2
1 Samara State Aerospace University,
2 Image Processing Systems Institute оf the RAS

Abstract
The paper presents experimental results of the efficiency of image compression algorithms
based on generalized Haar wavelet transforms, from the point of view of qualitative compres-
sion parameters, adaptive wavelet basis selection and the visual quality of the reconstructed
images.
Keywords: digital image, compression of digital images, Haar wavelet basis, wavelet trans-
forms, artifact, generalized Haar wavelet basis inseparable two-dimensional wavelet trans-
forms.
Acknowledgements: The work was performed within the framework of the New Physical
and Structured Solutions in Information and Telecommunications Basic Research Program of
the Department of Nanotechnologies and Information Technologies of the RAS (the Develop-
ment of New Image-Coding Methods and Algorithms in On-line Information and Telecommu-
nications Systems Project), the Russian-American Basic Research and Higher Education Pro-
gram (CRDF Project RUX0-014-SA-06), and under the Russian Foundation for Basic Re-
search (RFBR grants No. 07-07- 97610-r_ofi and No. 06-01-00722-а).
Citation: Belov AM. Study of the efficiency of image compression algorithms based on
generalized Haar wavelet transforms [In Russian]. Computer Optics 2008; 32(1): 74-77.
References
[1] Belov AM. Signal decomposition algorithms based [5] Katai I, Szabo J. Canonical number systems for com-
on the Haar nonseparable wavelet transforms [In Rus- plex integers. Acta Sci. Math. (Szeged) 1975; 37: 255-
sian]. Computer Optics 2007; 31(1): 63-66. 260.
[2] Belov AM. Application of the canonical number [6] Kovacs A. Generalized binary number systems. An-
systems to the construction of nonseparable Haar- nales univ. Sci. Budapest, Sect. Comp. 2001; 20: 195-
like wavelets [In Russian]. Computer Optics 2006; 206.
28: 119-123. [7] Mendivil F, Piché DG. Two Algorithms for Non-
[3] Grochenig K, Madych WR. Multiresolution Analysis, Separable Wavelet Transforms and Applications to
Haar Bases, and Self-Similar Tilings of Rn. IEEE Image Compression. Fractals: Theory and Applica-
Trans. Inform. Theory 1992; 38: 556-568. tions in Engineering. Springer-Verlag 1999.
[4] Katai I, Kovacs B. Canonical number systems in im- [8] Piché DG. Complex Bases, Number Systems and
aginary quadratic fields. Acta Math. Acad. Sci. Hun- Their Application to Fractal-Wavelet Image Coding.
garicae 1981; 37: 159-164. PhD in Applied Mathematics thesis. Ontario, Canada:
University of Waterloo, 2002. 1.77