Вы находитесь на странице: 1из 27

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

BAB II
MULTIMEDIA SIGNAL PROCESSING
a. PERCEPTUAL CODING AND MP3
I.

Tujuan Percobaan
1. Mempelajari dasar-dasar persepsi pengkodean audio dan intelektual hak
perlindungan dari multimedia.
2. Desain audio digital watermarking sistem dalam waktu dan domain
frekuensi.
3. Menjelajahi audio sintetis: MIDI dan MPEG4 Audio terstruktur.

II.

Teori Dasar
Audio atau suara merupakan gelombang yang mengandung sejumlah
komponen penting (amplitudo, panjang gelombang dan frekuensi) yang dapat
menyebabkan

suara yang satu berbeda dari suara lain. Amplitudo adalah

kekuatan atau daya gelombang sinyal. Tinggi gelombang yang bisa dilihat sebagai
grafik, Gelombang yang lebih tinggi diinterpretasikan sebagai volume yang lebih
tinggi, Suara beramplitudo lebih besar akan terdengar lebih keras. Frekuensi
adalah jumlah dari siklus yang terjadi dalam satu detik. Satuan dari frekuensi
adalah Hertz atau disingkat Hz. Getaran gelombang suara yang cepat membuat
frekuensi semakin tinggi. Misalnya, bila menyanyi dalam pita suara tinggi
memaksa tali suara untuk bergetar secara cepat. Suara dengan frekuensi lebih
besar akan terdengar lebih tinggi.
Gelombang suara adalah gelombang yang dihasilkan dari sebuah benda yang
bergetar. Sebagai contoh, senar gitar yang dipetik, gitar akan bergetar dan
getaran ini merambat di udara, atau air, atau material lainnya. Satu-satunya
tempat dimana suara tak dapat merambat adalah ruangan hampa udara.
Gelombang suara ini memiliki lembah dan bukit, satu buah lembah dan bukit akan
menghasilkan satu siklus atau periode. Siklus ini berlangsung berulang-ulang,
yang membawa pada konsep frekuensi.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

WAV adalah format file audio standar Microsoft dan IBM untuk personal
computer(PC),

biasanya

menggunakan

pengkodean

PCM

(Pulse

Code

Modulation). WAV adalah data tidak terkompres sehingga seluruh sampel audio
disimpan semuanya di harddisk. Perangkat lunak yang dapat menciptakan WAV
dari sinyal analog misalnya adalah Windows Sound Recorder. WAV jarang sekali
digunakan di internet karena ukurannya yang relatif besar dengan batasan
maksimal untuk file WAV adalah 2GB.
Secara umum data audio digital dari WAV memiliki karakteristik yang dapat
dinyatakan dengan parameter-parameter berikut:
a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau
4100 sampel/detik.
b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.
c. Jumlah kanal (channel), yaitu 1 untuk mono dan 2 untuk stereo.
Parameter-parameter tersebut menyatakan pengaturan yang digunakan oleh
ADC pada saat data audio direkam. Biasanya laju sampel juga dinyatakan dengan
satuan Hz atau kHz. Sebagai gambaran, data audio digital yang tersimpan dalam
CD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per sampel, dan 2
kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100 sampel,
dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju sampel
selalu dinyatakan untuk setiap satu kanal (channel). Jadi misalkan suatu data
audio digital memiliki 2 kanal (channel) dengan laju sampel 8000 sampel/detik,
maka di dalam setiap detiknya akan terdapat 16000 sampel.
MPEG-1 audio layer III atau yang lebih dikenal dengan MP3, adalah
pengkodean dalam digital audio dan juga merupakan format kompresi audio yang
memiliki sifat menghilangkan. Istilah menghilangkan yang dimaksud adalah
kompresi audio ke dalam format mp3 menghilangkan aspek-aspek yang tidak
signifikan pada pendengaran manusia untuk mengurangi besarnya file audio.
Sejarah MP3 dimulai dari tahun 1991 saat proposal dari Phillips (Belanda),
CCET (Perancis), dan Institut fr Rundfunktechnik (Jerman) memenangkan proyek

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

untuk DAB (Digital Audio Broadcast). Produk mereka seperti Musicam (lebih
dikenal dengan layer 2) terpilih karena kesederhanaan, ketahanan terhadap
kesalahan, dan perhitungan komputasi yang sederhana untuk melakukan
pengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Pada
akhirnya ide dan teknologi yang digunakan dikembangkan menjadi MPEG-1 audio
layer 3. MP3 adalah pengembangan dari teknologi sebelumnya sehingga dengan
ukuran yang lebih kecil dapat menghasilkan kualitas yang setara dengan kualitas
CD.
III.

Alat dan Bahan yang Digunakan


1. 1 perangkat personal computer
2. Program aplikasi Matlab

IV. Prosedur Percobaan


1. Model psychoacoustic dan persepsi pengkodean

Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak peneliti


di bidang psychoacoustics mengeksploitasi tidak relevan sinyal informasi
yang tidak terdeteksi bahkan oleh pendengar terlatih atau sensitive . studistudi ini menyebabkan lima psychoancoustic.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

Ambang mutlak hearing : threshold ini merupakan jumlah minimal energy


jika pendengar mampu mendeteksi nada murni dalam lingkungan tak
bersuara jika sebuah nada diberikan terlalu lemah, kita tidak bisa
mendengarnya, jadi kita tidak perlu menyalinnya.

Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai non


uniform filter bank yang terdiri dari 25 filter bandpass sangat tumpang
tindih. Band kritis adalah pass band dari filter mereka.

Simultaneous masking : Dalam setiap critical band, satu suara (the


maskee) diterjemahkan tak terdengar karena kehadiran suara yang lain
(the masker ). Kita dapat mengidentifikasi sebuah masker dan tidak
menyandikan tak terdengar, masked tones.

Spread of masking : masking pada sebuah critical band dapat


menyebarkan neighboring bands.

Non-Simultaneous masking : Masking juga dapat dilakukan dalam domain


waktu.
Untuk perceptual coding, encoder menghasilkan sebuah global masker

yang sesuai dengan prinsip di atas dan memberikan parameter untuk diproses
lebih lanjut. Pada bagian ini kami menyelidiki ambang mutlak pendengaran
dan prinsip-prinsip yang menandai simultan.
a. The absolute threshold of hearing
Pada bagian ini kita menggunakan PM_Abs_Thre_Hearing.m. untuk
mengeksplorasi batas absolute pendengaran. Tujuan dari penelitian ini adalah
untuk mengetahui ambang batas volume yang hanya auditable pada
frekuensi tertentu. Dengan kata lain, diberikan nada dengan sama frekuensi,
jika memilih volume sedikit lebih rendah dari batas ini, menjadi tak terdengar.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.


Setelah mengatur buku ini, Anda akan melihat gambar diatas. Setiap
lingkaranmewakili komponen frekuensi dan kita dapat mengurangi volume
dengan hanyatertinggal mengklik mouse di sisi atas/bawah lingkaran ini. Anda
dapat klik kananmouse untuk keluar dari program ini. Menemukan jalan
keluar untuk telinga Anda pada frekuensi 11 yang ditunjukkan padagambar.
Sosok hasil Anda menggunakan mengedit salinan gambar dari menu
barjendela gambar copy dan paste ke laporan Anda.
b. Simultan Masking:
Dalam bagian ini, kita menggunakan PM_Simu_Masking.m untuk
menjelajahi maskingsimultan, yang berarti bahwa nada bisa menjadi
merender jika ada nada simultandengan volume yang lebih tinggi pada
frekuensi yang tetangga. Untuk setiap band yang kritis,kita bisa memperbaiki
volume frekuensi tengah. Dengan menambahkan nada tetangga yang
berbeda amplitudo, kita bisa menemukan ambang atas nada ini tetangga
terdengar jika amplitudo lebih rendah daripada batas, tapi audible jika
amplitudo lebih tinggi daripada ambang batas.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengar


volume minimal untuk 4KHz. Setelah kalibrasi, Anda akan melihat sosok lain
yang digambarkan di bawah ini. Ada tujuh frekuensi yang ditunjukkan oleh
lingkaran. Tengah satu mewakili Pusat frekuensi band kritis yang spesifik.
Ketika kita klik tetangga frekuensi, program ini akan menghasilkan sinyal
audio yang terdiri dari pusat frekuensi dan frekuensi dipilih. Kami dapat
menambah/mengurangi volume oleh hanya mengklik kiri mouse di sisi
atas/bawah lingkaran ini. Setelah mencari tahu ambang frekuensi enam
(kecuali frekuensi tengah), klik kanan mouse untuk keluar dari program ini.
Pilih dua band kritis yang berbeda 3 dan mengetahui masking simultan
dari Anda telinga. Salin angkaangka ini dua menggunakan mengedit salinan
gambar dari menubar ini mencari jendela dan sisipkan mereka di laporan
Anda. Untuk setiap band yang kritis,membandingkan topeng frekuensi
tetangga yang lebih tinggi dengan yang lebih rendah.
2. Audio Ekstraksi dan MP3
MP3 (MPEG1 Audio Layer 3) adalah standar pengkodean/kompresi audio
yang menggunakan persepsi pengkodean teknologi. Dalam bagian ini, kita
menggunakan GoldWaveuntuk mengambil sepotong musik dan kompres dalam

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerja


dengan membandingkan spektrum frekuensi sinyal mentah dan MP3 file:

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

a. CD Audio ekstraksi: klik ToolsCD audio ekstraksi dari GoldWave's menu


Bar. Jendela ekstraksi audio yang akan muncul. Gunakan tool ini untuk
mengekstraksekitar sepuluh detik musik 4 dari CD musik favorit Anda
dan menyimpannya sebagai 16-bit stereo ditandatangani WAV file.
Nama itu sebagai original.wav.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

b. Downsampling: untuk membandingkan dengan MP3, kita perlu


downsample fileWAV ini. Klik Efek Resample dan memilih 16000 Hz.
Simpan file ini sebagai downsample.wav.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

c. Menghasilkan MP3 file oleh File Save As. pilih Simpan sebagai jenis
sebagaigelombang Audio. Menyesuaikan parameter dalam File atribut
sebagai MPEG Layer 3, 32kbps, 16000Hz, stereo. Nama file baru ini
sebagai wav2mp3.wav.

d. Mengkonversi MP3 ke wave: Reload wav2mp3 file dan menyimpannya


sebagai 16bit stereo ditandatangani WAV file. Nama itu sebagai
reconstructed_wav.wav.

e. Bandingkan spektrum: menggunakan Compare_Spectrum.m 5 untuk plot


spektrum

untuk

downsample.wav

dan

reconstructed_wav.wav.

Membandingkan perbedaan antara audio dua chip dan mendiskusikan


pada frekuensi yang berkisar psychoacoustic model ini memiliki dampak
yang signifikan.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

V.Data Hasil Simulasi


1. Model Psychoacoustic dan Coding perseptual
a. Absolute Threshold of Hearing
Script PM_Abs_Thre_Hearing.m
function [LogX,volumnY]=PM_Abs_Thre_Hearing

% function [LogX,volumnY]=PM_Abs_Thre_Hearing
% measure absolute threshold of hearing
%

LogX : vector of x

volumnY : the corresponding absolute threshold of hearing

% Two stages in this program


% Stage 1: Calibrate the 4KHz threshold, adjust the volume to just
noticeable auditible.
%

We use this for reference to adjust the other frequency

% Stage 2: Measure absolute threshold of hearing 10 frequencies


%

1. For each frequenct,users can change the volume in a

specific frequency
%

by left clicking mouse. Users can

move upper and

lower until selecting


%

a threshold which is just noticeable auditible.

Suggestion: the threshold had better to be choosed by

increasing the volume.


%

Because if user changes it by reducing,

he/she will expect the sound


%

2. After setting those 10 frequencies, right click mouse

and exit this program.


%

3. This function also returns those thresholds ,

[LogX,volumnY], back
%

4. Users can also copy or save this figure by Edit -->

Copy Figure or File --> Save As


%
% Author : Guan-Ming Su
% Date : 3/10/02

close all;
clear all;

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

SampleRate=40000;
Max_bit=16;
total_time=0.75;
t=0:total_time*SampleRate-1;

%%%% calibrate 4k for min tone


figure
min_4K_amp=1;
k4x=1:3; k4y=[0 1 0];

bar(k4x,k4y);

axis([1 3 0 16]);

title('Stage 1: Calibrating 4K Hz threshold ');


legend('Left Click mouse to seek the minimal volumn, Right click to
Stage 2');
ylabel('Bits');
xlabel('Current value: 1');
grid on;
CaliFlag=1;
F4k=4000;

while CaliFlag==1
[x1,y1, butn]=ginput(1);
if butn==3;
else ;

break;

min_4K_amp=y1;

% right click
end;

min_4K_amp=1/power(2,Max_bit-y1);
y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);
bar(k4x,y1*k4y);

axis([1 3 0 16]);

title('Stage 1: Calibrating 4K Hz threshold ');


legend('Left Click mouse to seek the minimal volumn, Right click
to Stage 2');
ylabel('Bits');
xlabel(strcat('Current value: ',num2str(y1)));
grid on;
sound(y4k,SampleRate);
end
close all;

% measure the absolute threshold of hearing

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

figure
StopFlag=0;
startLogX=2;

EndLogX=4; numLogX=11;

min_Volume=-10;max_Volume=40;
volumnY=ones(1,numLogX);
LogX=logspace(startLogX,EndLogX,numLogX);
dividerLogX=logspace(startLogX,EndLogX,numLogX*2-1);
dividerLogX=dividerLogX(2:2:end); dividerLogX=[0 dividerLogX];
semilogx(LogX,volumnY,'-o');
axis([power(10,startLogX) power(10,EndLogX) min_Volume max_Volume]);
title('Stage 2: Measure Absolute Threshold of Hearing');
xlabel('Frequency(Hz)');
ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');
legend('Left Click mouse to adjust the volume. Right click to
Exit');
grid on

min_4K_power=min_4K_amp^2;

while StopFlag==0
[x1,y1, butn]=ginput(1);
if butn==3;

break;

% right click

else
newFindex=find(x1 > dividerLogX );
selectF=newFindex(end);
newF=LogX(selectF);
newAMP=sqrt(min_4K_power*power(10,y1/10));
volumnY(selectF)=y1;
semilogx(LogX,volumnY,'-o');
title('Stage 2: Measure Absolute Threshold of Hearing');
axis([power(10,startLogX) power(10,EndLogX)

min_Volume

max_Volume]);
xlabel('Frequency(Hz)');
ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');
legend('Left Click mouse to adjust the volume. Right click to
Exit');
grid on
y1=newAMP*sin(2*pi*newF*t/SampleRate);

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

sound(y1,SampleRate)
end
end

Gambar 5.1 Hasil Running 1


Stage 2: Measure Absolute Threshold of Hearing

40

Left Click mouse to adjust the volume. Right click to Exit


35

Related Sound Pressure Level to 4K Hz, rSPL(dB)

30

25

20

15

10

-5

-10
2
10

10
Frequency(Hz)

10

Gambar 5.2 Hasil Running 2


b. Simultaneous Masking
Script PM_Simu_Masking.m
function [LinX,volumnY]=PM_Simu_Masking(ith_CB)

% function [LinX,volumnY]=PM_Simu_Masking(ith_CB)
% Measure simultaneous masking
% output

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

LinX : vector of x

volumnY : the corresponding simultaneous mask

% input
%

ith_CB : select the ith Critical Band

% Two stages in this program


% Stage 1: Calibrate the 4KHz threshold, adjust the volume to just
noticeable auditible.
%

We use this for reference to adjust the other frequency

% Stage 2: Measure Measure simultaneous masking for 6 frequencies


%

1. For each frequenct,users can change the volume in a

specific frequency
%

by left clicking mouse. Users can

move upper and

lower until selecting


%

a mask which the neighbor tone is maksed by the center

frequency tone
%

Suggestion: the threshold had better to be choosed by

increasing the volume.


%

Because if user changes it by reducing,

he/she will expect the sound


%

2. After setting those 6 frequencies, right click mouse

and exit this program.


%

3. This function also returns those thresholds ,

[LogX,volumnY], back
%

4. Users can also copy or save this figure by Edit -->

Copy Figure or File --> Save As


%
% Author : Guan-Ming Su
% Date : 3/10/02

close all;

% Idealized Critical Band Filter Bank.


CB_FB=[
400;

50

450

0
400

700

630

1270; 1370 1270

100;
510;
770;
1480;

150
570
840
1600

100
510
770
1480

200;

250

200

300;

350

300

630;
920; 1000

920 1080; 1175 1080

1720;

1850 1720 2000; 2150 2000 2320; 2500 2320 2700; 2900 2700
3150; 3400 3150

3700;

4000

3700

4400;

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

4800 4400 5300; 5800 5300 6400; 7000 6400 7700; 8500 7700
9500;10500 9500 12000; 13500 12000 15500];
numX=7;

% number fo frequencies to plot the masking

NumCB=size(CB_FB,1);
if (ith_CB > NumCB)|(ith_CB < 1)

% error detection

error('There is no such a critical band existing');


end

% initilized parameters.
SampleRate=40000;
Max_bit=16;
total_time=0.75;
t=0:total_time*SampleRate-1;
min_4K_amp=1;

%%%% calibrate 4k for min tone


figure
k4x=1:3; k4y=[0 1 0];

bar(k4x,k4y);

axis([1 3 0 16]);

title('Stage 1: Calibrating 4K Hz threshold ');


legend('Left Click mouse to seek the minimal volumn, Right click to
Stage 2');
ylabel('Bits');
xlabel('Current value: 1');
grid on;
CaliFlag=1;
F4k=4000;

while CaliFlag==1
[x1,y1, butn]=ginput(1);
if butn==3;
else ;

break;

min_4K_amp=y1;

% right click
end;

min_4K_amp=1/power(2,Max_bit-y1);
y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);
bar(k4x,y1*k4y);

axis([1 3 0 16]);

title('Stage 1: Calibrating 4K Hz threshold ');


legend('Left Click mouse to seek the minimal volumn, Right click
to Stage 2');
ylabel('Bits');

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

xlabel(strcat('Current value: ',num2str(y1)));


grid on;
sound(y4k,SampleRate);
end
close all;
min_4K_power=min_4K_amp^2;

% measure the simultaneous masking


figure
StopFlag=0;

CenterX=CB_FB(ith_CB,1);startX=CB_FB(ith_CB,2);
EndX=CB_FB(ith_CB,3);
centerFreqIndex=ceil(numX/2);
passband=EndX-startX; plot_range=[CenterX-passband
CenterX+passband];
max_mid_Freq_AMP=0.45;
mid_Freq_DB=10*log10((max_mid_Freq_AMP^2)/min_4K_power);
min_Volume=-10;

max_Volume=10*ceil(mid_Freq_DB/10)+10;

volumnY=ones(1,numX); volumnY(centerFreqIndex)=mid_Freq_DB;
LinX=linspace(startX,EndX,numX);
dividerLinX=linspace(startX,EndX,numX*2-1);
dividerLinX=dividerLinX(2:2:end); dividerLinX=[0 dividerLinX];
plot(LinX,volumnY,'-o');
axis([plot_range(1) plot_range(2) min_Volume max_Volume]);
title('Stage 2: Measure simultaneous masking');
xlabel('Frequency(Hz)');
ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');
legend('Left Click mouse to adjust the volume. Right click to
Exit');
grid on

% centeral tone
yc=max_mid_Freq_AMP*sin(2*pi*CenterX*t/SampleRate);

while StopFlag==0
[x1,y1, butn]=ginput(1);
if butn==3;

break;

% right click

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

else
newFindex=find(x1 > dividerLinX );
selectF=newFindex(end);
if selectF==centerFreqIndex

% centeral tone

sound(yc,SampleRate);
else
newF=LinX(selectF);
newAMP=sqrt(min_4K_power*power(10,y1/10));
volumnY(selectF)=y1;
plot(LinX,volumnY,'-o');
axis([plot_range(1) plot_range(2) min_Volume max_Volume]);
title('Stage 2: Measure simultaneous masking');
xlabel('Frequency(Hz)');
ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');
legend('Left Click mouse to adjust the volume. Right click to
Exit');
grid on
y1=newAMP*sin(2*pi*newF*t/SampleRate);

% generate

neighboring tone
ymix=y1+yc;

% add two tones

sound(ymix,SampleRate);
end
end
end

Gambar 5.3 Idealized Critical Band Filter Bank

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

Gambar 5.4 Ketik kode critical band yang akan digunakan


Kode yang digunakan adalah 1, yaitu 50 0 100;

Gambar 5.5 Kalibrasi 4K Hz treshold pada 10 bits

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

Gambar 5.6 Hasil running 1


2. Audio Extraction and MP3
a. Audio Extraction

Gambar 5.7 original.wav

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

b. Downsampling

Gambar 5.8 downsampling.wav


c. Generate MP3

Gambar 5.9 wav2mp3.wav


d. Convert to MP3

Gambar 5.10 wav2mp3.mp3

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

e. Compare Spectrum

Gambar 5.12 Hasil Compare

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

VI.Analisa Data Hasil Simulasi


1. Psychoacoustic Models and Perceptual Coding
a. Absolute Threshold of Hearing
Pada percobaan kali ini, software Matlab-lah yang digunakan sebagai
software utama. Absolute Threshold of Hearing atau Ambang mutlak
pendengaran ( ATH ) adalah tingkat suara minimal nada murni bahwa
telinga manusia rata-rata dengan pendengaran normal bisa mendengar
tanpa hadir suara lainnya . Ambang mutlak berkaitan dengan suara yang
hanya dapat didengar oleh organisme . Ambang batas absolut bukanlah
titik diskrit oleh karena itu digolongkan sebagai titik di mana suara
memunculkan respon persentase tertentu dari waktu . Dari langkahlangkah yang dilakukan diperoleh nilai sebesar 9.4269 untuk kalibrasi 4
KHz threshold.
b. Simultaneous Masking
Untuk percobaannya ini, hampir sama dengan langkah sebelumnya.
Dibutuhkan kalibrasi 4 KHz. Simultaneous masking merupakan fenomena
domain frekuensi di mana sinyal rendah tingkat , misalnya , suara
smallband ( maskee ) dapat dibuat tak terdengar oleh simultan yang
terjadi sinyal yang lebih kuat ( masker ) , misalnya , nada murni, jika
masker dan maskee cukup untuk menutup satu sama lain dalam frekuensi.
Sebuah ambang masking dapat diukur di bawah ini yang sinyal apapun
tidak akan terdengar. Pada masking threshold tergantung pada tingkat
tekanan suara ( SPL ) dan frekuensi masker , dan pada karakteristik masker
dan maskee.
2. Audio Extraction and MP3
a. Audio Extraction
Untuk langkah kedua ini, software yang digunakan adalah Goldwave . File
audio yang berformat mp3 dengan size 7.34 MB dikonfersi ke format wav
dengna size yan meningkat drastic menjadi 34.8 MB. Hal ini dikarenakan

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

kualitas audio yang dihasilkan dari format lebih jernih dan lebih baik
dibanding mp3. WAV adalah format file audio standar Microsoft dan IBM
untuk personal computer (PC), biasanya menggunakan pengkodean PCM
(Pulse Code Modulation). Pada WAV, data tidak terkompres sehingga
seluruh sampel audio tetap ada.
b. Downsampling
Pada percobaan downsampling, diperoleh size 11 MB. Hal ini dikarenakan
downsampling adalah teknik untuk menurunkan sample rate audionya.
c. Generate MP3
Pada langkah ini, file yang berdurasi 10 detik dengan format WAV
berukuran 34.8 MB dikonversi ke format MP3 dan diperoleh size 744 KB.
Hal ini dikarenakan format MP3 membuat audio-audio yang tidak
dibutuhkan oleh telinga, sehingga size-nya berkurang.
d. Rekonstruksi
Pada langkah ini, hasil yang diperoleh tidak jauh beda dengan langkah
sebelumya.
e. Compare Spectrum
Pada langkah ini, digunakan Matlab untuk dapat membandingkan dua dile
audio. Dari hasil matlab diperoleh perbedaannya sangat sedikit. Hal ini
dikarenakan size dari file yang direkonstruksi

dan downsampling

perbedaannya hanya sedikit.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

VII.Kesimpulan
1. Bunyi dengan frekuensi 20-20.000 Hz hanya dapat didengar ole telinga
manusia
2. Format audio file WAV atau waveform audio merupakan format audio yang
yang tidak terkompres sehingga ukurannya besar sekali. Sedangkan format
MP3 merupakan format audio yang umum digunakan karena size-nya cukup
rendah karena audio dikompresi atau audio yang tidak dibutuhkan oleh
telinga dibuang.
3. Downsampling merupakan teknik untuk menurunkan sample rate audio-nya.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA


IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE

DAFTAR PUSTAKA
http://core.ac.uk/download/pdf/11719325.pdf
http://lecturer.polindra.ac.id/~munengsih/wp-content/uploads/2012/04/3-Audiodan-Video1.pdf
http://repository.usu.ac.id/bitstream/123456789/19785/3/Chapter%20II.pdf

MAHARANI AYU LESTARI / D41112285

Вам также может понравиться