BAB VII - Perception Audio Dan Mp3

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA
IMAGE PROCESSING
LABORATORIUM TELEKOMUNIKASI, RADIO, DAN MICROWAVE
BAB II
MULTIMEDIA SIGNAL PROCESSING
a. PERCEPTUAL CODING AND MP3
I.
Tujuan Percobaan
1. Mempelajari dasar-dasar persepsi pengkodean audio dan intelektual hak
perlindungan dari multimedia.
2. Desain audio digital watermarking sistem dalam waktu dan domain
frekuensi.
3. Menjelajahi audio sintetis: MIDI dan MPEG4 Audio terstruktur.
II.
Teori Dasar
Audio atau suara merupakan gelombang yang mengandung sejumlah
komponen penting (amplitudo, panjang gelombang dan frekuensi) yang dapat
menyebabkan
suara yang satu berbeda dari suara lain. Amplitudo adalah
kekuatan atau daya gelombang sinyal. Tinggi gelombang yang bisa dilihat sebagai
grafik, Gelombang yang lebih tinggi diinterpretasikan sebagai volume yang lebih
tinggi, Suara beramplitudo lebih besar akan terdengar lebih keras. Frekuensi
adalah jumlah dari siklus yang terjadi dalam satu detik. Satuan dari frekuensi
adalah Hertz atau disingkat Hz. Getaran gelombang suara yang cepat membuat
frekuensi semakin tinggi. Misalnya, bila menyanyi dalam pita suara tinggi
memaksa tali suara untuk bergetar secara cepat. Suara dengan frekuensi lebih
besar akan terdengar lebih tinggi.
Gelombang suara adalah gelombang yang dihasilkan dari sebuah benda yang
bergetar. Sebagai contoh, senar gitar yang dipetik, gitar akan bergetar dan
getaran ini merambat di udara, atau air, atau material lainnya. Satu-satunya
tempat dimana suara tak dapat merambat adalah ruangan hampa udara.
Gelombang suara ini memiliki lembah dan bukit, satu buah lembah dan bukit akan
menghasilkan satu siklus atau periode. Siklus ini berlangsung berulang-ulang,
yang membawa pada konsep frekuensi.
MAHARANI AYU LESTARI / D41112285

IMAGE PROCESSING
WAV adalah format file audio standar Microsoft dan IBM untuk personal
computer(PC),
biasanya
menggunakan
pengkodean
PCM
(Pulse
Code
Modulation). WAV adalah data tidak terkompres sehingga seluruh sampel audio
disimpan semuanya di harddisk. Perangkat lunak yang dapat menciptakan WAV
dari sinyal analog misalnya adalah Windows Sound Recorder. WAV jarang sekali
digunakan di internet karena ukurannya yang relatif besar dengan batasan
maksimal untuk file WAV adalah 2GB.
Secara umum data audio digital dari WAV memiliki karakteristik yang dapat
dinyatakan dengan parameter-parameter berikut:
a. Laju sampel (sampling rate) dalam sampel/detik, misalnya 22050 atau
4100 sampel/detik.
b. Jumlah bit tiap sampel, misalnya 8 atau 16 bit.
c. Jumlah kanal (channel), yaitu 1 untuk mono dan 2 untuk stereo.
Parameter-parameter tersebut menyatakan pengaturan yang digunakan oleh
ADC pada saat data audio direkam. Biasanya laju sampel juga dinyatakan dengan
satuan Hz atau kHz. Sebagai gambaran, data audio digital yang tersimpan dalam
CD audio memiliki karakteristik laju sampel 44100 Hz, 16 bit per sampel, dan 2
kanal (stereo), yang berarti setiap satu detik suara tersusun dari 44100 sampel,
dan setiap sampel tersimpan dalam data sebesar 16-bit atau 2 byte. Laju sampel
selalu dinyatakan untuk setiap satu kanal (channel). Jadi misalkan suatu data
audio digital memiliki 2 kanal (channel) dengan laju sampel 8000 sampel/detik,
maka di dalam setiap detiknya akan terdapat 16000 sampel.
MPEG-1 audio layer III atau yang lebih dikenal dengan MP3, adalah
pengkodean dalam digital audio dan juga merupakan format kompresi audio yang
memiliki sifat menghilangkan. Istilah menghilangkan yang dimaksud adalah
kompresi audio ke dalam format mp3 menghilangkan aspek-aspek yang tidak
signifikan pada pendengaran manusia untuk mengurangi besarnya file audio.
Sejarah MP3 dimulai dari tahun 1991 saat proposal dari Phillips (Belanda),
CCET (Perancis), dan Institut fr Rundfunktechnik (Jerman) memenangkan proyek

IMAGE PROCESSING
untuk DAB (Digital Audio Broadcast). Produk mereka seperti Musicam (lebih
dikenal dengan layer 2) terpilih karena kesederhanaan, ketahanan terhadap
kesalahan, dan perhitungan komputasi yang sederhana untuk melakukan
pengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Pada
akhirnya ide dan teknologi yang digunakan dikembangkan menjadi MPEG-1 audio
layer 3. MP3 adalah pengembangan dari teknologi sebelumnya sehingga dengan
ukuran yang lebih kecil dapat menghasilkan kualitas yang setara dengan kualitas
CD.
III.
Alat dan Bahan yang Digunakan

1. 1 perangkat personal computer
2. Program aplikasi Matlab
IV. Prosedur Percobaan

1. Model psychoacoustic dan persepsi pengkodean
Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak peneliti

di bidang psychoacoustics mengeksploitasi tidak relevan sinyal informasi
yang tidak terdeteksi bahkan oleh pendengar terlatih atau sensitive . studistudi ini menyebabkan lima psychoancoustic.

IMAGE PROCESSING
Ambang mutlak hearing : threshold ini merupakan jumlah minimal energy

jika pendengar mampu mendeteksi nada murni dalam lingkungan tak
bersuara jika sebuah nada diberikan terlalu lemah, kita tidak bisa
mendengarnya, jadi kita tidak perlu menyalinnya.
Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai non

uniform filter bank yang terdiri dari 25 filter bandpass sangat tumpang
tindih. Band kritis adalah pass band dari filter mereka.
Simultaneous masking : Dalam setiap critical band, satu suara (the

maskee) diterjemahkan tak terdengar karena kehadiran suara yang lain
(the masker ). Kita dapat mengidentifikasi sebuah masker dan tidak
menyandikan tak terdengar, masked tones.
Spread of masking : masking pada sebuah critical band dapat

menyebarkan neighboring bands.
Non-Simultaneous masking : Masking juga dapat dilakukan dalam domain

waktu.
Untuk perceptual coding, encoder menghasilkan sebuah global masker
yang sesuai dengan prinsip di atas dan memberikan parameter untuk diproses
lebih lanjut. Pada bagian ini kami menyelidiki ambang mutlak pendengaran
dan prinsip-prinsip yang menandai simultan.
a. The absolute threshold of hearing
Pada bagian ini kita menggunakan PM_Abs_Thre_Hearing.m. untuk
mengeksplorasi batas absolute pendengaran. Tujuan dari penelitian ini adalah
untuk mengetahui ambang batas volume yang hanya auditable pada
frekuensi tertentu. Dengan kata lain, diberikan nada dengan sama frekuensi,
jika memilih volume sedikit lebih rendah dari batas ini, menjadi tak terdengar.

IMAGE PROCESSING
Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.

Setelah mengatur buku ini, Anda akan melihat gambar diatas. Setiap
lingkaranmewakili komponen frekuensi dan kita dapat mengurangi volume
dengan hanyatertinggal mengklik mouse di sisi atas/bawah lingkaran ini. Anda
dapat klik kananmouse untuk keluar dari program ini. Menemukan jalan
keluar untuk telinga Anda pada frekuensi 11 yang ditunjukkan padagambar.
Sosok hasil Anda menggunakan mengedit salinan gambar dari menu
barjendela gambar copy dan paste ke laporan Anda.
b. Simultan Masking:
Dalam bagian ini, kita menggunakan PM_Simu_Masking.m untuk
menjelajahi maskingsimultan, yang berarti bahwa nada bisa menjadi
merender jika ada nada simultandengan volume yang lebih tinggi pada
frekuensi yang tetangga. Untuk setiap band yang kritis,kita bisa memperbaiki
volume frekuensi tengah. Dengan menambahkan nada tetangga yang
berbeda amplitudo, kita bisa menemukan ambang atas nada ini tetangga
terdengar jika amplitudo lebih rendah daripada batas, tapi audible jika
amplitudo lebih tinggi daripada ambang batas.

IMAGE PROCESSING
Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengar

volume minimal untuk 4KHz. Setelah kalibrasi, Anda akan melihat sosok lain
yang digambarkan di bawah ini. Ada tujuh frekuensi yang ditunjukkan oleh
lingkaran. Tengah satu mewakili Pusat frekuensi band kritis yang spesifik.
Ketika kita klik tetangga frekuensi, program ini akan menghasilkan sinyal
audio yang terdiri dari pusat frekuensi dan frekuensi dipilih. Kami dapat
menambah/mengurangi volume oleh hanya mengklik kiri mouse di sisi
atas/bawah lingkaran ini. Setelah mencari tahu ambang frekuensi enam
(kecuali frekuensi tengah), klik kanan mouse untuk keluar dari program ini.
Pilih dua band kritis yang berbeda 3 dan mengetahui masking simultan
dari Anda telinga. Salin angkaangka ini dua menggunakan mengedit salinan
gambar dari menubar ini mencari jendela dan sisipkan mereka di laporan
Anda. Untuk setiap band yang kritis,membandingkan topeng frekuensi
tetangga yang lebih tinggi dengan yang lebih rendah.
2. Audio Ekstraksi dan MP3
MP3 (MPEG1 Audio Layer 3) adalah standar pengkodean/kompresi audio
yang menggunakan persepsi pengkodean teknologi. Dalam bagian ini, kita
menggunakan GoldWaveuntuk mengambil sepotong musik dan kompres dalam

IMAGE PROCESSING
MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerja

dengan membandingkan spektrum frekuensi sinyal mentah dan MP3 file:

IMAGE PROCESSING
a. CD Audio ekstraksi: klik ToolsCD audio ekstraksi dari GoldWave's menu

Bar. Jendela ekstraksi audio yang akan muncul. Gunakan tool ini untuk
mengekstraksekitar sepuluh detik musik 4 dari CD musik favorit Anda
dan menyimpannya sebagai 16-bit stereo ditandatangani WAV file.
Nama itu sebagai original.wav.

IMAGE PROCESSING
b. Downsampling: untuk membandingkan dengan MP3, kita perlu

downsample fileWAV ini. Klik Efek Resample dan memilih 16000 Hz.
Simpan file ini sebagai downsample.wav.

IMAGE PROCESSING
c. Menghasilkan MP3 file oleh File Save As. pilih Simpan sebagai jenis
sebagaigelombang Audio. Menyesuaikan parameter dalam File atribut
sebagai MPEG Layer 3, 32kbps, 16000Hz, stereo. Nama file baru ini
sebagai wav2mp3.wav.
d. Mengkonversi MP3 ke wave: Reload wav2mp3 file dan menyimpannya

sebagai 16bit stereo ditandatangani WAV file. Nama itu sebagai
reconstructed_wav.wav.
e. Bandingkan spektrum: menggunakan Compare_Spectrum.m 5 untuk plot

spektrum
untuk
downsample.wav
dan
reconstructed_wav.wav.
Membandingkan perbedaan antara audio dua chip dan mendiskusikan

pada frekuensi yang berkisar psychoacoustic model ini memiliki dampak
yang signifikan.

IMAGE PROCESSING

IMAGE PROCESSING
V.Data Hasil Simulasi

1. Model Psychoacoustic dan Coding perseptual
a. Absolute Threshold of Hearing
Script PM_Abs_Thre_Hearing.m
function [LogX,volumnY]=PM_Abs_Thre_Hearing
% function [LogX,volumnY]=PM_Abs_Thre_Hearing
% measure absolute threshold of hearing
%
LogX : vector of x
volumnY : the corresponding absolute threshold of hearing
% Two stages in this program

% Stage 1: Calibrate the 4KHz threshold, adjust the volume to just
noticeable auditible.
%
We use this for reference to adjust the other frequency
% Stage 2: Measure absolute threshold of hearing 10 frequencies

%
1. For each frequenct,users can change the volume in a
specific frequency
%
by left clicking mouse. Users can
move upper and
lower until selecting

%
a threshold which is just noticeable auditible.
Suggestion: the threshold had better to be choosed by
increasing the volume.

%
Because if user changes it by reducing,
he/she will expect the sound

%
2. After setting those 10 frequencies, right click mouse
and exit this program.

%
3. This function also returns those thresholds ,
[LogX,volumnY], back
%
4. Users can also copy or save this figure by Edit -->
Copy Figure or File --> Save As

%
% Author : Guan-Ming Su
% Date : 3/10/02
close all;
clear all;

IMAGE PROCESSING
SampleRate=40000;
Max_bit=16;
total_time=0.75;
t=0:total_time*SampleRate-1;
%%%% calibrate 4k for min tone

figure
min_4K_amp=1;
k4x=1:3; k4y=[0 1 0];
bar(k4x,k4y);
axis([1 3 0 16]);
title('Stage 1: Calibrating 4K Hz threshold ');

legend('Left Click mouse to seek the minimal volumn, Right click to
Stage 2');
ylabel('Bits');
xlabel('Current value: 1');
grid on;
CaliFlag=1;
F4k=4000;
while CaliFlag==1
[x1,y1, butn]=ginput(1);
if butn==3;
else ;
break;
min_4K_amp=y1;
% right click
end;
min_4K_amp=1/power(2,Max_bit-y1);
y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);
bar(k4x,y1*k4y);
axis([1 3 0 16]);

legend('Left Click mouse to seek the minimal volumn, Right click
to Stage 2');
ylabel('Bits');
xlabel(strcat('Current value: ',num2str(y1)));
grid on;
sound(y4k,SampleRate);
end
close all;
% measure the absolute threshold of hearing

IMAGE PROCESSING
figure
StopFlag=0;
startLogX=2;
EndLogX=4; numLogX=11;
min_Volume=-10;max_Volume=40;
volumnY=ones(1,numLogX);
LogX=logspace(startLogX,EndLogX,numLogX);
dividerLogX=logspace(startLogX,EndLogX,numLogX*2-1);
dividerLogX=dividerLogX(2:2:end); dividerLogX=[0 dividerLogX];
semilogx(LogX,volumnY,'-o');
axis([power(10,startLogX) power(10,EndLogX) min_Volume max_Volume]);
title('Stage 2: Measure Absolute Threshold of Hearing');
xlabel('Frequency(Hz)');
ylabel('Related Sound Pressure Level to 4K Hz, rSPL(dB)');
legend('Left Click mouse to adjust the volume. Right click to
Exit');
grid on
min_4K_power=min_4K_amp^2;
while StopFlag==0
if butn==3;
break;
% right click
else
newFindex=find(x1 > dividerLogX );
selectF=newFindex(end);
newF=LogX(selectF);
newAMP=sqrt(min_4K_power*power(10,y1/10));
volumnY(selectF)=y1;
semilogx(LogX,volumnY,'-o');
title('Stage 2: Measure Absolute Threshold of Hearing');
axis([power(10,startLogX) power(10,EndLogX)
min_Volume
max_Volume]);
Exit');
grid on
y1=newAMP*sin(2*pi*newF*t/SampleRate);

IMAGE PROCESSING
sound(y1,SampleRate)
end
end
Gambar 5.1 Hasil Running 1

Stage 2: Measure Absolute Threshold of Hearing
40
Left Click mouse to adjust the volume. Right click to Exit

35
Related Sound Pressure Level to 4K Hz, rSPL(dB)
30
25
20
15
10
-5
-10
2
10
10
Frequency(Hz)
10
Gambar 5.2 Hasil Running 2

b. Simultaneous Masking
Script PM_Simu_Masking.m
function [LinX,volumnY]=PM_Simu_Masking(ith_CB)
% function [LinX,volumnY]=PM_Simu_Masking(ith_CB)
% Measure simultaneous masking
% output

IMAGE PROCESSING
LinX : vector of x
volumnY : the corresponding simultaneous mask
% input
%
ith_CB : select the ith Critical Band
% Two stages in this program

% Stage 1: Calibrate the 4KHz threshold, adjust the volume to just
noticeable auditible.
%
We use this for reference to adjust the other frequency
% Stage 2: Measure Measure simultaneous masking for 6 frequencies

%
1. For each frequenct,users can change the volume in a
specific frequency
%
by left clicking mouse. Users can
move upper and
lower until selecting

%
a mask which the neighbor tone is maksed by the center
frequency tone
%
Suggestion: the threshold had better to be choosed by
increasing the volume.

%
Because if user changes it by reducing,
he/she will expect the sound

%
2. After setting those 6 frequencies, right click mouse
and exit this program.

%
3. This function also returns those thresholds ,
[LogX,volumnY], back
%
4. Users can also copy or save this figure by Edit -->
Copy Figure or File --> Save As

%
% Author : Guan-Ming Su
% Date : 3/10/02
close all;
% Idealized Critical Band Filter Bank.

CB_FB=[
400;
50
450
0
400
700
630
1270; 1370 1270
100;
510;
770;
1480;
150
570
840
1600
100
510
770
1480
200;
250
200
300;
350
300
630;
920; 1000
920 1080; 1175 1080
1720;
1850 1720 2000; 2150 2000 2320; 2500 2320 2700; 2900 2700
3150; 3400 3150
3700;
4000
3700
4400;

IMAGE PROCESSING
4800 4400 5300; 5800 5300 6400; 7000 6400 7700; 8500 7700
9500;10500 9500 12000; 13500 12000 15500];
numX=7;
% number fo frequencies to plot the masking
NumCB=size(CB_FB,1);
if (ith_CB > NumCB)|(ith_CB < 1)
% error detection
error('There is no such a critical band existing');

end
% initilized parameters.
SampleRate=40000;
Max_bit=16;
total_time=0.75;
t=0:total_time*SampleRate-1;
min_4K_amp=1;
%%%% calibrate 4k for min tone

figure
k4x=1:3; k4y=[0 1 0];
bar(k4x,k4y);
axis([1 3 0 16]);

legend('Left Click mouse to seek the minimal volumn, Right click to
Stage 2');
ylabel('Bits');
xlabel('Current value: 1');
grid on;
CaliFlag=1;
F4k=4000;
while CaliFlag==1
if butn==3;
else ;
break;
min_4K_amp=y1;
% right click
end;
min_4K_amp=1/power(2,Max_bit-y1);
y4k=min_4K_amp*sin(2*pi*F4k*t/SampleRate);
bar(k4x,y1*k4y);
axis([1 3 0 16]);

legend('Left Click mouse to seek the minimal volumn, Right click
to Stage 2');
ylabel('Bits');

IMAGE PROCESSING
xlabel(strcat('Current value: ',num2str(y1)));

grid on;
sound(y4k,SampleRate);
end
close all;
min_4K_power=min_4K_amp^2;
% measure the simultaneous masking

figure
StopFlag=0;
CenterX=CB_FB(ith_CB,1);startX=CB_FB(ith_CB,2);
EndX=CB_FB(ith_CB,3);
centerFreqIndex=ceil(numX/2);
passband=EndX-startX; plot_range=[CenterX-passband
CenterX+passband];
max_mid_Freq_AMP=0.45;
mid_Freq_DB=10*log10((max_mid_Freq_AMP^2)/min_4K_power);
min_Volume=-10;
max_Volume=10*ceil(mid_Freq_DB/10)+10;
volumnY=ones(1,numX); volumnY(centerFreqIndex)=mid_Freq_DB;
LinX=linspace(startX,EndX,numX);
dividerLinX=linspace(startX,EndX,numX*2-1);
dividerLinX=dividerLinX(2:2:end); dividerLinX=[0 dividerLinX];
plot(LinX,volumnY,'-o');
axis([plot_range(1) plot_range(2) min_Volume max_Volume]);
title('Stage 2: Measure simultaneous masking');
Exit');
grid on
% centeral tone
yc=max_mid_Freq_AMP*sin(2*pi*CenterX*t/SampleRate);
while StopFlag==0
if butn==3;
break;
% right click

IMAGE PROCESSING
else
newFindex=find(x1 > dividerLinX );
selectF=newFindex(end);
if selectF==centerFreqIndex
% centeral tone
sound(yc,SampleRate);
else
newF=LinX(selectF);
newAMP=sqrt(min_4K_power*power(10,y1/10));
volumnY(selectF)=y1;
plot(LinX,volumnY,'-o');
axis([plot_range(1) plot_range(2) min_Volume max_Volume]);
title('Stage 2: Measure simultaneous masking');
Exit');
grid on
y1=newAMP*sin(2*pi*newF*t/SampleRate);
% generate
neighboring tone
ymix=y1+yc;
% add two tones
sound(ymix,SampleRate);
end
end
end
Gambar 5.3 Idealized Critical Band Filter Bank

IMAGE PROCESSING
Gambar 5.4 Ketik kode critical band yang akan digunakan

Kode yang digunakan adalah 1, yaitu 50 0 100;
Gambar 5.5 Kalibrasi 4K Hz treshold pada 10 bits

IMAGE PROCESSING
Gambar 5.6 Hasil running 1

2. Audio Extraction and MP3
a. Audio Extraction
Gambar 5.7 original.wav

IMAGE PROCESSING
b. Downsampling
Gambar 5.8 downsampling.wav

c. Generate MP3
Gambar 5.9 wav2mp3.wav

d. Convert to MP3
Gambar 5.10 wav2mp3.mp3

IMAGE PROCESSING
e. Compare Spectrum
Gambar 5.12 Hasil Compare

IMAGE PROCESSING
VI.Analisa Data Hasil Simulasi

1. Psychoacoustic Models and Perceptual Coding
a. Absolute Threshold of Hearing
Pada percobaan kali ini, software Matlab-lah yang digunakan sebagai
software utama. Absolute Threshold of Hearing atau Ambang mutlak
pendengaran ( ATH ) adalah tingkat suara minimal nada murni bahwa
telinga manusia rata-rata dengan pendengaran normal bisa mendengar
tanpa hadir suara lainnya . Ambang mutlak berkaitan dengan suara yang
hanya dapat didengar oleh organisme . Ambang batas absolut bukanlah
titik diskrit oleh karena itu digolongkan sebagai titik di mana suara
memunculkan respon persentase tertentu dari waktu . Dari langkahlangkah yang dilakukan diperoleh nilai sebesar 9.4269 untuk kalibrasi 4
KHz threshold.
b. Simultaneous Masking
Untuk percobaannya ini, hampir sama dengan langkah sebelumnya.
Dibutuhkan kalibrasi 4 KHz. Simultaneous masking merupakan fenomena
domain frekuensi di mana sinyal rendah tingkat , misalnya , suara
smallband ( maskee ) dapat dibuat tak terdengar oleh simultan yang
terjadi sinyal yang lebih kuat ( masker ) , misalnya , nada murni, jika
masker dan maskee cukup untuk menutup satu sama lain dalam frekuensi.
Sebuah ambang masking dapat diukur di bawah ini yang sinyal apapun
tidak akan terdengar. Pada masking threshold tergantung pada tingkat
tekanan suara ( SPL ) dan frekuensi masker , dan pada karakteristik masker
dan maskee.
2. Audio Extraction and MP3
a. Audio Extraction
Untuk langkah kedua ini, software yang digunakan adalah Goldwave . File
audio yang berformat mp3 dengan size 7.34 MB dikonfersi ke format wav
dengna size yan meningkat drastic menjadi 34.8 MB. Hal ini dikarenakan

IMAGE PROCESSING
kualitas audio yang dihasilkan dari format lebih jernih dan lebih baik
dibanding mp3. WAV adalah format file audio standar Microsoft dan IBM
untuk personal computer (PC), biasanya menggunakan pengkodean PCM
(Pulse Code Modulation). Pada WAV, data tidak terkompres sehingga
seluruh sampel audio tetap ada.
b. Downsampling
Pada percobaan downsampling, diperoleh size 11 MB. Hal ini dikarenakan
downsampling adalah teknik untuk menurunkan sample rate audionya.
c. Generate MP3
Pada langkah ini, file yang berdurasi 10 detik dengan format WAV
berukuran 34.8 MB dikonversi ke format MP3 dan diperoleh size 744 KB.
Hal ini dikarenakan format MP3 membuat audio-audio yang tidak
dibutuhkan oleh telinga, sehingga size-nya berkurang.
d. Rekonstruksi
Pada langkah ini, hasil yang diperoleh tidak jauh beda dengan langkah
sebelumya.
e. Compare Spectrum
Pada langkah ini, digunakan Matlab untuk dapat membandingkan dua dile
audio. Dari hasil matlab diperoleh perbedaannya sangat sedikit. Hal ini
dikarenakan size dari file yang direkonstruksi
dan downsampling
perbedaannya hanya sedikit.

IMAGE PROCESSING
VII.Kesimpulan
1. Bunyi dengan frekuensi 20-20.000 Hz hanya dapat didengar ole telinga
manusia
2. Format audio file WAV atau waveform audio merupakan format audio yang
yang tidak terkompres sehingga ukurannya besar sekali. Sedangkan format
MP3 merupakan format audio yang umum digunakan karena size-nya cukup
rendah karena audio dikompresi atau audio yang tidak dibutuhkan oleh
telinga dibuang.
3. Downsampling merupakan teknik untuk menurunkan sample rate audio-nya.

IMAGE PROCESSING
DAFTAR PUSTAKA
http://core.ac.uk/download/pdf/11719325.pdf
http://lecturer.polindra.ac.id/~munengsih/wp-content/uploads/2012/04/3-Audiodan-Video1.pdf
http://repository.usu.ac.id/bitstream/123456789/19785/3/Chapter%20II.pdf

BAB VII - Perception Audio Dan Mp3

Загружено:

Сведения о документе

Исходное описание:

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

BAB VII - Perception Audio Dan Mp3

Загружено:

Авторское право:

Доступные форматы

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

suara yang satu berbeda dari suara lain. Amplitudo adalah

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

Alat dan Bahan yang Digunakan

IV. Prosedur Percobaan

Gambar 1 diatas menunjukkan anatomi telinga manusia. Banyak peneliti

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

Ambang mutlak hearing : threshold ini merupakan jumlah minimal energy

Kristis analisis band frekuensi: Cochlea dapat dimodelkan sebagai non

Simultaneous masking : Dalam setiap critical band, satu suara (the

Spread of masking : masking pada sebuah critical band dapat

Non-Simultaneous masking : Masking juga dapat dilakukan dalam domain

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

Pertama, kita mengkalibrasi terdengar volume minimal untuk 4KHz 2.

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

Dalam percobaan ini, kita juga perlu untuk mengkalibrasi terdengar

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

MP3 format. Kita akan mengamati bagaimanapsychoacoustic model bekerja

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

a. CD Audio ekstraksi: klik ToolsCD audio ekstraksi dari GoldWave's menu

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

b. Downsampling: untuk membandingkan dengan MP3, kita perlu

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

d. Mengkonversi MP3 ke wave: Reload wav2mp3 file dan menyimpannya

e. Bandingkan spektrum: menggunakan Compare_Spectrum.m 5 untuk plot

Membandingkan perbedaan antara audio dua chip dan mendiskusikan

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

V.Data Hasil Simulasi

volumnY : the corresponding absolute threshold of hearing

% Two stages in this program

We use this for reference to adjust the other frequency

% Stage 2: Measure absolute threshold of hearing 10 frequencies

1. For each frequenct,users can change the volume in a

by left clicking mouse. Users can

move upper and

lower until selecting

a threshold which is just noticeable auditible.

Suggestion: the threshold had better to be choosed by

increasing the volume.

Because if user changes it by reducing,

he/she will expect the sound

2. After setting those 10 frequencies, right click mouse

and exit this program.

3. This function also returns those thresholds ,

4. Users can also copy or save this figure by Edit -->

Copy Figure or File --> Save As

MAHARANI AYU LESTARI / D41112285

PRAKTIKUM PENGOLAHAN SINYAL MULTIMEDIA

%%%% calibrate 4k for min tone

title('Stage 1: Calibrating 4K Hz threshold ');