[Guide] Audio Format - Part III : Lossy Compression

Lossy Compression

Algoritma lossy compression berdasar pada metode Psychoacoustics, atau persepsi indera pendengaran manusia. Penggunaan metode ini menghilangkan data pada audio yg tidak jelas terdengar oleh pendengaran manusia, demi menekan ukuran pada suatu audio file menjadi lebih rendah.


Terdapat beberapa teknik pada lossy compression, seperti Huffman coding, Quantization, Channel Coupling (Mid/side & Intensity Joint Stereo), MDCT, Subband dan Lowpass Filter. Tipe dan intensitas yg digunakan tergantung pada format, encoder dan preset bitrate yg dipilih. Penggunaan Quantization misalnya, dapat menghasilkan noise, Lowpass Filter dapat mereduksi signal (frequency tinggi) pada angka tertentu dan Intensity Stereo dapat menyebabkan soundscape atau ruang lingkup suara terkesan lebih sempit. Namun biasanya ini hanya dapat jelas terdengar pada format lossy dengan bitrate rendah.

Perbedaan antara lossy compressed dan uncompressed format akan terlihat jika dianalisa menggunakan spectrogram analyzer, namun belum tentu jelas terdengar oleh pendengaran kita. Masing2 format memiliki penilaian batas 'transparency' yg berbeda, contoh Mp3 & WMA pada bitrate 192 kbps, AAC pada 128 kbps dan Musepack & Vorbis pada bitrate sekitar 150 kbps, dengan artian penggunaan bitrate yg sama atau lebih tinggi dari angka tersebut dinilai menghasilkan kualitas audio yg tidak dapat dibedakan dengan source-nya (uncompressed). Tentu penilailan transparency bersifat subjektif, dengan ditentukan terutama oleh faktor listener behavior, environment dan equipment. Untuk dapat membandingkan dengan lebih seksama, dapat dilakukan dengan melakukan tes 'double-blind' seperti ABX Test.

Terdapat beberapa format lossy saat ini, beberapa diantaranya seperti mp3 VBR V0 dan AAC 256 kbps (iTunes Plus) dianggap sebagai format terbaik untuk menyimpan data musik, dengan penilaian seimbang antara kualitas, efisiensi space dan kompatibilitas di player.

Format dan Perbandingan 

MPEG Audio Layer III
MPEG Audio Layer III  atau lebih akrab disebut Mp3 adalah lossy format (atau bahkan sekaligus audio format) terpopuler saat ini. Kompatibilitas mp3 dikenal luas dan dianggap sebagai format standar untuk playback di komputer maupun digital audio player.

Mp3 memiliki beberapa pilihan encoder seperti LAME, Audioactive, Blade, Xing dan Gogo. diantara kelimanya, LAME paling sering digunakan karena waktu proses encoding yg lebih cepat, lebih di-support oleh software converter dan memiliki pemilihan bitrate yg luas, yaitu Constant Bit Rate, Variable Bit Rate dan Average Bit Bate (ABR). Mp3 dinilai dapat mencapai transparansi pada bitrate 192 kbps, namun dianjurkan untuk menggunakan bitrate tertinggi untuk kualitas yg terbaik.

Technical Info :
File Extension : .mp3
Bitrate : CBR: 8, 16, 24, 32, 40, 48, 64, 80, 96, 112, 128, 160, 192, 224, 256 & 320 kbps (); VBR : -V0 (target ~245 kbps), -V1 (~225), -V2 (~190), -V3 (~175 kbps), -V4 (~165), -V5 (~130), -V6 (~115), -V7 (~100), -V8 (~85) & -V9 (~65); ABR : antara 8 s/d 320 kbps.
Sample Rate : 32, 44,1 & 48 kHz (MPEG-1), 16, 20,5 & 24 kHz (MPEG-2), 8, 11 & 12 kHz (MPEG-2.5)
Multichannel : Yes, up to 5.1 (MPEG-2)
Tagging : ID3


Advanced Audio Coding
Advanced Audio Coding (AAC) adalah salah satu variasi audio coding dari MPEG-4 Audio (ekstensi file .m4a), dinilai sebagi suksesor Mp3, kualitas audio AAC dianggap yg lebih baik dari mp3 pada bitrate yg sama. Beberapa kelebihan AAC dari mp3 diantaranya adalah efisiensi yg lebih tinggi, men-support lebih banyak sample rate dan multichannel audio (s/d 48 channel).

Seperti halnya Mp3, AAC mempunyai berbagai macam encoder, baik yg bersifat free atau berbayar. Beberapa contoh free encoder adalah Nero AAC, yg men-support CBR, ABR & VBR dan iTunes AAC (iTunes Plus 256kbps), yg digunakan pada musik yg dijual di iTunes Store dan tersedia secara gratis via iTunes Player.

Technical Info :
File Extension: .m4a (M4A Container) & .mp4 (MP4 Container)
Bitrate : Nero : CBR & ABR : 32 s/d 512 kbps; VBR : Q0.05 (~15 kbps) s/d Q1.00 (~400kbps); iTunes : CBR / VBR : 64, 80, 96, 128, 160 , 192, 224, 256 (iTunes Plus), 288, 320 kbps.
Sample Rate: 8 s/d 192 kHz
Multichannel : Yes, up to 48 channel
Tagging : stored on container


Windows Media Audio
Windows Media Audio atau WMA adalah format audio standar untuk platform Windows. Untuk kategori lossy, terdapat 2 pilihan encoder, yaitu WMA (standard) dan WMA Pro.
WMA standar dapat men-support tipe bitrate CBR (s/d 320 kbps) & VBR (VBR Quality 10 s/d 98) untuk stereo, sementara WMA Pro dapat men-support lebih banyak channel (s/d 7.1) dengan variasi sample rate & bit depth yg lebih tinggi.

Technical Info :
File Extension:  .wma
Bitrate : 8 s/d 320 kbps (WMA Standard); 4 s/d 256 kbps (WMA Pro - Stereo); 128 s/d 768 kbps (WMA Pro - Multichannel)
Sample Rate : 8 s/d 48 kHz (WMA Standard); 8 s/d 96 kHz (WMA Pro)
Multichannel : No (WMA Standard); Yes, up to 7.1 (WMA Pro)
Tag : WMA Tag

Musepack
Musepack adalah format audio yg dikembangkan dari algoritma MPEG-1 Layer-2 (Mp2) dengan beberapa improvisasi seperti proses encoding & decoding yg lebih cepat dan multichannel support (s/d 7.1).
Musepack hanya mempunyai tipe bitrate VBR, namun memiliki beberapa preset didalamnya dan dinilai dapat mencapai transparency pada preset 'Standard'

Technical Info :
File Extension:  .mpc, .mp+ & .mpp
Bitrate : VBR: 32-48 kbps (Telephone), 58-86 kbps (Thumb), 112-152 kbps (Radio), 142-184 kbps (Standard), 168-212 kbps (Extreme), 232-268 kbps (Insane) & 232-278 kbps (Braindead).
Sample Rate : 32, 37.8, 44.1 & 48 kHz
Multichannel : Yes, up to 8 channel (7.1)
Tag : APE

Vorbis
Vorbis, adalah sebuah project dari Xiph.Org Foundation yg dirancang sebagai format yg ekstensif, dapat menampung audio dengan sample rate s/d 200 Khz dan fitur multichannel s/d 255 channel.
namun tentu, ada limitasi untuk penggunaan standar pada umumnya (stereo). Vorbis mendukung penggunaan VBR dengan preset -q -2 (~32 kbps) hingga -q 10 (~500 kbps). Vorbis sering disebut dengan Ogg Vorbis karena disimpan dalam file kontainer Ogg.

Technical Info :
File Extension:  .ogg & .oga
Bitrate : VBR & ABR; -q -2 (32 kbps) s/d -q 10 (500kbps)
Sample Rate : 8 s/d 48 kHz (Stereo); up to 200 kHz (multichannel)
Multichannel : Yes, up to 255 channel
Tag : Vorbis Comment


Komparasi 

  • Komparasi antar format dibuat menjadi 3 level, ~128 kbps (128 atau sekitar 128 kbps), ~256 (256 atau sekitar 256 kbps) dan max (maksimal bitrate antar format).
  • Analisa Spectrogram menggunakan Spectro. Spectro hanya mendukung format FLAC, APE, Mp3 dan WAV, sehingga format lainnya diharuskan kembali di-convert ke WAV sebelum dianalisa.
  • Audio track yg digunakan adalah Everything's Magic dari Angels & Airwaves.

~128 kbps

Tabel
Format Encoder Preset Size (MB) Percentage
MP3 LAME 3.98 CBR 128 kbps 3,56 9
MP3 LAME 3.98 VBR -V5 (~145 kbps) 4,03 10
MusePack Musepack Beta 1.16 'Radio' (~139 kbps) 3,85 9
AAC Nero AAC (LC) q.45 (~163 kbps) 4,58 11
AAC Nero AAC (LC) CBR 128 kbps 3,60 9
Vorbis libVorbis VBR -q4 (~128 kbps) 3,59 9
WMA WMA 9.2 CBR 128 kbps 3,59 9
WMA Pro WMA Pro 10 CBR 128 kbps 3,59 9
 

Galeri Spectrogram














 







~256kbps
Tabel 
Format Encoder Preset Size (MB) Percentage
MP3 LAME 3.98 CBR 256 kbps 7,06 18
MP3 LAME 3.98 VBR -V0 (~263 kbps) 7,28 18
MusePack Musepack Beta 1.16 'Insane' (~245 kbps) 6,79 17
AAC Nero AAC (LC) q.65 (~258 kbps) 7,21 18
AAC Nero AAC (LC) CBR 256 kbps 7,13 18
AAC iTunes iTunes Plus 256 kbps 7,88 20
Vorbis libVorbis VBR -q8 (~280 kbps) 7,77 19
WMA WMA 9.2 CBR 256 kbps 7,15 18
WMA Pro WMA Pro 10 CBR 256 kbps 7,15 18
 

Galeri Spectrogram



 










 
 


















Max
Tabel
Format Encoder Preset Size (MB) Percentage
MP3 LAME 3.98 CBR 320 kbps 8,83 22
MusePack Musepack Beta 1.16 'Braindead' (~278 kbps) 7,69 19
AAC Nero AAC (LC) q1.00 (~405 kbps) 11,26 28
AAC Nero AAC (LC) CBR 400 kbps 11,11 28
Vorbis libVorbis VBR -q10 (~504 kbps) 13,95 35
WMA WMA 9.2 CBR 320 kbps 8,92 22
 

Galeri Spectrogram







No comments

Powered by Blogger.