Google

Rabu, 12 Maret 2008

Format MP4

Format standar untuk MPEG-4 dinamakan MP4. Terkadang ini menyebabkan orang bingung dan menganggapnya sebagai format audio seperti MP3. Sebenarnya MP3 terkait dengan MPEG-1. MP3 merupakan bagian audio dari standar MPEG yang asli.

Format MPEG-4 sendiri sebenarnya merupakan jenis yang disebut "container format". Artinya format ini menggabungkan beberapa konten yang berbeda ke dalam satu file. Biasanya konten yang digabungkan ini adalah audio dengan video, namun terkadang konten seperti gambar diam juga dimasukkan ke dalam sebuah file MP4.

Konten video dan audio yang digabung dalam MP4 bisa terdiri dari beragam format. Untuk video format yang digunakan misalnya DivX, XviD, ffmpeg, H.264 (MPEG-4 AVC). Format audio contohnya AAC dan MP3, sedangkan untuk gambar diam kita bisa menggunakan JPEG dan PNG. Semua format konten tersebut termasuk standar MPEG-4.

Selain format yang dicakup dalam standar MPEG-4, file MP4 juga dapat memuat format nonstandar, seperti Ogg Vorbis dan AMR untuk audio, dan Ogg Theora untuk video.

Karena beragamnya keluarga MP4 ini, apabila Anda mendapatkan file berekstensi MP4 dari orang lain (misalnya dari Internet) file tersebut belum tentu dapat dilihat pada ponsel Anda, meskipun kamera ponsel sendiri menghasilkan file berformat MP4.

Meskipun MP4 merupakan ekstensi standar yang digunakan untuk file MPEG-4, terkadang kita menemukan ekstensi file lain. Contoh ekstensi nonstandar ini misalnya M4V dan M4A. Masing-masing merupakan format video dan format audio terpisah yang diperkenalkan Apple. Musik yang dijual Apple lewat layanan online iTunes menggunakan format M4P, yang merupakan MP4 dengan tambahan perlindungan DRM (Digital Rights Management)

STRUKTUR DECODER VIDEO MPEG-4

Decoder video MPEG-4 berperan sebagai input aliran data, deretan teratur bit-bit yang mewakili deretan gambar video yang didecodekan. Aliran data memuat informasi tersusun pada struktur deretan gambagr video, yang sepadan dengan MPEG-4 Video International Standard 14496-2. Aliran data mulai memaparkan bagian video, yang merupakan bagian gambar video yang dibentuk dari satu atau lebih struktur sintaksis yang mengidentifikasi objek video. Objek video mewakili sebuah objek yang dimuat dalam deretan gambar video dan dapat didekodekan menjadi satu atau lebih lapisan objek video. Lapisan objek video merupakan suatu struktur sintaksis yang mengidentifikasi aliran datanya sendiri dan mengizinkan untuk mendapat deretan yang dapat diskalakan. Perangkat objek video adalah struktur selanjutnya yang mengidentifikasi timbulnya objek video tunggal pada waktu singkat. Suatu Video Object Plane (VOP) dibuat dari beberapa blok makro, setiap blok makro dibanguan oleh 8 x 8 blok luminan, krominan dan sering juga kejernihan nilai-nilai piksel.

Aliran data input memuat informasi tentang tekstur, gerak, dan struktur setiap VOP Bentuk informasi mengidentifikasi objek yang dipersingkat dalam VOP. Informasi gerak mengurangi pemborosan waktu sementara deretan gambar video, menghubungkan blok makro dari VOP yang sekarang dengan blok makro yang dibangun sebelumnya. Tekstur informasi didecodekan dengan menggunakan suatu algoritma yang mengurangi pemborosan ruang.

Proses decode tekstur didapat dengan pertama kali menerapkan semua algoritma Very Length Decoding (VLD) yang mengekstraksi code word dari tabel Huffman. Kemudian inversi algoritma scan membangun kembali blok 8 x 8 dari array koefisien-koefisien yang dikuantisasi. Setelah inversi algoritma prediksi AC & DC dan inversi algoritma kuantisasi, suatu Inverse Discrete Cosine Transform (IDCT) diterapkan dalam blok 8 x 8. Dalam proses decode tekstur digambarkan bahwa komputasi operasi yang lebih intensif adalah VLD dan IDCT. Decoder yang digambarkan di bawah ini memperlihatkanberapa besar biayan operasi VLD dan IDCT untuk waktu decode.

Algoritma kompensasi gerak adalah proses decode lain yang mahal. Algoritma ini membangun kembali setiap blok makro yang bermula dari blok makro yang berhubungan terhadap VOP yang dibanguan kembali sebelumnya. Jika blok makro yang berhubungan ini tidak sama (dalam ambang tertentu) dengan blok makro yang sekarang, suatu prediksi informasi error diekstraksi dari aliran data dan didecode dengan menggunakan algoritma decode tekstur. Dalam hal ini blok makro yang sekarang didapat sebagai penjumlahan dari blok makro (yang berhubungan) dengan blok makro yang dibangun kembali mendecode prediksi yang salah.

Untuk mengidentifikasi modul yang paling diharapkan, telah ditunjukkan implementasi perangkat lunak decoder video MPEG-4. Deretan pengujian yang digunakan mempunyai lapisan tunggal dan empat persegi panjang VOP (VOP berisi objek empat persegi panjang, bentuk tanpa informasi). Pengujian decoder telah dilakukan pada Pentium II 266 MHz, untuk mengetahui kekurangan pada proses VLIW. Telah diperkirakan sebelumnya bahwa waktu komputasi pada Pentium II adalah proporsional terhadap waktu komputasi pada VLIW.

Dari berbagai sumber